minor
authorXiang Ni <xiangni2@illinois.edu>
Wed, 24 Oct 2012 17:14:09 +0000 (12:14 -0500)
committerXiang Ni <xiangni2@illinois.edu>
Wed, 24 Oct 2012 17:14:09 +0000 (12:14 -0500)
src/ck-core/ckcheckpoint.C
src/ck-core/cklocation.C
src/ck-core/cklocation.h
src/ck-core/ckmemcheckpoint.C

index 332c71133834e15720388f4d070f404ffd805690..e3b513b96cdfb1ce847f63bb582b36c098e86f54 100644 (file)
@@ -440,8 +440,6 @@ void CkPupGroupData(PUP::er &p)
           gobj->pup(p);
           DEBCHK("Group PUP'ed: gid = %d, name = %s\n",
                        gobj->ckGetGroupID().idx, tmpInfo[i].name);
-      //   CkPrintf("Group PUP'ed: gid = %d, name = %s\n",
-                       //gobj->ckGetGroupID().idx, tmpInfo[i].name);
        }
        delete [] tmpInfo;
 }
index 9a3de30e64d557017e403a91f6f31dc40ed23083..91d0602fbd008ab3a7f1f8d4cf8962b682cb3ade 100644 (file)
@@ -1875,7 +1875,8 @@ void CkLocMgr::flushAllRecs(void)
       //this condition
       
       if(_BgOutOfCoreFlag!=1){
-        //hash.remove(*(CkArrayIndex *)&idx);
+                 //TODO doesn't delete if there is actual pe
+                 //hash.remove(*(CkArrayIndex *)&idx);
         //delete rec;
         //it->seek(-1);//retry this hash slot
         flag_remote++;
@@ -1887,8 +1888,6 @@ void CkLocMgr::flushAllRecs(void)
         flag_local++;
     }
   }
-  if(CkMyPe()==33)
-    CkPrintf("[%d] local:%d remote:%d\n",CkMyPe(),flag_local,flag_remote);
   delete it;
   CmiImmediateUnlock(hashImmLock);
 }
@@ -1994,15 +1993,13 @@ void CkLocMgr::pup(PUP::er &p){
                map->registerArray(emptyIndex,thisgroup);
                // _lbdb is the fixed global groupID
                initLB(lbdbID);
-  //  CkPrintf("unpacking loca manager\n");
-//#if (defined(_FAULT_MLOG_) || defined(_FAULT_CAUSAL_)) ||CMK_MEM_CHECKPOINT    
-#if 1
+#if (defined(_FAULT_MLOG_) || defined(_FAULT_CAUSAL_)) ||CMK_MEM_CHECKPOINT    
         int count;
         p | count;
         DEBUG(CmiPrintf("[%d] Unpacking Locmgr %d has %d home elements\n",CmiMyPe(),thisgroup.idx,count));
-    //    CmiPrintf("[%d] Unpacking Locmgr %d has %d home elements\n",CmiMyPe(),thisgroup.idx,count);
-        //homeElementCount = count;
-
+#if (defined(_FAULT_MLOG_) || defined(_FAULT_CAUSAL_))    
+        homeElementCount = count;
+#endif
         for(int i=0;i<count;i++){
             CkArrayIndex idx;
             int pe;
@@ -2026,18 +2023,13 @@ void CkLocMgr::pup(PUP::er &p){
  * indexes of local elements dont need to be packed
  * since they will be recreated later anyway
  */
- //   CkPrintf("packing loca manager\n");
-//#if (defined(_FAULT_MLOG_) || defined(_FAULT_CAUSAL_))  || CMK_MEM_CHECKPOINT   
-#if 1
+#if (defined(_FAULT_MLOG_) || defined(_FAULT_CAUSAL_))  || CMK_MEM_CHECKPOINT   
         int count=0,count1=0;
         void *objp;
         void *keyp;
         CkVec<int> pe_list;
-        //std::vector<CkArrayIndex> idx_list;
         CkVec<CkArrayIndex> idx_list;
         CkHashtableIterator *it = hash.iterator();
-     // if(CkMyPe()==0)
-       // CmiPrintf("before first %lf\n",CmiWallTimer());
       while (NULL!=(objp=it->next(&keyp))) {
           CkLocRec *rec=*(CkLocRec **)objp;
           CkArrayIndex &idx=*(CkArrayIndex *)keyp;
@@ -2052,16 +2044,11 @@ void CkLocMgr::pup(PUP::er &p){
                 }
             }
         }
-      //if(CkMyPe()==0)
-       // CmiPrintf("after first %lf %d\n",CmiWallTimer(),count);
         p | count;
-    //    CmiPrintf("[%d] Packing Locmgr %d has %d home elements\n",CmiMyPe(),thisgroup.idx,count);
 
                // releasing iterator memory
                delete it;
 
-    //  if(CkMyPe()==0)
-   //     CmiPrintf("before second %lf\n",CmiWallTimer());
       for(int i=0;i<pe_list.length();i++){
         CkArrayIndex max = idx_list[i];
         max.pup(p);
@@ -2082,8 +2069,6 @@ void CkLocMgr::pup(PUP::er &p){
                 }
             }
         }
-      if(CkMyPe()==0)
-        CmiPrintf("after second %lf\n",CmiWallTimer());
       //  CmiAssert(count == count1);
 
                // releasing iterator memory
index 8995c39b844cb256af2d1a00fe80a12c02e32fd0..fbb3c168ff7308c6beb783b9549733a607222cab 100644 (file)
@@ -640,7 +640,6 @@ public:
        void migratableList(CkLocRec_local *rec, CkVec<CkMigratable *> &list);
 
        void flushAllRecs(void);
-       void checkpointRemoteIdx(PUP::er &p);
        void pup(PUP::er &p);
        
        //Look up array element in hash table.  Index out-of-bounds if not found.
index 4b26f15ba401129e63a3ab829cb7553a06671b87..504c2eec70ff88065b9ff464edfff0f1f7e1041c 100644 (file)
@@ -520,7 +520,6 @@ void CkMemCheckPT::pupAllElements(PUP::er &p){
        }
        p | numElements;
        if(!p.isUnpacking()){
-               //CKLOCMGR_LOOP(mgr->checkpointRemoteIdx(p););
                CKLOCMGR_LOOP(MemElementPacker packer(mgr,p);mgr->iterate(packer););
        }
 #endif
@@ -603,8 +602,6 @@ static inline void _handleProcData(PUP::er &p)
 
 void CkMemCheckPT::sendProcData()
 {
-  if(CkMyPe()==0)
-     CkPrintf("begin send proc checkpoint data at %lf\n",CmiWallTimer()); 
   // find out size of buffer
   int size;
   {
@@ -622,15 +619,11 @@ void CkMemCheckPT::sendProcData()
   msg->pe = CkMyPe();
   msg->len = size;
   msg->reportPe = cpStarter;  //in case other processor isn't in checkpoint mode
-  if(CkMyPe()==0)
-     CkPrintf("end packing proc checkpoint data at %lf\n",CmiWallTimer()); 
   thisProxy[ChkptOnPe(CkMyPe())].recvProcData(msg);
 }
 
 void CkMemCheckPT::recvProcData(CkProcCheckPTMessage *msg)
 {
-  if(CkMyPe()==1)
-     CkPrintf("recv proc checkpoint data from 0 at %lf\n",CmiWallTimer()); 
   if (CpvAccess(procChkptBuf)) delete CpvAccess(procChkptBuf);
   CpvAccess(procChkptBuf) = msg;
   DEBUGF("[%d] CkMemCheckPT::recvProcData report to %d\n", CkMyPe(), msg->reportPe);
@@ -707,6 +700,7 @@ void CkMemCheckPT::report()
   CmiAssert(CpvAccess(procChkptBuf));
   //CkPrintf("[%d] Checkpoint object size: %d len: %d Processor data: %d \n", CkMyPe(), objsize, len, CpvAccess(procChkptBuf)->len);
 #else
+  if(CkMyPe()==0)
   CkPrintf("[%d] Checkpoint Processor data: %d \n", CkMyPe(), CpvAccess(procChkptBuf)->len);
 #endif
 }
@@ -965,13 +959,11 @@ void CkMemCheckPT::gotData()
 void CkMemCheckPT::updateLocations(int n, CkGroupID *g, CkArrayIndex *idx,int nowOnPe)
 {
 
-         CkPrintf("[%d] receive from %d at %lf\n",CkMyPe(),nowOnPe,CmiWallTimer());
   for (int i=0; i<n; i++) {
     CkLocMgr *mgr = CProxy_CkLocMgr(g[i]).ckLocalBranch();
     mgr->updateLocation(idx[i], nowOnPe);
   }
        thisProxy[nowOnPe].gotReply();
-               CkPrintf("[%d] reply to %d at %lf\n",CkMyPe(),nowOnPe,CmiWallTimer());
 }
 
 // restore array elements
@@ -1034,7 +1026,6 @@ void CkMemCheckPT::recoverArrayElements()
   for (int i=0; i<CkNumPes(); i++) {
     if (gmap[i].size() && i!=CkMyPe()&& i==thisFailedPe) {
       thisProxy[i].updateLocations(gmap[i].size(), gmap[i].getVec(), imap[i].getVec(), CkMyPe());
-       CkPrintf("[%d] send to %d at %lf\n",CkMyPe(),i,CmiWallTimer());
        flag++; 
          }
   }
@@ -1058,7 +1049,6 @@ if(flag == 0)
 }
 
 void CkMemCheckPT::gotReply(){
-    CkPrintf("[%d] got reply at %lf\n",CkMyPe(),CmiWallTimer());
     contribute(CkCallback(CkReductionTarget(CkMemCheckPT, finishUp), thisProxy));
 }
 
@@ -1078,12 +1068,6 @@ void CkMemCheckPT::recoverAll(CkArrayCheckPTMessage * msg,CkVec<CkGroupID> * gma
 #if STREAMING_INFORMHOME
                        mgr->resume(idx,p,CmiFalse);
 #else
-                       if(homePe == thisFailedPe && homePe!=CkMyPe()){
-                               mgr->resume(idx,p,CmiFalse);
-                               //mgr->resume(idx,p,CmiTrue);
-       // CkPrintf("[%d] send to crashed pe %d\n",CkMyPe(),thisFailedPe);
-      }
-      else
                                mgr->resume(idx,p,CmiFalse);
 #endif
                          /*CkLocRec_local *rec = loc.getLocalRecord();
@@ -1545,7 +1529,7 @@ void pingCheckHandler()
 {
 #if CMK_MEM_CHECKPOINT
   double now = CmiWallTimer();
-  if (lastPingTime > 0 && now - lastPingTime > 20 && !CkInLdb()) {
+  if (lastPingTime > 0 && now - lastPingTime > 4 && !CkInLdb()) {
     int i, pe, buddy;
     // tell everyone the buddy dies
     CkMemCheckPT *obj = CProxy_CkMemCheckPT(ckCheckPTGroupID).ckLocalBranch();