mlogft,causalft: fix broken interface to mpi machine layer
authorJonathan Lifflander <jliffl2@illinois.edu>
Fri, 30 Aug 2013 23:38:48 +0000 (18:38 -0500)
committerJonathan Lifflander <jliffl2@illinois.edu>
Fri, 30 Aug 2013 23:38:48 +0000 (18:38 -0500)
src/ck-core/ckcausalmlog.C
src/ck-core/ckmessagelogging.C

index db789231bccb6ffcfbfabcf974ee15f1f61900ca..d2253c5f25e7c11ba640c50e6b0859a2a8b075f9 100644 (file)
@@ -257,7 +257,7 @@ static int partnerFailureHandlerIdx;
 static double lastPingTime = -1;
 
 extern "C" void mpi_restart_crashed(int pe, int rank);
-extern "C" int  find_spare_mpirank(int pe);
+extern "C" int  find_spare_mpirank(int pe, int partition);
 
 void heartBeatPartner();
 void heartBeatHandler(void *msg);
@@ -464,7 +464,7 @@ void partnerFailureHandler(char *msg)
    int diepe = *(int *)(msg+CmiMsgHeaderSizeBytes);
 
    // send message to crash pe to let it restart
-   int newrank = find_spare_mpirank(diepe);
+   int newrank = find_spare_mpirank(diepe, CmiMyPartition());
    int buddy = getReverseCheckPointPE();
    if (buddy == diepe)  {
      mpi_restart_crashed(diepe, newrank);
index 60e46a0b5108fb06fe605a54592461a4017292bd..9aa971c0d2c8bcb9b3f46b433522d01d6b33f3bc 100644 (file)
@@ -159,7 +159,7 @@ static int partnerFailureHandlerIdx;
 static double lastPingTime = -1;
 
 extern "C" void mpi_restart_crashed(int pe, int rank);
-extern "C" int  find_spare_mpirank(int pe);
+extern "C" int  find_spare_mpirank(int pe, int partition);
 
 void heartBeatPartner();
 void heartBeatHandler(void *msg);
@@ -313,7 +313,7 @@ void partnerFailureHandler(char *msg)
    int diepe = *(int *)(msg+CmiMsgHeaderSizeBytes);
 
    // send message to crash pe to let it restart
-   int newrank = find_spare_mpirank(diepe);
+   int newrank = find_spare_mpirank(diepe, CmiMyPartition());
    int buddy = getReverseCheckPointPE();
    if (buddy == diepe)  {
      mpi_restart_crashed(diepe, newrank);