smarter version, able to iterate over LoadLeveler errors (255) but signalling
authorFilippo Gioachin <gioachin@illinois.edu>
Tue, 12 Apr 2005 02:14:15 +0000 (02:14 +0000)
committerFilippo Gioachin <gioachin@illinois.edu>
Tue, 12 Apr 2005 02:14:15 +0000 (02:14 +0000)
user errors (not 255)

src/arch/lapi/charmrun

index f02254b8ca0ef28dc67a0da07bf25e75ae65eebe..c4854e9efc554ec03d0228e03a3a07a00558d781 100755 (executable)
@@ -4,9 +4,6 @@
 #  Translates +pN-style charmrun options into 
 # POE (Parallel Operating Environment) options.
 
-# COMMENT BY FILIPPO:
-# THIS FILE IS USELESS AT THE MOMENT, IT NEEDS TO USE LOAD LEVELER!
-
 args=""
 pes=1
 
@@ -239,15 +236,37 @@ grep -E -v "#@" $llfile | grep "export" >> $filename
 
 if [ $interactive -eq 0 ]
     then
-    # submit the job as poe
+    # submit the job as poe, iterating 
     echo "Running interactively> poe $PWD/$args -llfile $filename"
     poe $PWD/$args -llfile $filename
+    status=$?
+    if [ $status -eq 255 ];
+      then
+      llstatus=1
+    else
+      llstatus=0
+    fi
+    until (exit $llstatus);
+      do
+      echo "Retrying in two minutes..."
+      sleep 120
+      poe $PWD/$args -llfile $filename;
+      status=$?
+      if [ $status -eq 255 ];
+        then
+        llstatus=1
+      else
+        llstatus=0
+      fi
+    done
+    if [ $status -ne 0 ];then exit $status;fi
+    
 else
     # append the command at the end of the file and llsubmit it
-    echo "Running batch> poe $args"
+    echo "Submitting batch> poe $PWD/$args"
     cat >> $filename <<EOF
 
-poe $args
+poe $PWD/$args
 EOF
     llsubmit $filename
 fi