Ignore NOHOSTNAME in CUDA code 86/4686/1
authorJim Phillips <jim@ks.uiuc.edu>
Fri, 12 Oct 2018 17:07:32 +0000 (12:07 -0500)
committerJim Phillips <jim@ks.uiuc.edu>
Fri, 12 Oct 2018 17:07:32 +0000 (12:07 -0500)
Since CUDA binaries cannot be statically linked there is
no problem calling gethostname() for CUDA error messages.
Including the host name in the error message is critical
for finding bad GPUs on large parallel machines.

Change-Id: Ic97bed4e3ea44156d21b0ff558c37655464f95f6

src/ComputeNonbondedCUDA.C
src/CudaUtils.C
src/DeviceCUDA.C

index 99b5751..1238fed 100644 (file)
@@ -42,11 +42,7 @@ void cuda_errcheck(const char *msg) {
   cudaError_t err;
   if ((err = cudaGetLastError()) != cudaSuccess) {
     char host[128];
-#ifdef NOHOSTNAME
-    sprintf(host,"physical node %d", CmiPhysicalNodeID(CkMyPe()));
-#else
     gethostname(host, 128);  host[127] = 0;
-#endif
     char devstr[128] = "";
     int devnum;
     if ( cudaGetDevice(&devnum) == cudaSuccess ) {
index ea63c41..601c6dc 100644 (file)
@@ -8,11 +8,7 @@
 
 void cudaDie(const char *msg, cudaError_t err) {
   char host[128];
-#ifdef NOHOSTNAME
-  sprintf(host,"physical node %d", CmiPhysicalNodeID(CkMyPe()));
-#else
   gethostname(host, 128);  host[127] = 0;
-#endif
   char devstr[128] = "";
   int devnum;
   if ( cudaGetDevice(&devnum) == cudaSuccess ) {
@@ -50,13 +46,9 @@ void cuda_affinity_initialize() {
     if ( err == cudaSuccess ) err = cudaMalloc(&dummy, 4);
   }
   if ( err != cudaSuccess ) {
-#ifdef NOHOSTNAME
-    fprintf(stderr,"CUDA initialization error: %s\n", cudaGetErrorString(err));
-#else
     char host[128];
     gethostname(host, 128);  host[127] = 0;
     fprintf(stderr,"CUDA initialization error on %s: %s\n", host, cudaGetErrorString(err));
-#endif
   }
 }
 
index da91152..c24ff2a 100644 (file)
@@ -97,11 +97,7 @@ void DeviceCUDA::initialize() {
   if (CkMyPe() == 0) CkPrintf("Info: Built with CUDA version %d\n", CUDA_VERSION);
 
   char host[128];
-#ifdef NOHOSTNAME
-  sprintf(host,"physical node %d", CmiPhysicalNodeID(CkMyPe()));
-#else
   gethostname(host, 128);  host[127] = 0;
-#endif
 
   int myPhysicalNodeID = CmiPhysicalNodeID(CkMyPe());
   int myRankInPhysicalNode;