Drastic simplification of TCharm's startup sequence:
[charm.git] / src / libs / ck-libs / tcharm / tcharm.C
1 /*
2 Threaded Charm++ "Framework Framework"
3
4 Orion Sky Lawlor, olawlor@acm.org, 11/19/2001
5  */
6 #include "tcharm_impl.h"
7 #include "tcharm.h"
8 #include <ctype.h>
9
10 #if 0
11     /*Many debugging statements:*/
12 #    define DBG(x) ckout<<"["<<thisIndex<<"] TCHARM> "<<x<<endl;
13 #    define DBGX(x) ckout<<"PE("<<CkMyPe()<<") TCHARM> "<<x<<endl;
14 #else
15     /*No debugging statements*/
16 #    define DBG(x) /*empty*/
17 #    define DBGX(x) /*empty*/
18 #endif
19
20 CtvDeclare(TCharm *,_curTCharm);
21 CkpvDeclare(inState,_stateTCharm);
22
23 static int lastNumChunks=0;
24
25 class TCharmTraceLibList {
26         enum {maxLibs=20,maxLibNameLen=15};
27         //List of libraries we want to trace:
28         int curLibs;
29         char libNames[maxLibs][maxLibNameLen];
30         int checkIfTracing(const char *lib) const
31         {
32                 for (int i=0;i<curLibs;i++) 
33                         if (0==strcmp(lib,libNames[i]))
34                                 return 1;
35                 return 0;
36         }
37 public:
38         TCharmTraceLibList() {curLibs=0;}
39         void addTracing(const char *lib) 
40         { //We want to trace this library-- add its name to the list.
41                 CkPrintf("TCHARM> Will trace calls to library %s\n",lib);
42                 int i;
43                 for (i=0;0!=*lib;i++,lib++)
44                         libNames[curLibs][i]=tolower(*lib);
45                 libNames[curLibs][i]=0;
46                 // if already tracing, skip
47                 if (checkIfTracing(libNames[curLibs])) return;
48                 curLibs++;
49         }
50         inline int isTracing(const char *lib) const {
51                 if (curLibs==0) return 0; //Common case
52                 else return checkIfTracing(lib);
53         }
54 };
55 static TCharmTraceLibList tcharm_tracelibs;
56 static int tcharm_nomig=0, tcharm_nothreads=0;
57 static int tcharm_stacksize=1*1024*1024; /*Default stack size is 1MB*/
58 static int tcharm_initted=0;
59
60 void TCharm::nodeInit(void)
61 {
62   CtvInitialize(TCharm *,_curTCharm);
63   CtvAccess(_curTCharm)=NULL;
64   CkpvInitialize(inState,_stateTCharm);
65   TCharm::setState(inInit);
66
67   tcharm_initted=1;
68 }
69
70 void TCharm::procInit(void)
71 {
72   // called on every pe to eat these arguments
73   char **argv=CkGetArgv();
74   tcharm_nomig=CmiGetArgFlagDesc(argv,"+tcharm_nomig","Disable migration support (debugging)");
75   tcharm_nothreads=CmiGetArgFlagDesc(argv,"+tcharm_nothread","Disable thread support (debugging)");
76   tcharm_nothreads|=CmiGetArgFlagDesc(argv,"+tcharm_nothreads",NULL);
77   char *traceLibName=NULL;
78   while (CmiGetArgStringDesc(argv,"+tcharm_trace",&traceLibName,"Print each call to this library"))
79       tcharm_tracelibs.addTracing(traceLibName);
80   CmiGetArgIntDesc(argv,"+tcharm_stacksize",&tcharm_stacksize,"Set the thread stack size (default 1MB)");
81   if (CkMyPe()!=0) { //Processor 0 eats "+vp<N>" and "-vp<N>" later:
82         int ignored;
83         while (CmiGetArgIntDesc(argv,"-vp",&ignored,NULL)) {}
84         while (CmiGetArgIntDesc(argv,"+vp",&ignored,NULL)) {}
85   }
86   if (CkMyPe()==0) { // Echo various debugging options:
87     if (tcharm_nomig) CmiPrintf("TCHARM> Disabling migration support, for debugging\n");
88     if (tcharm_nothreads) CmiPrintf("TCHARM> Disabling thread support, for debugging\n");
89   }
90 }
91
92 void TCHARM_Api_trace(const char *routineName,const char *libraryName)
93 {
94         if (!tcharm_tracelibs.isTracing(libraryName)) return;
95         TCharm *tc=CtvAccess(_curTCharm);
96         char where[100];
97         if (tc==NULL) sprintf(where,"[serial context on %d]",CkMyPe());
98         else sprintf(where,"[%p> vp %d, p %d]",(void *)tc,tc->getElement(),CkMyPe());
99         CmiPrintf("%s Called routine %s\n",where,routineName);
100         CmiPrintStackTrace(1);
101         CmiPrintf("\n");
102 }
103
104 static void startTCharmThread(TCharmInitMsg *msg)
105 {
106         TCharm::setState(inDriver);
107         CtvAccess(_curTCharm)->activateHeap();
108         typedef void (*threadFn_t)(void *);
109         ((threadFn_t)msg->threadFn)(msg->data);
110         CmiIsomallocBlockListActivate(NULL); //Turn off migratable memory
111         CtvAccess(_curTCharm)->done();
112 }
113
114 TCharm::TCharm(TCharmInitMsg *initMsg_)
115 {
116   initMsg=initMsg_;
117   timeOffset=0.0;
118   if (tcharm_nothreads)
119   { //Don't even make a new thread-- just use main thread
120     tid=CthSelf();
121   }
122   else /*Create a thread normally*/
123   {
124     if (tcharm_nomig) { /*Nonmigratable version, for debugging*/
125       tid=CthCreate((CthVoidFn)startTCharmThread,initMsg,initMsg->opts.stackSize);
126     } else {
127       tid=CthCreateMigratable((CthVoidFn)startTCharmThread,initMsg,initMsg->opts.stackSize);
128     }
129 #if CMK_BLUEGENE_CHARM
130     BgAttach(tid);
131 #endif
132   }
133   CtvAccessOther(tid,_curTCharm)=this;
134   TCharm::setState(inInit);
135   isStopped=true;
136   resumeAfterMigration=false;
137   exitWhenDone=initMsg->opts.exitWhenDone;
138   threadInfo.tProxy=CProxy_TCharm(thisArrayID);
139   threadInfo.thisElement=thisIndex;
140   threadInfo.numElements=initMsg->numElements;
141   heapBlocks=CmiIsomallocBlockListNew();
142   nUd=0;
143   usesAtSync=CmiTrue;
144   run();
145 }
146
147 TCharm::TCharm(CkMigrateMessage *msg)
148         :CBase_TCharm(msg)
149 {
150   initMsg=NULL;
151   tid=NULL;
152   threadInfo.tProxy=CProxy_TCharm(thisArrayID);
153 }
154
155 void TCharm::pup(PUP::er &p) {
156 //Pup superclass
157   ArrayElement1D::pup(p);
158
159   p(isStopped); p(resumeAfterMigration); p(exitWhenDone);
160   p(threadInfo.thisElement);
161   p(threadInfo.numElements);
162   
163   if (sema.size()>0) 
164         CkAbort("TCharm::pup> Cannot migrate with unconsumed semaphores!\n");
165
166 #ifndef CMK_OPTIMIZE
167   DBG("Packing thread");
168   if (!isStopped)
169     CkAbort("Cannot pup a running thread.  You must suspend before migrating.\n");
170   if (tcharm_nomig) CkAbort("Cannot migrate with the +tcharm_nomig option!\n");
171 #endif
172
173 //Pup thread (EVIL & UGLY):
174   //This seekBlock allows us to reorder the packing/unpacking--
175   // This is needed because the userData depends on the thread's stack
176   // and heap data both at pack and unpack time.
177   PUP::seekBlock s(p,2);
178   if (p.isUnpacking())
179   {//In this case, unpack the thread & heap before the user data
180     s.seek(1);
181     tid = CthPup((pup_er) &p, tid);
182     CtvAccessOther(tid,_curTCharm)=this;
183     CmiIsomallocBlockListPup((pup_er) &p,&heapBlocks);
184     //Restart our clock: set it up so packTime==CkWallTimer+timeOffset
185     double packTime;
186     p(packTime);
187     timeOffset=packTime-CkWallTimer();
188   }
189
190   //Pack all user data
191   TCharm::setState(inPup);
192   s.seek(0);
193   p(nUd);
194   for(int i=0;i<nUd;i++)
195     ud[i].pup(p);
196   p|sud;
197   TCharm::setState(inFramework);
198
199   if (!p.isUnpacking())
200   {//In this case, pack the thread & heap after the user data
201     s.seek(1);
202     tid = CthPup((pup_er) &p, tid);
203     CmiIsomallocBlockListPup((pup_er) &p,&heapBlocks);
204     //Stop our clock:
205     double packTime=CkWallTimer()+timeOffset;
206     p(packTime);
207   }
208   s.endBlock(); //End of seeking block
209 }
210
211 //Pup one group of user data
212 void TCharm::UserData::pup(PUP::er &p)
213 {
214   pup_er pext=(pup_er)(&p);
215   p(isC);
216   //Save address of userdata-- assumes user data is on the stack
217   p((void*)&data,sizeof(data));
218   if (isC) { //C version
219     //FIXME: function pointers may not be valid across processors
220     p((void*)&cfn, sizeof(TCpupUserDataC));
221     if (cfn) cfn(pext,data);
222   }
223   else { //Fortran version
224     //FIXME: function pointers may not be valid across processors
225     p((void*)&ffn, sizeof(TCpupUserDataF));
226     if (ffn) ffn(pext,data);
227   }
228 }
229
230 TCharm::~TCharm()
231 {
232   CmiIsomallocBlockListDelete(heapBlocks);
233   CthFree(tid);
234   delete initMsg;
235 }
236
237 void TCharm::migrateTo(int destPE) {
238         if (destPE==CkMyPe()) return;
239         // Make sure migrateMe gets called *after* we suspend:
240         thisProxy[thisIndex].migrateDelayed(destPE);
241         resumeAfterMigration=true;
242         suspend();
243 }
244 void TCharm::migrateDelayed(int destPE) {
245         migrateMe(destPE);
246 }
247 void TCharm::ckJustMigrated(void) {
248         ArrayElement::ckJustMigrated();
249         if (resumeAfterMigration) {
250                 resumeAfterMigration=false;
251                 resume(); //Start the thread running
252         }
253 }
254
255 // clear the data before restarting from disk
256 void TCharm::clear()
257 {
258   CmiIsomallocBlockListDelete(heapBlocks);
259   CthFree(tid);
260   delete initMsg;
261 }
262
263 //Register user data to be packed with the thread
264 int TCharm::add(const TCharm::UserData &d)
265 {
266   if (nUd>=maxUserData)
267     CkAbort("TCharm: Registered too many user data fields!\n");
268   int nu=nUd++;
269   ud[nu]=d;
270   return nu;
271 }
272 void *TCharm::lookupUserData(int i) {
273         if (i<0 || i>=nUd)
274                 CkAbort("Bad user data index passed to TCharmGetUserdata!\n");
275         return ud[i].getData();
276 }
277
278 //Start the thread running
279 void TCharm::run(void)
280 {
281   DBG("TCharm::run()");
282   start();
283 }
284
285 //Block the thread until start()ed again.
286 void TCharm::stop(void)
287 {
288   if (isStopped) return; //Nothing to do
289 #ifndef CMK_OPTIMIZE
290   DBG("suspending thread");
291   if (tid != CthSelf())
292     CkAbort("Called TCharm::stop from outside TCharm thread!\n");
293   if (tcharm_nothreads)
294     CkAbort("Cannot make blocking calls using +tcharm_nothreads!\n");
295 #endif
296   isStopped=true;
297   stopTiming();
298   TCharm::setState(inFramework);
299   CthSuspend();
300   TCharm::setState(inDriver);
301   /*We have to do the get() because "this" may have changed
302     during a migration-suspend.*/
303   TCharm::get()->startTiming();
304 }
305
306 //Resume the waiting thread
307 void TCharm::start(void)
308 {
309   if (!isStopped) return; //Already started
310   isStopped=false;
311   TCharm::setState(inDriver);
312   DBG("awakening thread");
313   if (tcharm_nothreads) /*Call user routine directly*/
314           startTCharmThread(initMsg);
315   else /*Jump to thread normally*/
316           CthAwaken(tid);
317 }
318
319 //Go to sync, block, possibly migrate, and then resume
320 void TCharm::migrate(void)
321 {
322 #if CMK_LBDB_ON
323   DBG("going to sync");
324   AtSync();
325   stop();
326 #else
327   DBG("skipping sync, because there is no load balancer");
328 #endif
329 }
330
331 //Resume from sync: start the thread again
332 void TCharm::ResumeFromSync(void)
333 {
334   start();
335 }
336
337 #ifndef CMK_OPTIMIZE
338 //Make sure we're actually in driver
339 void TCharm::check(void)
340 {
341         if (getState()!=inDriver)
342                 ::CkAbort("TCharm> Can only use that routine from within driver!\n");
343 }
344 #endif
345
346
347 /****** TcharmClient ******/
348 void TCharmClient1D::ckJustMigrated(void) {
349   ArrayElement1D::ckJustMigrated();
350   findThread();
351   tcharmClientInit();
352 }
353
354 void TCharmClient1D::pup(PUP::er &p) {
355   ArrayElement1D::pup(p);
356   p|threadProxy;
357 }
358
359 CkArrayID TCHARM_Get_threads(void) {
360         TCHARMAPI("TCHARM_Get_threads");
361         if (TCharm::getState()!=inDriver)
362                 CkAbort("Can only call TCHARM_Get_threads from driver!\n");
363         return TCharm::get()->getProxy();
364 }
365
366 /****** Readonlys *****/
367 static int tcharm_readonlygroup_created=0;
368 static TCharmReadonlys initial_readonlies;
369 CProxy_TCharmReadonlyGroup tcharm_readonlygroup;
370
371 class TCharmReadonlyGroup : public CBase_TCharmReadonlyGroup {
372 public:
373         TCharmReadonlys all;
374         
375         TCharmReadonlyGroup(TCharmReadonlys &r,int len,const char *data)
376         {
377                 add(r,len,data);
378         }
379         
380         void add(TCharmReadonlys &r,int len,const char *data) {
381                 // Unpack these readonlies:
382                 PUP::fromMem p(data);
383                 r.pupData(p);
384                 // Add to our list:
385                 all.add(r);
386         }
387         
388         void pup(PUP::er &p) {
389                 all.pup(p);
390                 all.pupData(p);
391         }
392 };
393
394 // Send out this set of readonlies to the readonly group:
395 static void send_readonlies(TCharmReadonlys &r) {
396         int len; {PUP::sizer p; r.pupData(p); len=p.size();}
397         char *data=new char[len];
398         {PUP::toMem p(data); r.pupData(p);}
399         tcharm_readonlygroup.add(r,len,data);
400         delete[] data;
401 }
402
403 class TCharmReadonlyMain : public CBase_TCharmReadonlyMain {
404 public:
405     TCharmReadonlyMain(void) {
406         TCharmReadonlys &r=initial_readonlies;
407         int len; {PUP::sizer p; r.pupData(p); len=p.size();}
408         char *data=new char[len];
409         {PUP::toMem p(data); r.pupData(p);}
410         tcharm_readonlygroup=CProxy_TCharmReadonlyGroup::ckNew(r,len,data);
411         delete[] data;
412         tcharm_readonlygroup_created=1;
413     }
414 };
415
416 void TCharmReadonlys::add(TCpupReadonlyGlobal fn)
417 {
418         entries.push_back(fn);
419 }
420 void TCharmReadonlys::add(const TCharmReadonlys &r) {
421         for (unsigned int i=0;i<r.entries.size();i++)
422                 entries.push_back(r.entries[i]);
423 }
424
425 //Pup the readonly *functions* (for shipping)
426 void TCharmReadonlys::pup(PUP::er &p) {
427         p|entries;
428 }
429
430 //Pups the readonly *data*
431 void TCharmReadonlys::pupData(PUP::er &p) {
432         for (unsigned int i=0;i<entries.size();i++)
433                 (entries[i])((pup_er)&p);
434 }
435
436 //Pups all readonly data registered so far.
437 void TCharmReadonlys::pupAll(PUP::er &p) {
438         if (!tcharm_readonlygroup_created)
439                 CkAbort("TCharmReadonlys::pupAll can only be called after the TCHARM main");
440         TCharmReadonlys &all=tcharm_readonlygroup.ckLocalBranch()->all;
441         int n=all.size();
442         p|n;
443         if (n!=all.size())
444                 CkAbort("TCharmReadonly list length mismatch!\n");
445         all.pupData(p);
446 }
447
448 CDECL void TCHARM_Readonly_globals(TCpupReadonlyGlobal fn)
449 {
450         TCHARMAPI("TCHARM_Readonly_globals");
451         if (!tcharm_readonlygroup_created) 
452         { // Readonly message hasn't gone out yet: just add to list
453                 initial_readonlies.add(fn);
454         } 
455         else /* tcharm_readonlygroup_created */
456         { // Late addition: Broadcast our copy of the readonly data:
457                 TCharmReadonlys r; r.add(fn);
458                 send_readonlies(r);
459         }
460 }
461 FDECL void FTN_NAME(TCHARM_READONLY_GLOBALS,tcharm_readonly_globals)
462         (TCpupReadonlyGlobal fn)
463 {
464         TCHARM_Readonly_globals(fn);
465 }
466
467
468 /************* Startup/Shutdown Coordination Support ************/
469
470 // Useless values to reduce over:
471 int vals[2]={0,1};
472
473 //Called when we want to go to a barrier
474 void TCharm::barrier(void) {
475         //Contribute to a synchronizing reduction
476         CkCallback cb(index_t::atBarrier(0), thisProxy[0]);
477         contribute(sizeof(vals),&vals,CkReduction::sum_int,cb);
478         stop();
479 }
480
481 //Called when we've reached the barrier
482 void TCharm::atBarrier(CkReductionMsg *m) {
483         DBGX("clients all at barrier");
484         delete m;
485         thisProxy.run(); //Just restart everybody
486 }
487
488 //Called when the thread is done running
489 void TCharm::done(void) {
490         DBG("TCharm thread "<<thisIndex<<" done")
491         if (exitWhenDone) {
492                 //Contribute to a synchronizing reduction
493                 CkCallback cb(index_t::atExit(0), thisProxy[0]);
494                 contribute(sizeof(vals),&vals,CkReduction::sum_int,cb);
495         }
496         stop();
497 }
498 //Called when all threads are done running
499 void TCharm::atExit(CkReductionMsg *m) {
500         DBGX("TCharm::atExit> exiting");
501         delete m;
502         CkExit();
503 }
504
505
506 /************* Setup **************/
507
508 //Globals used to control setup process
509 static TCHARM_Fallback_setup_fn g_fallbackSetup=NULL;
510 void TCHARM_Set_fallback_setup(TCHARM_Fallback_setup_fn f)
511 {
512         g_fallbackSetup=f;
513 }
514 void TCHARM_Call_fallback_setup(void) {
515         if (g_fallbackSetup) 
516                 (g_fallbackSetup)();
517         else
518                 CkAbort("TCHARM: Unexpected fallback setup--missing TCHARM_User_setup routine?");
519 }
520
521 /************** User API ***************/
522 /**********************************
523 Callable from UserSetup:
524 */
525
526 // Read the command line to figure out how many threads to create:
527 CDECL int TCHARM_Get_num_chunks(void)
528 {
529         TCHARMAPI("TCHARM_Get_num_chunks");
530         if (CkMyPe()!=0) CkAbort("TCHARM_Get_num_chunks should only be called on PE 0 during setup!");
531         int nChunks=CkNumPes();
532         char **argv=CkGetArgv();
533         CmiGetArgIntDesc(argv,"-vp",&nChunks,"Set the total number of virtual processors");
534         CmiGetArgIntDesc(argv,"+vp",&nChunks,NULL);
535         lastNumChunks=nChunks;
536         return nChunks;
537 }
538 FDECL int FTN_NAME(TCHARM_GET_NUM_CHUNKS,tcharm_get_num_chunks)(void)
539 {
540         return TCHARM_Get_num_chunks();
541 }
542
543 // Fill out the default thread options:
544 TCHARM_Thread_options::TCHARM_Thread_options(int doDefault)
545 {
546         stackSize=tcharm_stacksize; /* default stacksize */
547         exitWhenDone=0; /* don't exit when done by default. */
548 }
549
550 TCHARM_Thread_options g_tcharmOptions(1);
551
552 /*Set the size of the thread stack*/
553 CDECL void TCHARM_Set_stack_size(int newStackSize)
554 {
555         TCHARMAPI("TCHARM_Set_stack_size");
556         g_tcharmOptions.stackSize=newStackSize;
557 }
558 FDECL void FTN_NAME(TCHARM_SET_STACK_SIZE,tcharm_set_stack_size)
559         (int *newSize)
560 { TCHARM_Set_stack_size(*newSize); }
561
562 CDECL void TCHARM_Set_exit(void) { g_tcharmOptions.exitWhenDone=1; }
563
564 /*Create a new array of threads, which will be bound to by subsequent libraries*/
565 CDECL void TCHARM_Create(int nThreads,
566                         TCHARM_Thread_start_fn threadFn)
567 {
568         TCHARMAPI("TCHARM_Create");
569         TCHARM_Create_data(nThreads,
570                          (TCHARM_Thread_data_start_fn)threadFn,NULL,0);
571 }
572 FDECL void FTN_NAME(TCHARM_CREATE,tcharm_create)
573         (int *nThreads,TCHARM_Thread_start_fn threadFn)
574 { TCHARM_Create(*nThreads,threadFn); }
575
576 static CProxy_TCharm TCHARM_Build_threads(TCharmInitMsg *msg);
577
578 /*As above, but pass along (arbitrary) data to threads*/
579 CDECL void TCHARM_Create_data(int nThreads,
580                   TCHARM_Thread_data_start_fn threadFn,
581                   void *threadData,int threadDataLen)
582 {
583         TCHARMAPI("TCHARM_Create_data");
584         if (TCharm::getState()!=inInit)
585                 CkAbort("TCharm> Can only create threads from in init!\n");
586         TCharmInitMsg *msg=new (threadDataLen,0) TCharmInitMsg(
587                 (CthVoidFn)threadFn,g_tcharmOptions);
588         msg->numElements=nThreads;
589         memcpy(msg->data,threadData,threadDataLen);
590         TCHARM_Build_threads(msg);
591         
592         // Reset the thread options:
593         g_tcharmOptions=TCHARM_Thread_options(1);
594 }
595
596 FDECL void FTN_NAME(TCHARM_CREATE_DATA,tcharm_create_data)
597         (int *nThreads,
598                   TCHARM_Thread_data_start_fn threadFn,
599                   void *threadData,int *threadDataLen)
600 { TCHARM_Create_data(*nThreads,threadFn,threadData,*threadDataLen); }
601
602 static int propMapCreated=0;
603 static CkGroupID propMapID;
604 CkGroupID CkCreatePropMap(void);
605
606 static CProxy_TCharm TCHARM_Build_threads(TCharmInitMsg *msg)
607 {
608         CkArrayOptions opts(msg->numElements);
609         if (!propMapCreated) {
610                 propMapCreated=1;
611                 propMapID=CkCreatePropMap();
612         }
613         opts.setMap(propMapID);
614         int nElem=msg->numElements; //<- save it because msg will be deleted.
615         return CProxy_TCharm::ckNew(msg,opts);
616 }
617
618 // Helper used when creating a new array bound to the TCHARM threads:
619 CkArrayOptions TCHARM_Attach_start(CkArrayID *retTCharmArray,int *retNumElts)
620 {
621         TCharm *tc=TCharm::get();
622         if (!tc)
623                 CkAbort("You must call TCHARM initialization routines from a TCHARM thread!");
624         int nElts=tc->getNumElements();
625         if (retNumElts!=NULL) *retNumElts=nElts;
626         *retTCharmArray=tc->getProxy();
627         CkArrayOptions opts(nElts);
628         opts.bindTo(tc->getProxy());
629         return opts;
630 }
631
632 void TCHARM_Suspend(void) {
633         TCharm *tc=TCharm::get();
634         tc->suspend();
635 }
636
637 /***********************************
638 Callable from worker thread
639 */
640 CDECL int TCHARM_Element(void)
641
642         TCHARMAPI("TCHARM_Element");
643         return TCharm::get()->getElement();
644 }
645 CDECL int TCHARM_Num_elements(void)
646
647         TCHARMAPI("TCHARM_Num_elements");
648         if (TCharm::getState()==inDriver)
649                 return TCharm::get()->getNumElements();
650         else
651                 return lastNumChunks;
652 }
653
654 FDECL int FTN_NAME(TCHARM_ELEMENT,tcharm_element)(void) 
655 { return TCHARM_Element();}
656 FDECL int FTN_NAME(TCHARM_NUM_ELEMENTS,tcharm_num_elements)(void) 
657 { return TCHARM_Num_elements();}
658
659 //Make sure this address will migrate with us when we move:
660 static void checkAddress(void *data)
661 {
662         if (tcharm_nomig||tcharm_nothreads) return; //Stack is not isomalloc'd
663         if (!CmiIsomallocInRange(data))
664             CkAbort("The UserData you register must be allocated on the stack!\n");
665 }
666
667 /* Old "register"-based userdata: */
668 CDECL int TCHARM_Register(void *data,TCHARM_Pup_fn pfn)
669
670         TCHARMAPI("TCHARM_Register");
671         checkAddress(data);
672         return TCharm::get()->add(TCharm::UserData(pfn,data));
673 }
674 FDECL int FTN_NAME(TCHARM_REGISTER,tcharm_register)
675         (void *data,TCpupUserDataF pfn)
676
677         TCHARMAPI("TCHARM_Register");
678         checkAddress(data);
679         return TCharm::get()->add(TCharm::UserData(
680                 pfn,data,TCharm::UserData::isFortran()));
681 }
682
683 CDECL void *TCHARM_Get_userdata(int id)
684 {
685         TCHARMAPI("TCHARM_Get_userdata");
686         return TCharm::get()->lookupUserData(id);
687 }
688 FDECL void *FTN_NAME(TCHARM_GET_USERDATA,tcharm_get_userdata)(int *id)
689 { return TCHARM_Get_userdata(*id); }
690
691 /* New hardcoded-ID userdata: */
692 CDECL void TCHARM_Set_global(int globalID,void *new_value,TCHARM_Pup_global_fn pup_or_NULL)
693 {
694         TCHARMAPI("TCHARM_Set_global");
695         TCharm *tc=TCharm::get();
696         if (tc->sud.length()<=globalID)
697         { //We don't have room for this ID yet: make room
698                 int newLen=2*globalID;
699                 tc->sud.setSize(newLen);
700                 tc->sud.length()=newLen;
701         }
702         tc->sud[globalID]=TCharm::UserData((TCHARM_Pup_fn) pup_or_NULL,new_value);
703 }
704 CDECL void *TCHARM_Get_global(int globalID)
705 {
706         //Skip TCHARMAPI("TCHARM_Get_global") because there's no dynamic allocation here,
707         // and this routine should be as fast as possible.
708         CkVec<TCharm::UserData> &v=TCharm::get()->sud;
709         if (v.length()<=globalID) return NULL; //Uninitialized global
710         return v[globalID].getData();
711 }
712
713 CDECL void TCHARM_Migrate(void)
714 {
715         TCHARMAPI("TCHARM_Migrate");
716         TCharm::get()->migrate();
717 }
718 FORTRAN_AS_C(TCHARM_MIGRATE,TCHARM_Migrate,tcharm_migrate,(void),())
719
720 CDECL void TCHARM_Migrate_to(int destPE)
721 {
722         TCHARMAPI("TCHARM_Migrate_to");
723         TCharm::get()->migrateTo(destPE);
724 }
725 FORTRAN_AS_C(TCHARM_MIGRATE_TO,TCHARM_Migrate_to,tcharm_migrate_to,
726         (int *destPE),(*destPE))
727
728 CDECL void TCHARM_Yield(void)
729 {
730         TCHARMAPI("TCHARM_Yield");
731         TCharm::get()->schedule();
732 }
733 FORTRAN_AS_C(TCHARM_YIELD,TCHARM_Yield,tcharm_yield,(void),())
734
735 CDECL void TCHARM_Barrier(void)
736 {
737         TCHARMAPI("TCHARM_Barrier");
738         TCharm::get()->barrier();
739 }
740 FORTRAN_AS_C(TCHARM_BARRIER,TCHARM_Barrier,tcharm_barrier,(void),())
741
742 CDECL void TCHARM_Done(void)
743 {
744         TCHARMAPI("TCHARM_Done");
745         if (TCharm::getState()!=inDriver) CkExit();
746         else TCharm::get()->done();
747 }
748 FORTRAN_AS_C(TCHARM_DONE,TCHARM_Done,tcharm_done,(void),())
749
750
751 CDECL double TCHARM_Wall_timer(void)
752 {
753   TCHARMAPI("TCHARM_Wall_timer");
754   if(TCharm::getState()!=inDriver) return CkWallTimer();
755   else { //Have to apply current thread's time offset
756     return CkWallTimer()+TCharm::get()->getTimeOffset();
757   }
758 }
759
760 #if 1
761 /*Include Fortran-style "iargc" and "getarg" routines.
762 These are needed to get access to the command-line arguments from Fortran.
763 */
764 FDECL int FTN_NAME(TCHARM_IARGC,tcharm_iargc)(void) {
765   TCHARMAPI("tcharm_iargc");
766   return CkGetArgc()-1;
767 }
768
769 FDECL void FTN_NAME(TCHARM_GETARG,tcharm_getarg)
770         (int *i_p,char *dest,int destLen)
771 {
772   TCHARMAPI("tcharm_getarg");
773   int i=*i_p;
774   if (i<0) CkAbort("tcharm_getarg called with negative argument!");
775   if (i>=CkGetArgc()) CkAbort("tcharm_getarg called with argument > iargc!");
776   const char *src=CkGetArgv()[i];
777   strcpy(dest,src);
778   for (i=strlen(dest);i<destLen;i++) dest[i]=' ';
779 }
780
781 #endif
782
783 //These silly routines are used for serial startup:
784 extern void _initCharm(int argc, char **argv);
785 CDECL void TCHARM_Init(int *argc,char ***argv) {
786         if (!tcharm_initted) {
787           ConverseInit(*argc, *argv, (CmiStartFn) _initCharm,1,1);
788           _initCharm(*argc,*argv);
789         }
790 }
791
792 FDECL void FTN_NAME(TCHARM_INIT,tcharm_init)(void)
793 {
794         int argc=1;
795         char *argv_sto[2]={"foo",NULL};
796         char **argv=argv_sto;
797         TCHARM_Init(&argc,&argv);
798 }
799
800 /***********************************
801 * TCHARM Semaphores:
802 * The idea is one side "puts", the other side "gets"; 
803 * but the calls can come in any order--
804 * if the "get" comes first, it blocks until the put.
805 * This makes a convenient, race-condition-free way to do
806 * onetime initializations.  
807 */
808 /// Find this semaphore, or insert if there isn't one:
809 TCharm::TCharmSemaphore *TCharm::findSema(int id) {
810         for (int s=0;s<sema.size();s++)
811                 if (sema[s].id==id) 
812                         return &sema[s];
813         sema.push_back(TCharmSemaphore(id));
814         return &sema[sema.size()-1];
815 }
816 /// Remove this semaphore from the list
817 void TCharm::freeSema(TCharmSemaphore *doomed) {
818         int id=doomed->id;
819         for (int s=0;s<sema.size();s++)
820                 if (sema[s].id==id) {
821                         sema[s]=sema[sema.length()-1];
822                         sema.length()--;
823                         return;
824                 }
825         CkAbort("Tried to free nonexistent TCharm semaphore");
826 }
827
828 /// Block until this semaphore has data:
829 TCharm::TCharmSemaphore *TCharm::getSema(int id) {
830         TCharmSemaphore *s=findSema(id);
831         if (s->data==NULL) 
832         { //Semaphore isn't filled yet: wait until it is
833                 s->thread=CthSelf();
834                 suspend(); //Will be woken by semaPut
835                 // Semaphore may have moved-- find it again
836                 s=findSema(id);
837                 if (s->data==NULL) CkAbort("TCharm::semaGet awoken too early!");
838         }
839         return s;
840 }
841
842 /// Store data at the semaphore "id".
843 ///  The put can come before or after the get.
844 void TCharm::semaPut(int id,void *data) {
845         TCharmSemaphore *s=findSema(id);
846         if (s->data!=NULL) CkAbort("Duplicate calls to TCharm::semaPut!");
847         s->data=data;
848         if (s->thread!=NULL) {//Awaken the thread
849                 s->thread=NULL;
850                 resume();
851         }
852 }
853
854 /// Retreive data from the semaphore "id".
855 ///  Blocks if the data is not immediately available.
856 ///  Consumes the data, so another put will be required for the next get.
857 void *TCharm::semaGet(int id) {
858         TCharmSemaphore *s=getSema(id);
859         void *ret=s->data;
860         // Now remove the semaphore from the list:
861         freeSema(s);
862         return ret;
863 }
864
865 /// Retreive data from the semaphore "id".
866 ///  Blocks if the data is not immediately available.
867 void *TCharm::semaGets(int id) {
868         TCharmSemaphore *s=getSema(id);
869         return s->data;
870 }
871
872 /// Retreive data from the semaphore "id", or returns NULL.
873 void *TCharm::semaPeek(int id) {
874         TCharmSemaphore *s=findSema(id);
875         return s->data;
876 }
877
878 #include "tcharm.def.h"