modified the registration of the converse handlers for propagate and propagate_frag.
[charm.git] / src / conv-com / petable.C
1 /*****************************************************************************
2  * $Source$
3  * $Author$
4  * $Date$
5  * $Revision$
6  *****************************************************************************/
7
8 /*********************************************
9  * File : petable.C
10  *
11  * Author: Krishnan V
12  *
13  * The message buffer
14  *********************************************/
15 #include <string.h>
16 #include <stdlib.h>
17 #include <converse.h>
18 #include "comlib.h"
19 #include "petable.h"
20 #include "converse.h"
21
22 #define BIGBUFFERSIZE 65536
23 #define PTPREALLOC    100
24
25 struct AllToAllHdr{
26     char dummy[CmiReservedHeaderSize];
27     int refno;
28     comID id;
29     int ufield;
30     int nmsgs;
31 };
32
33
34 /**************************************************************
35  * Preallocated memory=P*MSGQLEN ptr + 2P ints + 1000 ptrs
36  **************************************************************/
37 PeTable :: PeTable(int n)
38 {
39   NumPes=n;
40   magic=0;
41   PeList = (PTinfo ***)CmiAlloc(sizeof(PTinfo *)*NumPes);
42   //  ComlibPrintf("Pelist[%d][%d]\n", NumPes, MSGQLEN);
43   msgnum=new int[NumPes];
44   MaxSize=new int[NumPes];
45   for (int i=0;i<NumPes;i++) {
46         msgnum[i]=0;
47         MaxSize[i]=MSGQLEN;
48         PeList[i]=(PTinfo **)CmiAlloc(sizeof(PTinfo *)*MSGQLEN);
49         for (int j=0;j<MSGQLEN;j++) PeList[i][j]=0;
50   }
51
52   //ptrlist=(PTinfo **)CmiAlloc(1000*sizeof(PTinfo *));
53   //  FreeList= new GList;
54   //CombBuffer=(char *)CmiAlloc(BIGBUFFERSIZE);
55
56   PTFreeList=NULL;
57 }
58
59 PeTable :: ~PeTable()
60 {
61   int i;
62   for (i=0;i<NumPes;i++) CmiFree(PeList[i]);
63   CmiFree(PeList);
64   delete msgnum;
65   delete MaxSize;
66   GarbageCollect();
67   //CmiFree(ptrlist);
68   PTinfo *tmp;
69   while (PTFreeList) {
70         tmp=PTFreeList;
71         PTFreeList=tmp->next;
72         CmiFree(tmp);
73   }
74  // delete FreeList;
75
76 }
77
78 void PeTable:: Purge()
79 {
80   for (int i=0; i<NumPes;i++) {
81         if (msgnum[i]) {
82             // ComlibPrintf("%d Warning: %d Undelivered Messages for %d\n", CkMyPe(), msgnum[i], i);
83           //msgnum[i]=0;
84         }
85   }
86   GarbageCollect();
87   //  ComlibPrintf("combcount = %d\n", combcount);
88   //combcount = 0;
89 }
90
91 void PeTable :: ExtractAndDeliverLocalMsgs(int index)
92 {
93   int j;
94   msgstruct m;
95
96   ComlibPrintf("%d:Delivering %d local messages\n", CkMyPe(), msgnum[index]);
97   for (j=msgnum[index]-1;(j>=0);j--) {
98
99         m.msgsize=PeList[index][j]->msgsize;
100         m.msg=PeList[index][j]->msg;
101
102         if (--(PeList[index][j]->refCount) <=0) {
103             CmiSyncSendAndFree(CkMyPe()/*index*/, m.msgsize, (char*)m.msg);
104             PTFREE(PeList[index][j]);
105         }
106         else {
107             CmiSyncSend(CkMyPe()/*index*/, m.msgsize, (char*)m.msg);
108         }
109         PeList[index][j]=NULL;
110   }
111   msgnum[index]=j+1;
112
113   return;
114 }
115
116
117 #undef PACK
118 #undef PACKMSG
119 #define PACKINT(data) {((int*)t)[0] = data; t+=sizeof(int);}
120 #define PACK(type,data) {junk=(char *)&(data); memcpy(t, junk, sizeof(type)); t+=sizeof(type);}
121 #define PACKMSG(data, size) { memcpy(p+msg_offset, (data), size); msg_offset += size; }
122
123 /*Used for all to all multicast operations.  Assumes that each message
124   is destined to all the processors, to speed up all to all
125   substantially --Sameer 09/03/03 
126   
127   Protocol:
128   |ref|comid|ufield|nmsgs|size|ref|msg1|size2|ref2|msg2|....
129 */
130
131 char * PeTable ::ExtractAndPackAll(comID id, int ufield, int *length)
132 {
133     int nmsgs = 0, i, j;
134     int index = 0;
135
136     ComlibPrintf("[%d] In Extract And Pack All\n", CkMyPe());
137
138     //Increment magic to detect duplicate messages
139     magic++;
140
141     register int total_msg_size = 0;
142
143     //first compute size
144     for (i=0;i<NumPes;i++) {
145         index = i;
146         for (j=msgnum[index]-1; (j>=0); j--) {
147             if (PeList[index][j]->magic != magic) {                
148                 total_msg_size += ALIGN8(PeList[index][j]->msgsize);
149                 total_msg_size += 2 * sizeof(int);
150                 PeList[index][j]->magic=magic;
151
152                 nmsgs ++;
153             }            
154         }
155     }
156     
157     total_msg_size += ALIGN8(sizeof(AllToAllHdr));
158
159     ComlibPrintf("[%d] Message Size %d, nmsgs %d **%d**\n", CkMyPe(), total_msg_size, nmsgs, sizeof(AllToAllHdr));
160     
161     //poiter to the combined message, UGLY NAME
162     char *p = (char *) CmiAlloc(total_msg_size * sizeof(char));    
163
164     ComlibPrintf("After cmialloc\n");
165
166     //buffer to copy stuff into
167     char *t = p; 
168     char *junk = NULL;
169     
170     int dummy = 0;
171     
172     int refno = 0;
173
174     AllToAllHdr ahdr;
175     ahdr.refno = refno;
176     ahdr.id = id;
177     ahdr.ufield = ufield;
178     ahdr.nmsgs = nmsgs;
179
180     /*
181       PACKINT(refno);    
182       PACK(comID, id);
183       
184       PACKINT(ufield);
185       PACKINT(nmsgs);
186       //    PACKINT(dummy); //Aligning to 8 bytes
187     */
188
189     PACK(AllToAllHdr, ahdr);   
190
191     int msg_offset = ALIGN8(sizeof(AllToAllHdr));
192     
193     //Increment magic again for creating the message
194     magic++;
195     for (i=0;i<NumPes;i++) {
196         index=i;
197         int ref = 0;
198         int size;
199
200         for (j=msgnum[index]-1; (j>=0); j--) {
201             //Check if it is a duplicate
202             if (PeList[index][j]->magic != magic) {                
203                 size = PeList[index][j]->msgsize;
204                 PACKMSG(&size, sizeof(int));
205                 PACKMSG(&ref, sizeof(int));
206                 PeList[index][j]->magic=magic;
207                 PACKMSG(PeList[index][j]->msg, size);
208
209                 msg_offset = ALIGN8(msg_offset);
210             }
211
212             //Free it when all the processors have gotten rid of it
213             if (--(PeList[index][j]->refCount) <=0) {
214                 ComlibPrintf("before cmifree \n");
215                 CmiFree(PeList[index][j]->msg);   
216                 ComlibPrintf("after cmifree \n");
217
218                 PTFREE(PeList[index][j]);
219             }
220             //Assign the current processors message pointer to NULL
221             PeList[index][j] = NULL;
222         }
223         msgnum[index] = 0;
224     }
225     
226     *length = total_msg_size;
227     return p;
228 }
229
230 char * PeTable ::ExtractAndPack(comID id, int ufield, int npe, 
231                                 int *pelist, int *length)
232 {
233     char *junk;
234     int nummsgs, offset, num_distinctmsgs;
235     
236     ComlibPrintf("In ExtractAndPack %d\n", npe); 
237     
238     int tot_msgsize=TotalMsgSize(npe, pelist, &nummsgs, &num_distinctmsgs);
239     if (tot_msgsize ==0) {
240         *length=0;
241         
242         ComlibPrintf("Returning NULL\n");
243         return(NULL);
244     }
245     
246     int msg_offset = CmiReservedHeaderSize + sizeof(comID) 
247         + (npe + 4 + nummsgs) * sizeof(int);  
248
249     msg_offset = ALIGN8(msg_offset);
250     
251     *length = tot_msgsize;
252     *length += msg_offset;
253     char *p;
254     p=(char *)CmiAlloc(*length);
255
256     char *t = p + CmiReservedHeaderSize;
257     int i, j;
258     if (!p) CmiAbort("Big time problem\n");
259     magic++;
260
261     int refno = id.refno;    
262
263     PACKINT(refno);
264     PACK(comID, id);
265     PACKINT(ufield);
266     PACKINT(npe);
267     
268     int lesspe=0;
269     int npacked = 0;
270     for (i=0;i<npe;i++) {
271         int index=pelist[i];
272
273         if (msgnum[index]<=0) {
274             lesspe++;
275             
276             ComlibPrintf("msgnum[index]<=0 !!!!!\n");
277             continue;
278         }
279         
280         ComlibPrintf("%d Packing pelist[%d]\n", CkMyPe(), index);
281         register int newval=-1*pelist[i];
282         PACKINT(newval); 
283         for (j=0;j<msgnum[index];j++) {
284             if (PeList[index][j]->magic == magic) {
285                 offset=(PeList[index][j]->offset);
286             }
287             else {
288                 npacked ++;
289                 
290                 offset=msg_offset;
291                 PeList[index][j]->magic=magic;
292                 PeList[index][j]->offset=msg_offset;
293                 PTinfo *tempmsg=PeList[index][j];
294                 
295                 CmiChunkHeader hdr;
296                 hdr.size = tempmsg->msgsize;
297                 hdr.ref = -1;
298                 PACKMSG(&hdr, sizeof(CmiChunkHeader));
299                 PACKMSG(tempmsg->msg, tempmsg->msgsize);
300
301                 msg_offset = ALIGN8(msg_offset);
302             }
303             
304             //ComlibPrintf("%d Packing msg_offset=%d\n", CkMyPe(), offset);
305             PACKINT(offset); 
306
307             if (--(PeList[index][j]->refCount) <=0) {
308                 CmiFree(PeList[index][j]->msg);
309                 
310                 PTFREE(PeList[index][j]);
311             }
312             PeList[index][j]=NULL;
313         }
314         msgnum[index]=0;
315     }
316     offset=-1;
317     PACKINT(offset);
318     
319     if (lesspe) {
320         t=p+CmiReservedHeaderSize+2*sizeof(int) + sizeof(comID);
321         npe=npe-lesspe;
322         PACK(int, npe);
323     }
324
325     return(p);
326
327
328 #undef UNPACK
329 #define UNPACK(type,data) {junk=(char *)&(data); memcpy(junk, t, sizeof(type));t+=sizeof(type);}
330 #undef UNPACKMSG
331 #define UNPACKMSG(dest,src, size) { memcpy(dest, src, size); offset += size;}
332
333 int PeTable :: UnpackAndInsert(void *in)
334 {
335   char *junk;
336   char *t =(char *)in + CmiReservedHeaderSize;
337   int i, ufield, npe, pe, tot_msgsize, ptrlistindex=0;
338   comID id;
339   int refno = 0;
340
341   UNPACK(int, refno);
342   
343   //ComlibPrintf("%d UnPacking id\n", CkMyPe());
344   UNPACK(comID, id);
345   UNPACK(int, ufield);
346   UNPACK(int, npe);
347   
348   register int offset;
349   for (i=0;i<npe;i++) {
350         UNPACK(int, pe);
351         pe *= -1;
352
353         UNPACK(int, offset);
354         while (offset > 0) {
355             int tempmsgsize;
356             UNPACKMSG(&(tempmsgsize), (char *)in+offset, sizeof(int));
357             int ptr;
358             UNPACKMSG(&ptr, (char *)in+offset, sizeof(int));
359
360             if (ptr >=0 )  {
361                 if (msgnum[pe] >= MaxSize[pe]) {
362                     REALLOC(PeList[pe], MaxSize[pe]);
363                     MaxSize[pe] *= 2;
364                 }
365                 PeList[pe][msgnum[pe]]=ptrvec[ptr];
366                 (ptrvec[ptr])->refCount++;
367                 msgnum[pe]++;
368
369                 UNPACK(int, offset);
370                 continue;
371             }
372             
373             PTinfo *temp;
374             PTALLOC(temp);
375             temp->msgsize=tempmsgsize;
376             temp->refCount=1;
377             temp->magic=0;
378             temp->offset=0;
379
380             ptrvec.insert(ptrlistindex, temp);
381             memcpy((char *)in+offset-sizeof(int), &ptrlistindex, sizeof(int));
382
383             ptrlistindex++;
384             temp->msg=(void *)((char *)in+offset);
385             if (msgnum[pe] >= MaxSize[pe]) {
386
387                 REALLOC(PeList[pe], MaxSize[pe]);
388                 MaxSize[pe] *= 2;
389             }
390             PeList[pe][msgnum[pe]]=temp;
391             msgnum[pe]++;
392             UNPACK(int, offset);
393         }
394         t -=sizeof(int);
395   }
396   *(int *)((char *)in -sizeof(int))=ptrlistindex; 
397   
398   if (ptrlistindex==0)
399       CmiFree(in);
400   
401   for (i=0;i<ptrlistindex;i++) {
402       char * actualmsg=(char *)(ptrvec[i]->msg);
403       int *rc=(int *)(actualmsg-sizeof(int));
404       *rc=(int)((char *)in-actualmsg);
405       //ComlibPrintf("I am inserting %d\n", *rc);
406   }
407   
408   return(ufield);
409 }
410
411 /* Unpack and insert an all to all message, the router provides the
412    list of processors to insert into.
413    Same protocol as mentioned earlier.
414 */
415
416 int PeTable :: UnpackAndInsertAll(void *in, int npes, int *pelist){
417   char *junk;
418   char *t =(char *)in /*+CmiReservedHeaderSize*/;
419   int i,  
420       ufield,   // user field or ths stage of the iteration 
421       nmsgs,    // number of messages in combo message
422       refno,    // reference number
423       dummy;    // alignment dummy
424   
425   comID id;
426
427   /*
428     UNPACK(int, refno);      
429     UNPACK(comID, id);
430     
431     UNPACK(int, ufield);
432     UNPACK(int, nmsgs);
433     //UNPACK(int, dummy);
434     int header_size = sizeof(comID) + CmiReservedHeaderSize + 3 *sizeof(int);
435     if(header_size % 8 != 0)
436     t+= 8 - header_size % 8;
437   */
438
439   AllToAllHdr ahdr;
440   UNPACK(AllToAllHdr, ahdr);
441
442   if(sizeof(AllToAllHdr) % 8 != 0)
443       t += 8 - sizeof(AllToAllHdr) % 8;
444
445   refno = ahdr.refno;
446   id = ahdr.id;
447   nmsgs = ahdr.nmsgs;
448   ufield = ahdr.ufield;
449
450   ComlibPrintf("[%d] unpack and insert all %d, %d\n", CkMyPe(), ufield, nmsgs);
451   
452   //Inserting a memory foot print may, change later
453   CmiChunkHeader *chdr= (CmiChunkHeader*)((char*)in - sizeof(CmiChunkHeader));
454
455   for(int count = 0; count < nmsgs; count++){
456       int *ref = 0;
457       int size = 0;
458       char *msg = 0;
459
460       UNPACK(int, size);
461       ref = (int *)t;
462       t += sizeof(int);
463
464       *ref = (int)((char *)(&chdr->ref) - (char *)ref);
465       chdr->ref ++;
466
467       ComlibPrintf("ref = %d, global_ref = %d\n", *ref, chdr->ref);
468
469       msg = t;
470       t += ALIGN8(size);
471       
472       InsertMsgs(npes, pelist, size, msg);
473   }  
474
475   CmiFree(in);
476   return ufield;
477 }
478
479 void PeTable :: GarbageCollect()
480 {
481 }
482