3bdd3069d7235c7422a383029356d9f5c1db8663
[charm.git] / src / conv-com / petable.C
1 /*****************************************************************************
2  * $Source$
3  * $Author$
4  * $Date$
5  * $Revision$
6  *****************************************************************************/
7
8 /*********************************************
9  * File : petable.C
10  *
11  * Author: Krishnan V
12  *
13  * The message buffer
14  *********************************************/
15 #include <string.h>
16 #include <stdlib.h>
17 #include <converse.h>
18 #include "comlib.h"
19 #include "petable.h"
20 #include "converse.h"
21
22 #define BIGBUFFERSIZE 65536
23 #define PTPREALLOC    100
24
25 struct AllToAllHdr{
26     char dummy[CmiReservedHeaderSize];
27     int refno;
28     comID id;
29     int ufield;
30     int nmsgs;
31 };
32
33
34 /**************************************************************
35  * Preallocated memory=P*MSGQLEN ptr + 2P ints + 1000 ptrs
36  **************************************************************/
37 PeTable :: PeTable(int n)
38 {
39   NumPes=n;
40   magic=0;
41   PeList = (PTinfo ***)CmiAlloc(sizeof(PTinfo *)*NumPes);
42   //  ComlibPrintf("Pelist[%d][%d]\n", NumPes, MSGQLEN);
43   msgnum=new int[NumPes];
44   MaxSize=new int[NumPes];
45   for (int i=0;i<NumPes;i++) {
46         msgnum[i]=0;
47         MaxSize[i]=MSGQLEN;
48         PeList[i]=(PTinfo **)CmiAlloc(sizeof(PTinfo *)*MSGQLEN);
49         for (int j=0;j<MSGQLEN;j++) PeList[i][j]=0;
50   }
51
52   //ptrlist=(PTinfo **)CmiAlloc(1000*sizeof(PTinfo *));
53   //  FreeList= new GList;
54   //CombBuffer=(char *)CmiAlloc(BIGBUFFERSIZE);
55
56   PTFreeList=NULL;
57 }
58
59 PeTable :: ~PeTable()
60 {
61   int i;
62   for (i=0;i<NumPes;i++) CmiFree(PeList[i]);
63   CmiFree(PeList);
64   delete msgnum;
65   delete MaxSize;
66   GarbageCollect();
67   //CmiFree(ptrlist);
68   PTinfo *tmp;
69   while (PTFreeList) {
70         tmp=PTFreeList;
71         PTFreeList=tmp->next;
72         CmiFree(tmp);
73   }
74  // delete FreeList;
75
76 }
77
78 void PeTable:: Purge()
79 {
80   for (int i=0; i<NumPes;i++) {
81         if (msgnum[i]) {
82             // ComlibPrintf("%d Warning: %d Undelivered Messages for %d\n", CkMyPe(), msgnum[i], i);
83           //msgnum[i]=0;
84         }
85   }
86   GarbageCollect();
87   //  ComlibPrintf("combcount = %d\n", combcount);
88   //combcount = 0;
89 }
90
91 void PeTable :: ExtractAndDeliverLocalMsgs(int index)
92 {
93   int j;
94   msgstruct m;
95
96   ComlibPrintf("%d:Delivering %d local messages\n", CkMyPe(), msgnum[index]);
97   for (j=msgnum[index]-1;(j>=0);j--) {
98
99         m.msgsize=PeList[index][j]->msgsize;
100         m.msg=PeList[index][j]->msg;
101
102         if (--(PeList[index][j]->refCount) <=0) {
103             CmiSyncSendAndFree(CkMyPe()/*index*/, m.msgsize, (char*)m.msg);
104             PTFREE(PeList[index][j]);
105         }
106         else {
107             CmiSyncSend(CkMyPe()/*index*/, m.msgsize, (char*)m.msg);
108         }
109         PeList[index][j]=NULL;
110   }
111   msgnum[index]=j+1;
112
113   return;
114 }
115
116
117 #undef PACK
118 #undef PACKMSG
119 //#define PACKINT(data) {((int*)t)[0] = data; t+=sizeof(int);}
120 #define PACK(type,data) {junk=(char *)&(data); memcpy(t, junk, sizeof(type)); t+=sizeof(type);}
121 #define PACKMSG(data, size) { memcpy(p+msg_offset, (data), size); msg_offset += size; }
122
123 /*Used for all to all multicast operations.  Assumes that each message
124   is destined to all the processors, to speed up all to all
125   substantially --Sameer 09/03/03 
126   
127   Protocol:
128   |ref|comid|ufield|nmsgs|size|ref|msg1|size2|ref2|msg2|....
129 */
130
131 char * PeTable ::ExtractAndPackAll(comID id, int ufield, int *length)
132 {
133     int nmsgs = 0, i, j;
134     int index = 0;
135
136     ComlibPrintf("[%d] In Extract And Pack All\n", CkMyPe());
137
138     //Increment magic to detect duplicate messages
139     magic++;
140
141     register int total_msg_size = 0;
142
143     //first compute size
144     for (i=0;i<NumPes;i++) {
145         index = i;
146         for (j=msgnum[index]-1; (j>=0); j--) {
147             if (PeList[index][j]->magic != magic) {                
148                 total_msg_size += ALIGN8(PeList[index][j]->msgsize);
149                 total_msg_size += 2 * sizeof(int);
150                 PeList[index][j]->magic=magic;
151
152                 nmsgs ++;
153             }            
154         }
155     }
156     
157     total_msg_size += ALIGN8(sizeof(AllToAllHdr));
158
159     ComlibPrintf("[%d] Message Size %d, nmsgs %d **%d**\n", CkMyPe(), total_msg_size, nmsgs, sizeof(AllToAllHdr));
160     
161     //poiter to the combined message, UGLY NAME
162     char *p = (char *) CmiAlloc(total_msg_size * sizeof(char));    
163
164     ComlibPrintf("After cmialloc\n");
165
166     //buffer to copy stuff into
167     char *t = p; 
168     char *junk = NULL;
169     
170     int dummy = 0;
171     
172     int refno = 0;
173
174     AllToAllHdr ahdr;
175     ahdr.refno = refno;
176     ahdr.id = id;
177     ahdr.ufield = ufield;
178     ahdr.nmsgs = nmsgs;
179
180     /*
181       PACKINT(refno);    
182       PACK(comID, id);
183       
184       PACKINT(ufield);
185       PACKINT(nmsgs);
186       //    PACKINT(dummy); //Aligning to 8 bytes
187     */
188
189     PACK(AllToAllHdr, ahdr);   
190
191     int msg_offset = ALIGN8(sizeof(AllToAllHdr));
192     
193     //Increment magic again for creating the message
194     magic++;
195     for (i=0;i<NumPes;i++) {
196         index=i;
197         int ref = 0;
198         int size;
199
200         for (j=msgnum[index]-1; (j>=0); j--) {
201             //Check if it is a duplicate
202             if (PeList[index][j]->magic != magic) {                
203                 size = PeList[index][j]->msgsize;
204                 PACKMSG(&size, sizeof(int));
205                 PACKMSG(&ref, sizeof(int));
206                 PeList[index][j]->magic=magic;
207                 PACKMSG(PeList[index][j]->msg, size);
208
209                 msg_offset = ALIGN8(msg_offset);
210             }
211
212             //Free it when all the processors have gotten rid of it
213             if (--(PeList[index][j]->refCount) <=0) {
214                 ComlibPrintf("before cmifree \n");
215                 CmiFree(PeList[index][j]->msg);   
216                 ComlibPrintf("after cmifree \n");
217
218                 PTFREE(PeList[index][j]);
219             }
220             //Assign the current processors message pointer to NULL
221             PeList[index][j] = NULL;
222         }
223         msgnum[index] = 0;
224     }
225     
226     *length = total_msg_size;
227     return p;
228 }
229
230 char * PeTable ::ExtractAndPack(comID id, int ufield, int npe, 
231                                 int *pelist, int *length)
232 {
233     char *junk;
234     int nummsgs, offset, num_distinctmsgs;
235         
236     int tot_msgsize=TotalMsgSize(npe, pelist, &nummsgs, &num_distinctmsgs);
237
238     ComlibPrintf("%d In ExtractAndPack %d, %d\n", CmiMyPe(), npe, nummsgs); 
239
240     if (tot_msgsize ==0) {
241         *length=0;
242         
243         ComlibPrintf("Returning NULL\n");
244         return(NULL);
245     }
246     
247     int msg_offset = CmiReservedHeaderSize + sizeof(comID) 
248         + (npe + 4 + nummsgs) * sizeof(int);  
249
250     msg_offset = ALIGN8(msg_offset);
251     
252     *length = tot_msgsize;
253     *length += msg_offset;
254     char *p;
255     p=(char *)CmiAlloc(*length);
256
257     char *t = p + CmiReservedHeaderSize;
258     int i, j;
259     if (!p) CmiAbort("Big time problem\n");
260     magic++;
261
262     int refno = id.refno;    
263
264     PACK(int, refno);
265     PACK(comID, id);
266     PACK(int, ufield);
267     PACK(int, npe);
268     
269     int lesspe=0;
270     int npacked = 0;
271     for (i=0;i<npe;i++) {
272         int index=pelist[i];
273
274         if (msgnum[index]<=0) {
275             lesspe++;
276             
277             ComlibPrintf("[%d] msgnum[index]<=0 !!!!!\n", CkMyPe());
278             continue;
279         }
280         
281         ComlibPrintf("%d Packing pelist[%d]\n", CkMyPe(), index);
282         register int newval=-1*pelist[i];
283         PACK(int, newval); 
284
285         for (j=0;j<msgnum[index];j++) {
286             if (PeList[index][j]->magic == magic) {
287                 offset=(PeList[index][j]->offset);
288             }
289             else {
290                 npacked ++;
291                 
292                 offset=msg_offset;
293                 PeList[index][j]->magic=magic;
294                 PeList[index][j]->offset=msg_offset;
295                 PTinfo *tempmsg=PeList[index][j];
296                 
297                 CmiChunkHeader hdr;
298                 hdr.size = tempmsg->msgsize;
299                 hdr.ref = -1;
300                 PACKMSG(&hdr, sizeof(CmiChunkHeader));
301                 PACKMSG(tempmsg->msg, tempmsg->msgsize);
302
303                 msg_offset = ALIGN8(msg_offset);
304             }
305             
306             //ComlibPrintf("%d Packing msg_offset=%d\n", CkMyPe(), offset);
307             PACK(int, offset); 
308
309             if (--(PeList[index][j]->refCount) <=0) {
310                 CmiFree(PeList[index][j]->msg);
311                 
312                 PTFREE(PeList[index][j]);
313             }
314             PeList[index][j]=NULL;
315         }
316         msgnum[index]=0;
317     }
318     offset=-1;
319     PACK(int, offset);
320     
321     if (lesspe) {
322         t=p+CmiReservedHeaderSize+2*sizeof(int) + sizeof(comID);
323         npe=npe-lesspe;
324         PACK(int, npe);
325     }
326
327     return(p);
328
329
330 #undef UNPACK
331 #define UNPACK(type,data) {junk=(char *)&(data); memcpy(junk, t, sizeof(type));t+=sizeof(type);}
332 #undef UNPACKMSG
333 #define UNPACKMSG(dest,src, size) { memcpy(dest, src, size); offset += size;}
334
335 int PeTable :: UnpackAndInsert(void *in)
336 {
337   char *junk;
338   char *t =(char *)in + CmiReservedHeaderSize;
339   int i, ufield, npe, pe, tot_msgsize, ptrlistindex=0;
340   comID id;
341   int refno = 0;
342
343   UNPACK(int, refno);
344   
345   //ComlibPrintf("%d UnPacking id\n", CkMyPe());
346   UNPACK(comID, id);
347   UNPACK(int, ufield);
348   UNPACK(int, npe);
349   
350   register int offset;
351   for (i=0;i<npe;i++) {
352         UNPACK(int, pe);
353         pe *= -1;
354
355         UNPACK(int, offset);
356         while (offset > 0) {
357             int tempmsgsize;
358             UNPACKMSG(&(tempmsgsize), (char *)in+offset, sizeof(int));
359             int ptr;
360             UNPACKMSG(&ptr, (char *)in+offset, sizeof(int));
361
362             if (ptr >=0 )  {
363                 if (msgnum[pe] >= MaxSize[pe]) {
364                     REALLOC(PeList[pe], MaxSize[pe]);
365                     MaxSize[pe] *= 2;
366                 }
367                 PeList[pe][msgnum[pe]]=ptrvec[ptr];
368                 (ptrvec[ptr])->refCount++;
369                 msgnum[pe]++;
370
371                 UNPACK(int, offset);
372                 continue;
373             }
374             
375             PTinfo *temp;
376             PTALLOC(temp);
377             temp->msgsize=tempmsgsize;
378             temp->refCount=1;
379             temp->magic=0;
380             temp->offset=0;
381
382             ptrvec.insert(ptrlistindex, temp);
383             memcpy((char *)in+offset-sizeof(int), &ptrlistindex, sizeof(int));
384
385             ptrlistindex++;
386             temp->msg=(void *)((char *)in+offset);
387             if (msgnum[pe] >= MaxSize[pe]) {
388
389                 REALLOC(PeList[pe], MaxSize[pe]);
390                 MaxSize[pe] *= 2;
391             }
392             PeList[pe][msgnum[pe]]=temp;
393             msgnum[pe]++;
394             UNPACK(int, offset);
395         }
396         t -=sizeof(int);
397   }
398   *(int *)((char *)in -sizeof(int))=ptrlistindex; 
399   
400   if (ptrlistindex==0)
401       CmiFree(in);
402   
403   for (i=0;i<ptrlistindex;i++) {
404       char * actualmsg=(char *)(ptrvec[i]->msg);
405       int *rc=(int *)(actualmsg-sizeof(int));
406       *rc=(int)((char *)in-actualmsg);
407       //ComlibPrintf("I am inserting %d\n", *rc);
408   }
409   
410   return(ufield);
411 }
412
413 /* Unpack and insert an all to all message, the router provides the
414    list of processors to insert into.
415    Same protocol as mentioned earlier.
416 */
417
418 int PeTable :: UnpackAndInsertAll(void *in, int npes, int *pelist){
419   char *junk;
420   char *t =(char *)in /*+CmiReservedHeaderSize*/;
421   int i,  
422       ufield,   // user field or ths stage of the iteration 
423       nmsgs,    // number of messages in combo message
424       refno,    // reference number
425       dummy;    // alignment dummy
426   
427   comID id;
428
429   /*
430     UNPACK(int, refno);      
431     UNPACK(comID, id);
432     
433     UNPACK(int, ufield);
434     UNPACK(int, nmsgs);
435     //UNPACK(int, dummy);
436     int header_size = sizeof(comID) + CmiReservedHeaderSize + 3 *sizeof(int);
437     if(header_size % 8 != 0)
438     t+= 8 - header_size % 8;
439   */
440
441   AllToAllHdr ahdr;
442   UNPACK(AllToAllHdr, ahdr);
443
444   if(sizeof(AllToAllHdr) % 8 != 0)
445       t += 8 - sizeof(AllToAllHdr) % 8;
446
447   refno = ahdr.refno;
448   id = ahdr.id;
449   nmsgs = ahdr.nmsgs;
450   ufield = ahdr.ufield;
451
452   ComlibPrintf("[%d] unpack and insert all %d, %d\n", CkMyPe(), ufield, nmsgs);
453   
454   //Inserting a memory foot print may, change later
455   CmiChunkHeader *chdr= (CmiChunkHeader*)((char*)in - sizeof(CmiChunkHeader));
456
457   for(int count = 0; count < nmsgs; count++){
458       int *ref = 0;
459       int size = 0;
460       char *msg = 0;
461
462       UNPACK(int, size);
463       ref = (int *)t;
464       t += sizeof(int);
465
466       *ref = (int)((char *)(&chdr->ref) - (char *)ref);
467       chdr->ref ++;
468
469       ComlibPrintf("ref = %d, global_ref = %d\n", *ref, chdr->ref);
470
471       msg = t;
472       t += ALIGN8(size);
473       
474       InsertMsgs(npes, pelist, size, msg);
475   }  
476
477   CmiFree(in);
478   return ufield;
479 }
480
481 void PeTable :: GarbageCollect()
482 {
483 }
484