Fixed a memory leak and a added some other code optimizations.
[charm.git] / src / conv-com / petable.C
1 /*****************************************************************************
2  * $Source$
3  * $Author$
4  * $Date$
5  * $Revision$
6  *****************************************************************************/
7
8 /*********************************************
9  * File : petable.C
10  *
11  * Author: Krishnan V
12  *
13  * The message buffer
14  *********************************************/
15 #include <string.h>
16 #include <stdlib.h>
17 #include <converse.h>
18 #include "comlib.h"
19 #include "petable.h"
20 #include "converse.h"
21
22 #define BIGBUFFERSIZE 65536
23 #define PTPREALLOC    100
24
25 struct AllToAllHdr{
26     char dummy[CmiReservedHeaderSize];
27     int refno;
28     comID id;
29     int ufield;
30     int nmsgs;
31 };
32
33
34 /**************************************************************
35  * Preallocated memory=P*MSGQLEN ptr + 2P ints + 1000 ptrs
36  **************************************************************/
37 PeTable :: PeTable(int n)
38 {
39   NumPes=n;
40   magic=0;
41   PeList = (PTinfo ***)CmiAlloc(sizeof(PTinfo *)*NumPes);
42   //  ComlibPrintf("Pelist[%d][%d]\n", NumPes, MSGQLEN);
43   msgnum=new int[NumPes];
44   MaxSize=new int[NumPes];
45   for (int i=0;i<NumPes;i++) {
46         msgnum[i]=0;
47         MaxSize[i]=MSGQLEN;
48         PeList[i]=(PTinfo **)CmiAlloc(sizeof(PTinfo *)*MSGQLEN);
49         for (int j=0;j<MSGQLEN;j++) PeList[i][j]=0;
50   }
51
52   //ptrlist=(PTinfo **)CmiAlloc(1000*sizeof(PTinfo *));
53   //  FreeList= new GList;
54   //CombBuffer=(char *)CmiAlloc(BIGBUFFERSIZE);
55
56   PTFreeList=NULL;
57 }
58
59 PeTable :: ~PeTable()
60 {
61   int i;
62   for (i=0;i<NumPes;i++) CmiFree(PeList[i]);
63   CmiFree(PeList);
64   delete msgnum;
65   delete MaxSize;
66   GarbageCollect();
67   //CmiFree(ptrlist);
68   PTinfo *tmp;
69   while (PTFreeList) {
70         tmp=PTFreeList;
71         PTFreeList=tmp->next;
72         CmiFree(tmp);
73   }
74  // delete FreeList;
75
76 }
77
78 void PeTable:: Purge()
79 {
80   for (int i=0; i<NumPes;i++) {
81         if (msgnum[i]) {
82             // ComlibPrintf("%d Warning: %d Undelivered Messages for %d\n", CkMyPe(), msgnum[i], i);
83           //msgnum[i]=0;
84         }
85   }
86   GarbageCollect();
87   //  ComlibPrintf("combcount = %d\n", combcount);
88   //combcount = 0;
89 }
90
91 void PeTable :: ExtractAndDeliverLocalMsgs(int index)
92 {
93   int j;
94   msgstruct m;
95
96   ComlibPrintf("%d:Delivering %d local messages\n", CkMyPe(), msgnum[index]);
97   for (j=msgnum[index]-1;(j>=0);j--) {
98
99         m.msgsize=PeList[index][j]->msgsize;
100         m.msg=PeList[index][j]->msg;
101
102         if (--(PeList[index][j]->refCount) <=0) {
103             CmiSyncSendAndFree(CkMyPe()/*index*/, m.msgsize, (char*)m.msg);
104             PTFREE(PeList[index][j]);
105         }
106         else {
107             CmiSyncSend(CkMyPe()/*index*/, m.msgsize, (char*)m.msg);
108         }
109         PeList[index][j]=NULL;
110   }
111   msgnum[index]=j+1;
112
113   return;
114 }
115
116
117 #undef PACK
118 #undef PACKMSG
119 #define PACKINT(data) {((int*)t)[0] = data; t+=sizeof(int);}
120 #define PACK(type,data) {junk=(char *)&(data); memcpy(t, junk, sizeof(type)); t+=sizeof(type);}
121 #define PACKMSG(data, size) { memcpy(p+msg_offset, (data), size); msg_offset += size; }
122
123 /*Used for all to all multicast operations.  Assumes that each message
124   is destined to all the processors, to speed up all to all
125   substantially --Sameer 09/03/03 
126   
127   Protocol:
128   |ref|comid|ufield|nmsgs|size|ref|msg1|size2|ref2|msg2|....
129 */
130
131 char * PeTable ::ExtractAndPackAll(comID id, int ufield, int *length)
132 {
133     int nmsgs = 0, i, j;
134     int index = 0;
135
136     ComlibPrintf("[%d] In Extract And Pack All\n", CkMyPe());
137
138     //Increment magic to detect duplicate messages
139     magic++;
140
141     register int total_msg_size = 0;
142
143     //first compute size
144     for (i=0;i<NumPes;i++) {
145         index = i;
146         for (j=msgnum[index]-1; (j>=0); j--) {
147             if (PeList[index][j]->magic != magic) {                
148                 total_msg_size += ALIGN8(PeList[index][j]->msgsize);
149                 total_msg_size += 2 * sizeof(int);
150                 PeList[index][j]->magic=magic;
151
152                 nmsgs ++;
153             }            
154         }
155     }
156     
157     total_msg_size += ALIGN8(sizeof(AllToAllHdr));
158
159     ComlibPrintf("[%d] Message Size %d, nmsgs %d **%d**\n", CkMyPe(), total_msg_size, nmsgs, sizeof(AllToAllHdr));
160     
161     //poiter to the combined message, UGLY NAME
162     char *p = (char *) CmiAlloc(total_msg_size * sizeof(char));    
163
164     ComlibPrintf("After cmialloc\n");
165
166     //buffer to copy stuff into
167     char *t = p; 
168     char *junk = NULL;
169     
170     int dummy = 0;
171     
172     int refno = 0;
173
174     AllToAllHdr ahdr;
175     ahdr.refno = refno;
176     ahdr.id = id;
177     ahdr.ufield = ufield;
178     ahdr.nmsgs = nmsgs;
179
180     /*
181       PACKINT(refno);    
182       PACK(comID, id);
183       
184       PACKINT(ufield);
185       PACKINT(nmsgs);
186       //    PACKINT(dummy); //Aligning to 8 bytes
187     */
188
189     PACK(AllToAllHdr, ahdr);   
190
191     int msg_offset = ALIGN8(sizeof(AllToAllHdr));
192     
193     //Increment magic again for creating the message
194     magic++;
195     for (i=0;i<NumPes;i++) {
196         index=i;
197         int ref = 0;
198         int size;
199
200         for (j=msgnum[index]-1; (j>=0); j--) {
201             //Check if it is a duplicate
202             if (PeList[index][j]->magic != magic) {                
203                 size = PeList[index][j]->msgsize;
204                 PACKMSG(&size, sizeof(int));
205                 PACKMSG(&ref, sizeof(int));
206                 PeList[index][j]->magic=magic;
207                 PACKMSG(PeList[index][j]->msg, size);
208
209                 msg_offset = ALIGN8(msg_offset);
210             }
211
212             //Free it when all the processors have gotten rid of it
213             if (--(PeList[index][j]->refCount) <=0) {
214                 ComlibPrintf("before cmifree \n");
215                 CmiFree(PeList[index][j]->msg);   
216                 ComlibPrintf("after cmifree \n");
217
218                 PTFREE(PeList[index][j]);
219             }
220             //Assign the current processors message pointer to NULL
221             PeList[index][j] = NULL;
222         }
223         msgnum[index] = 0;
224     }
225     
226     *length = total_msg_size;
227     return p;
228 }
229
230 char * PeTable ::ExtractAndPack(comID id, int ufield, int npe, 
231                                 int *pelist, int *length)
232 {
233     char *junk;
234     int nummsgs, offset, num_distinctmsgs;
235     
236     ComlibPrintf("In ExtractAndPack %d\n", npe); 
237     
238     int tot_msgsize=TotalMsgSize(npe, pelist, &nummsgs, &num_distinctmsgs);
239     if (tot_msgsize ==0) {
240         *length=0;
241         
242         ComlibPrintf("Returning NULL\n");
243         return(NULL);
244     }
245     
246     int msg_offset = CmiReservedHeaderSize + sizeof(comID) 
247         + (npe + 4 + nummsgs) * sizeof(int);  
248
249     msg_offset = ALIGN8(msg_offset);
250     
251     *length = tot_msgsize;
252     *length += msg_offset;
253     char *p;
254     p=(char *)CmiAlloc(*length);
255
256     char *t = p + CmiReservedHeaderSize;
257     int i, j;
258     if (!p) CmiAbort("Big time problem\n");
259     magic++;
260
261     int refno = id.refno;    
262
263     PACKINT(refno);
264     PACK(comID, id);
265     PACKINT(ufield);
266     PACKINT(npe);
267     
268     int lesspe=0;
269     int npacked = 0;
270     for (i=0;i<npe;i++) {
271         int index=pelist[i];
272
273         if (msgnum[index]<=0) {
274             lesspe++;
275             continue;
276         }
277         
278         //ComlibPrintf("%d Packing pelist[%d]\n", CkMyPe(), i);
279         register int newval=-1*pelist[i];
280         PACKINT(newval); 
281         for (j=0;j<msgnum[index];j++) {
282             if (PeList[index][j]->magic == magic) {
283                 offset=(PeList[index][j]->offset);
284             }
285             else {
286                 npacked ++;
287                 
288                 offset=msg_offset;
289                 PeList[index][j]->magic=magic;
290                 PeList[index][j]->offset=msg_offset;
291                 PTinfo *tempmsg=PeList[index][j];
292                 
293                 CmiChunkHeader hdr;
294                 hdr.size = tempmsg->msgsize;
295                 hdr.ref = -1;
296                 PACKMSG(&hdr, sizeof(CmiChunkHeader));
297                 PACKMSG(tempmsg->msg, tempmsg->msgsize);
298
299                 msg_offset = ALIGN8(msg_offset);
300             }
301             
302             //ComlibPrintf("%d Packing msg_offset=%d\n", CkMyPe(), offset);
303             PACKINT(offset); 
304
305             if (--(PeList[index][j]->refCount) <=0) {
306                 CmiFree(PeList[index][j]->msg);
307                 
308                 PTFREE(PeList[index][j]);
309             }
310             PeList[index][j]=NULL;
311         }
312         msgnum[index]=0;
313     }
314     offset=-1;
315     PACKINT(offset);
316     
317     if (lesspe) {
318         t=p+CmiReservedHeaderSize+2*sizeof(int) + sizeof(comID);
319         npe=npe-lesspe;
320         PACK(int, npe);
321     }
322
323     return(p);
324
325
326 #undef UNPACK
327 #define UNPACK(type,data) {junk=(char *)&(data); memcpy(junk, t, sizeof(type));t+=sizeof(type);}
328 #undef UNPACKMSG
329 #define UNPACKMSG(dest,src, size) { memcpy(dest, src, size); offset += size;}
330
331 int PeTable :: UnpackAndInsert(void *in)
332 {
333   char *junk;
334   char *t =(char *)in + CmiReservedHeaderSize;
335   int i, ufield, npe, pe, tot_msgsize, ptrlistindex=0;
336   comID id;
337   int refno = 0;
338
339   UNPACK(int, refno);
340   
341   //ComlibPrintf("%d UnPacking id\n", CkMyPe());
342   UNPACK(comID, id);
343   UNPACK(int, ufield);
344   UNPACK(int, npe);
345   
346   register int offset;
347   for (i=0;i<npe;i++) {
348         UNPACK(int, pe);
349         pe *= -1;
350
351         UNPACK(int, offset);
352         while (offset > 0) {
353             int tempmsgsize;
354             UNPACKMSG(&(tempmsgsize), (char *)in+offset, sizeof(int));
355             int ptr;
356             UNPACKMSG(&ptr, (char *)in+offset, sizeof(int));
357
358             if (ptr >=0 )  {
359                 if (msgnum[pe] >= MaxSize[pe]) {
360                     REALLOC(PeList[pe], MaxSize[pe]);
361                     MaxSize[pe] *= 2;
362                 }
363                 PeList[pe][msgnum[pe]]=ptrvec[ptr];
364                 (ptrvec[ptr])->refCount++;
365                 msgnum[pe]++;
366
367                 UNPACK(int, offset);
368                 continue;
369             }
370             
371             PTinfo *temp;
372             PTALLOC(temp);
373             temp->msgsize=tempmsgsize;
374             temp->refCount=1;
375             temp->magic=0;
376             temp->offset=0;
377
378             ptrvec.insert(ptrlistindex, temp);
379             memcpy((char *)in+offset-sizeof(int), &ptrlistindex, sizeof(int));
380
381             ptrlistindex++;
382             temp->msg=(void *)((char *)in+offset);
383             if (msgnum[pe] >= MaxSize[pe]) {
384
385                 REALLOC(PeList[pe], MaxSize[pe]);
386                 MaxSize[pe] *= 2;
387             }
388             PeList[pe][msgnum[pe]]=temp;
389             msgnum[pe]++;
390             UNPACK(int, offset);
391         }
392         t -=sizeof(int);
393   }
394   *(int *)((char *)in -sizeof(int))=ptrlistindex; 
395   
396   if (ptrlistindex==0)
397       CmiFree(in);
398   
399   for (i=0;i<ptrlistindex;i++) {
400       char * actualmsg=(char *)(ptrvec[i]->msg);
401       int *rc=(int *)(actualmsg-sizeof(int));
402       *rc=(int)((char *)in-actualmsg);
403       //ComlibPrintf("I am inserting %d\n", *rc);
404   }
405   
406   return(ufield);
407 }
408
409 /* Unpack and insert an all to all message, the router provides the
410    list of processors to insert into.
411    Same protocol as mentioned earlier.
412 */
413
414 int PeTable :: UnpackAndInsertAll(void *in, int npes, int *pelist){
415   char *junk;
416   char *t =(char *)in /*+CmiReservedHeaderSize*/;
417   int i,  
418       ufield,   // user field or ths stage of the iteration 
419       nmsgs,    // number of messages in combo message
420       refno,    // reference number
421       dummy;    // alignment dummy
422   
423   comID id;
424
425   /*
426     UNPACK(int, refno);      
427     UNPACK(comID, id);
428     
429     UNPACK(int, ufield);
430     UNPACK(int, nmsgs);
431     //UNPACK(int, dummy);
432     int header_size = sizeof(comID) + CmiReservedHeaderSize + 3 *sizeof(int);
433     if(header_size % 8 != 0)
434     t+= 8 - header_size % 8;
435   */
436
437   AllToAllHdr ahdr;
438   UNPACK(AllToAllHdr, ahdr);
439
440   if(sizeof(AllToAllHdr) % 8 != 0)
441       t += 8 - sizeof(AllToAllHdr) % 8;
442
443   refno = ahdr.refno;
444   id = ahdr.id;
445   nmsgs = ahdr.nmsgs;
446   ufield = ahdr.ufield;
447
448   ComlibPrintf("[%d] unpack and insert all %d, %d\n", CkMyPe(), ufield, nmsgs);
449   
450   //Inserting a memory foot print may, change later
451   CmiChunkHeader *chdr= (CmiChunkHeader*)((char*)in - sizeof(CmiChunkHeader));
452
453   for(int count = 0; count < nmsgs; count++){
454       int *ref = 0;
455       int size = 0;
456       char *msg = 0;
457
458       UNPACK(int, size);
459       ref = (int *)t;
460       t += sizeof(int);
461
462       *ref = (int)((char *)(&chdr->ref) - (char *)ref);
463       chdr->ref ++;
464
465       ComlibPrintf("ref = %d, global_ref = %d\n", *ref, chdr->ref);
466
467       msg = t;
468       t += ALIGN8(size);
469       
470       InsertMsgs(npes, pelist, size, msg);
471   }  
472
473   CmiFree(in);
474   return ufield;
475 }
476
477 void PeTable :: GarbageCollect()
478 {
479 }
480