close
附上slideshare
http://www.slideshare.net/holmes310524/20131114-28272030
11/14
comment by CTC
page 5: parallel version時間有問題
確認使用的函式是否有限制
下方nvprof的結果時間跟上面的時間關聯為何?
下方時間加起來已經 > serial version =>這到底是有沒有問題
page 7: 確認每個SM存取global memory的bus memory width
page 9: img[offset]+=tmpSum 這邊是critical seciton
寫細一點(把動作切割開來),確認到底是R/W耗時間
測測看每個步驟的時間
確認是否有debugger/ profiler 可以看到每行的執行時間
- 還是忘記附上執行環境!
- 跟LSC拿計算AES部分的code,可能有類似問題的解法(據說是使用shared memory)
11/14
talked with YSH
1. 將LSC論文中的AES 加速部分 整理成投影片,12/09 拿來報告
2. 實驗室機器維護,要想辦法(11/15 學弟妹結論貌似是由YCL處理 再看看~)
3. LSC的知識傳承(!) 據說下週LSC會喬出時間傳授心法XD
全站熱搜
留言列表