close

附上slideshare

http://www.slideshare.net/holmes310524/20131114-28272030

 

11/14

comment by CTC

page 5: parallel version時間有問題

確認使用的函式是否有限制

下方nvprof的結果時間跟上面的時間關聯為何?

下方時間加起來已經 > serial version  =>這到底是有沒有問題

 

page 7: 確認每個SM存取global memory的bus memory width

 

page 9:  img[offset]+=tmpSum 這邊是critical seciton

寫細一點(把動作切割開來),確認到底是R/W耗時間

測測看每個步驟的時間

確認是否有debugger/ profiler 可以看到每行的執行時間

 

  • 還是忘記附上執行環境!
  • 跟LSC拿計算AES部分的code,可能有類似問題的解法(據說是使用shared memory)

 

11/14 

talked with YSH

1. 將LSC論文中的AES 加速部分 整理成投影片,12/09 拿來報告

2. 實驗室機器維護,要想辦法(11/15 學弟妹結論貌似是由YCL處理  再看看~)

3. LSC的知識傳承(!) 據說下週LSC會喬出時間傳授心法XD

arrow
arrow
    全站熱搜

    holmes310524 發表在 痞客邦 留言(0) 人氣()