728x90 전체 글113 CUDA에서 구현시 생각해야 할 것 [출처 : http://eaglface.blogspot.kr/2008/06/cuda.html] 1) global memory access 알고리즘에 따라 메모리에 접근하는 방법이 다를 텐데, CUDA에서는 global memory에 Random access를 할 경우 성능이 무지하게 저하되어 버린다. global memory를 쓰려면 Coalesced access를 할 필요가 있는데, 이게 조건이 상당히 까다롭네. 뭐 물론 익숙해지면 여러가지 방법을 쓸 수 있겠지만, 일단 아직 익숙치가 않다. 흑... 2) shared memory access shared memory는 global memory 보다 무지하게 빠르므로 최대한 이용할 수 있도록 한다. 레지스터 보다는 좀 느린 것 같긴 한데, 그래도 충분히.. 2013. 2. 20. 이전 1 ··· 26 27 28 29 다음 728x90