AutoMine++

1.[AutoMine++] #0. 프로젝트 개요: 밑바닥을 뚫고 지하실로!

post-thumbnail

2.[AutoMine++] #1. GPGPU 프로그래밍 첫걸음: 행렬 덧셈 구현

post-thumbnail

3.[AutoMine++] #2. 행렬 곱셈 구현 시행착오

post-thumbnail

4.[AutoMine++] #3. 파이썬 포팅 & 벤치마크 with NumPy

post-thumbnail

5.[AutoMine++] #4. 행렬 곱셈 로직 개선 (1): 레지스터를 써보자

post-thumbnail

6.[AutoMine++] #5. 행렬 곱셈 로직 개선 (2): USM / 벡터화 / 더블 버퍼링

post-thumbnail

7.[AutoMine++] #6. 행렬 곱셈 로직 개선 (3): 벤치마크 with MKL (gemm)

post-thumbnail

8.[AutoMine++] #7. 행렬 곱셈 로직 개선 (4): 직사각형 타일링 / 세부 조정

post-thumbnail

9.[AutoMine++] #8. im2col, col2im 개선 (마지막 편)

post-thumbnail