vsAdd와 cblas_saxpy는 성능차이가 없다. vsAdd의 경우 R이 B와 다르면 시간이 5배로 오래 걸린다.
OpenCL Tools를 설치하면 된다.
oneAPI를 사용해서 모든 oneAPI를 설치하여 사용 하는 방법.
https://software.intel.com/content/www/us/en/develop/tools/oneapi.html
cpu_dpcpp_gpu_dpcpp 는 OpenCL 설치해야 실행이 가능함.
cpu_iomp (Intel OpenMP) 는 잘 됨.
cpu_vcomp(Visual Studio OpenMP) 도 잘 됨.
C:\Program Files (x86)\inteloneapi\compiler\2021.1-beta06\windows\redist\intel64_win\compiler
경로의 모든 파일이 정확한 위치에 빌드된 exe와 같이 있어야 함.
cpu_tbb는 tbb.dll이 있어야 함.
퍼포먼스 비교
lib: mkl_core_dll.lib
, mkl_intel_lp64_dll.lib
, mkl_intel_thread_dll.lib
가 필요하다.
dll: inteloneapi/<version>/redist/intel64
에 있는 dll중에 아래의 폴더 및 dll이 필요함.
1033