이번 시간 부터 vitis - ai를 공부하게 되었는데 이를 정리해보고자 함.
근데 저작권이 있으므로 대충 정리할 예정
개발 플랫폼 AMD의 FPGA board, 가속기에 AI 인퍼런스를 가능하게 해주는 것
라이브러리 pytorch, Tensorflow, onnx를 학습 시키면서 가능하게 해줌.
FP32 - Quantization(양자화) - neural.network <-적은 메모리의 bandwitdh
컴파일 이후 PPV에서 모델을 돌리게 된다.
여기서 우리가 사용하는 Quantization은
32bit - FP weights를 fixed INT8로 바꿔주어 속도, bandwitdh, 효율을 높여준다.
AI모델을 DPU instructions로 변환시켜준다.
System on Module