: 딥러닝 모델을 서로 다른 프레임워크 간에 서로 옮길 수 있도록 하는 오픈 소스 프로젝트
모델을 중간 계층 형식으로 변환하고 모델을 실행하는 데 필요한 라이브러리를 제공
다양한 플랫폼 환경(Java, JS, C, C#, C++)에서 환경에 제약 없이 구현된 ‘ML 모델’을 호출하고 수행하여 수행 결과값을 반환받는 것을 의미
ONNX Runtime 이란?
: ONNX 모델을 실행하기 위한 최적화된 런타임 환경을 제공하는 엔진
ONNX 사용 사례
ORT 형식, ONNX 경량화
: ‘축소된 크기’의 ONNX Runtime 빌드에서 지원하는 형식
ONNX runtime
https://github.com/microsoft/onnxruntime/tree/main/onnxruntime/python/tools/transformers/notebooks
tensorflow onnx tutorials
https://github.com/onnx/tensorflow-onnx/blob/main/tutorials/huggingface-bert.ipynb
추론을 위해 ONNX 사용하는 방법
https://huggingface.co/docs/diffusers/main/ko/optimization/onnx