TFLite + XNNPACK이 int8 연산에서도 가속화를 지원하기 시작함 (21.09.09)
모델 | ImageNet top-1 | Rpi 3b+ |
---|---|---|
Efficinetnetlite-b0-float32 | 75.1% | 135.2ms |
Efficinetnetlite-b0-int8 | 74.4% | 82.7ms |
MobileNet_v1_float32 | 71.0% | 134.4ms |
MobileNet_v1_int8 | 70.0% | 77.0ms |
MobileNet_v2_float32 | 71.8% | 95.7ms |
MobileNet_v2_int8 | 70.8% | 70.5ms |
on-device AI에서 Int8 Quantize는 이제 필수 조건