Motivation
- IoT λλ°μ΄μ€λ μ£μ§ μλ²μ λ³΄ν΅ μ μ λ ₯ 무μ λ€νΈμν¬λ‘ μ°κ²°λμ΄ μμ΅λλ€.
- κ·Έλ κΈ°μ, μΆλ‘ μ νλλ₯Ό μ μ§νλ©΄μ μ΄λ―Έμ§λ₯Ό μμΆνμ¬ μ μ‘νλ κ²μ΄ μ€μν©λλ€.
- λν μ΄λ° μμ€ν
μ μ’
μ’
νμ§ κ΄λ¦¬ μΉ΄λ©λΌλ κ²½λΉ μμ€ν
κ³Ό κ°μ΄ μκ°μ μ μ½μ μꡬν©λλ€.
Requirements
λ³Έ λ
Όλ¬Έμμλ λ€νΈμν¬κ° νμ©νλ λ°μ΄ν° μ μ‘λμ κ³ λ €νμ¬ λΆλ₯ μ±λ₯μ μ΅μ ννλ "open-loop" μ루μ
μ μ§μ€ν©λλ€.
- Classification Accuracy: μ΄λ―Έμ§ μ¬κ΅¬μ±μ΄ μλ λΆλ₯ μ νλλ₯Ό λͺ©νλ‘ ν΄μΌν©λλ€.
- Encoding Efficiency: μ΄λ―Έμ§λ₯Ό μμΆν λ, 리μμ€ μ μ½ μ‘°κ±΄μ κ³ λ €νμ¬ μ΅μνμ κ³μ° μ€λ²ν€λκ° λ°μν΄μΌ ν©λλ€.
- Adaptation to different deadlines and varying bandwidth
: λμνμ΄ κ°μνλ μν©μμ μ°μν μ±λ₯ μ νλ₯Ό λ¬μ±νλ©΄μ λ§κ° κΈ°νκΉμ§ λ λ§μ λ°μ΄ν°λ₯Ό μμ ν μλ‘ λΆλ₯ μ νλκ° ν₯μλμ΄μΌ ν©λλ€.
- μ΄λ―Έμ§ μνμ€ xiβλ Tμ΄λ§λ€ μ°νλλ€.
On-device Encoding
- μΈμ½λ fΞΈβλ μ΄λ―Έμ§ xiβλ₯Ό μμΆνμ¬ λ²‘ν° ziβλ‘ λ³νν©λλ€.
- μΈμ½λ© μ§μ°μ tifβλ‘ μ μλ©λλ€.
Network Offloading
- λ€μ μ΄λ―Έμ§κ° μΈμ½λ©λ λκΉμ§ κ³μ μ΄λ―Έμ§λ₯Ό λ³΄λΌ μ μλ€λ©΄, λ°λλΌμΈ diβ=tiβ+T+tifβκΉμ§ ziβλ₯Ό μ μ‘ν μ μμ΅λλ€.
- λ€νΈμν¬ λμν b(t)μ λν΄ λ°λλΌμΈκΉμ§ λ³΄λΌ μ μλ μ΄λμ Siβ=β«tiβ+tifβtiβ+T+tifββb(t)dtλ‘ κ³μ°λ©λλ€.
- λ°λΌμ, μ€μ μ μ‘λλ λ°μ΄ν° z~iβλ λ€μκ³Ό κ°μ΄ λνλ©λλ€.
z~iβ={ziβ,truncate(ziβ,Siβ),βifΒ size(ziβ)β€Siβ,otherwise.β(1)
Decoding and Classification
- λμ½λ gΟβλ z~iβλ₯Ό μ
λ ₯μΌλ‘ λ°μ yiβλ₯Ό μΆλ ₯ν©λλ€.
- hκ° λΆλ₯κΈ°μ΄κ³ , λΆλ₯ κ²°κ³Όκ³Ό aiβ=h(yiβ)=h(gΟβ(z~iβ))λΌλ©΄, μΆλ‘ μ νλ Rμ ground truth gtiβμ λν΄ λ€μκ³Ό κ°μ΄ μ μλ©λλ€.
R(aiβ,gtiβ)={1,0,βΒ ifΒ gtiββ{nΒ mostΒ likelyΒ predictions},Β ifΒ gtiββ/β{nΒ mostΒ likelyΒ predictions}.β(2)
Objectives
κ°λ³ λμν b(t)μ Tdβμ μν΄ λΆκ³Όλλ λ°λλΌμΈ μ μ½ μ‘°κ±΄ νμμ μ νλλ₯Ό μ΅λννλ μΈμ½λ λ° λμ½λμ νμ΅ κ°λ₯ν νλΌλ―Έν°, ΞΈ λ° Ολ₯Ό μ΅μ ννλ κ²μ
λλ€.
- μΈμ½λλ λΆλ₯λ₯Ό μν μ€μν νΉμ§μ μΊ‘μ²νκ³ κ°μ₯ μ€μν νΉμ§μ λ¨Όμ μ μ‘ν λ€μ λ μ€μν νΉμ§μ μ μ‘ν΄μΌ ν©λλ€.
- λμ½λλ μλ²μ λμ°©νλ λΆμμ ν λ°μ΄ν°λ₯Ό μ²λ¦¬νκ³ μμ λ λ°μ΄ν° μμ κ³ λ €νμ¬ μ΅μμ λΆλ₯ μ νλλ₯Ό λ¬μ±ν΄μΌ ν©λλ€.
Design of PNC

Multi-objective Neural Compression
- κ³ μ λ ν¬κΈ°μ zλ₯Ό κ°μ ν λ, λͺ©νλ λ€μμ λ§μ‘±νλ ΞΈμ Ολ₯Ό μ°Ύλ κ²μ
λλ€.
ΞΈ,Ο=argΞΈ,ΟminβL(ΞΈ,Ο)(3)
- μ¬κΈ°μμ L(ΞΈ,Ο)μ μ΄λ―Έμ§ μ¬κ΅¬μ±μ λν μμ€ν¨μλ₯Ό μλ―Έν©λλ€.
- κ·Έλ¬λ, μ΄λ κ³ μ λ ν¬κΈ°μ zλ₯Ό κ°μ νμ λμ΄λ―λ‘, μ°λ¦¬λ λ€λ₯Έ λͺ©μ ν¨μλ₯Ό μ¬μ©ν΄μΌ ν©λλ€.
- λ§μ½ Kβ€Mκ° μ±λλ§ μμ νλ€λ©΄, λ€μκ³Ό κ°μ λͺ©νλ₯Ό μΈμΈ μ μμ΅λλ€.
L(ΞΈ,Ο,K)=l(x,gΟβ(Concat[z[1:K]β;0]))(4)
- μ¬κΈ°μ κ°λ₯ν Kλ₯Ό λͺ¨λ κ³ λ €νλ€λ©΄ λ€μκ³Ό κ°μ multi-objective μ΅μ ν λ¬Έμ λ₯Ό μ μν μ μμ΅λλ€.
ΞΈ,ΟminβExβΌXβ[L(ΞΈ,Ο;1),L(ΞΈ,Ο;2),β¦,L(ΞΈ,Ο;M)](5)
- κ·Έλ¬λ μ¬κΈ°μ closed-form ν΄λ μμ΅λλ€.
- λ°λΌμ λ€μν bottleneck μ°¨μ κ°μ trade-offλ₯Ό κ³ λ €νμ¬ κ°λ₯ν ν Pareto frontierμ κ°κΉμ΄ ν΄λ₯Ό μ°ΎμμΌ ν©λλ€.
- μ΄λ μ΅κ·Ό μ°κ΅¬μμ μ μλ "stochastic taildrop regularization"μ μ¬μ©νμ¬ ν΄κ²°ν μ μμ΅λλ€.

Two-stage Offline Training
-
Unsupervised pretraining for image reconstruction
L(ΞΈ,Ο,K)=β₯xβgΟβ(Concat[fΞΈβ(x)1:Kβ;0])β₯2(6)
μ΄ μκΈ°μ§λ νμ΅λ¨κ³λ AE νλΌλ―Έν° ΞΈ,Οκ° μ μ¬μ μΈ λμ λ¨Έμ λ¬λ(ML) μλΉμ€μ μ μν μ μλ μΌλ°ν κ°λ₯ν μνλ‘ μ€λΉν©λλ€.
-
Knowledge Distillation for Inference
L(ΞΈ,Ο,K)=CE(h(x),h(gΟβ(Concat[fΞΈβ(x)[1:K]β;0])))(7)
μ§μ μ¦λ₯ λμ, μλΉμ€ λͺ¨λΈ h(x)λ νλΌλ―Έν°κ° κ³ μ λ λΈλ λ°μ€λ‘ μ·¨κΈλλ©°, AE νλΌλ―Έν°μΈ ΞΈμ Ολ§ μ
λ°μ΄νΈλ©λλ€.
Quantization and Huffman Coding
μΆκ°μ μΈ z μμΆμ μν΄, PNCλ λ€μκ³Ό κ°μ λ κ°μ§ λ°©λ²μ μ¬μ©ν©λλ€.
- Quantization
- Model Quantization: PNCλ λͺ¨λΈ νλΌλ―Έν°λ₯Ό μμννμ¬ λͺ¨λΈ ν¬κΈ°λ₯Ό μ€μ
λλ€.
- Feature Quantization: PNCλ λ°μ΄ν°μ 0~255 κ°μ 64κ°μ κ°μΌλ‘ μμνν©λλ€. μ΄λ λ°μ΄ν° ν¬κΈ°λ₯Ό 3/4λ‘ μ€μ
λλ€.
μ¬κΈ°κΉμ§ μ§ννλ©΄ 224x224μ μ΄λ―Έμ§κ° μ½ 0.75KBλ‘ μμΆλλ©°, ννλ§ μ½λ©μ ν΅ν΄ λ μμ ν¬κΈ°λ‘ μμΆν μ μμ΅λλ€.
- Huffman Coding
- PNCλ λ°νμμ μμνλ λ°μ΄ν°λ₯Ό μΆκ°λ‘ μμΆνκΈ° μν΄ ννλ§ μ½λ©μ μ¬μ©ν©λλ€.
- μ΄λ λ°μ΄ν°μ λΉλμ λ°λΌ κ°λ³ κΈΈμ΄ μ½λλ₯Ό ν λΉνμ¬ μμΆ ν¨μ¨μ λμ
λλ€.
Progressive Property of PNC

Image Offloading Architecture

Evaluation
