AWS Neuron SDK
을 통해 AWS inf1 chip이 지원하는 neural network operators을 실행할 수 있다.AWS Neuron SDK
을 통한 연산이 아니라면 CPU를 사용하게 된다.즉 Inf1을 잘 사용하기 위해서는 모델 추론 부분이 무조건
AWS Neuron SDK
을 활용한 형태이여야 한다.
>20%
이다. —-batch_size
파라메터 model compile시 지정함)—-num-neuroncores
파라메터 model compile 시에 지정함)Inf1을 잘 사용하기 위해서는 모델 추론 부분이 무조건
AWS Neuron SDK
을 활용한 형태이여야 한다.
AWS에서는 tensorflow, pytorch와 같은 library에 AWS Neuron SDK
를 적용하여 tensorflow.neuron(tfn)이라는 것을 개발했다.
기존 코드에서 tensorflow.neuron 을 추가해주고 간단한 작업을 몇번 거치면 기존의 tensorflow모델에 AWS Neuron SDK
를 적용할 수 있다.
예제 코드 (코드 복붙 해온 AWS 공식 사이트)
import tensorflow as tf
import tensorflow.neuron as tfn
input0 = tf.keras.layers.Input(3)
dense0 = tf.keras.layers.Dense(3)(input0)
model = tf.keras.Model(inputs=[input0], outputs=[dense0])
example_inputs = tf.random.uniform([1, 3])
### 이부분에서 바꿔줌
model_neuron = tfn.trace(model, example_inputs) # trace
model_dir = './model_neuron'
model_neuron.save(model_dir)
model_neuron_reloaded = tf.keras.models.load_model(model_dir)