
tf.data.Datasetmap() : Dataset이 제공하는 원소를 처리해서 변환된 원소를 제공filter() : Dataset이 제공하는 원소중 특정 조건을 만족하는(True)인 원소들만 제공batch(size)shuffle(buffer크기) : dataset의 원소들의 순서를 섞음**repeat(count)** : 전체 데이터를 한번 다 제공한 뒤 다시 데이터를 제공tf.data.Dataset.from_tensor_slices() 함수를 사용하여 NumPy 배열이나 텐서를 데이터소스로 사용tf.data.TextLineDataset() 함수를 사용하여 텍스트 파일을 데이터소스로 사용a = t.numpy() → array([1., 2., 3.], dtype=float32)tf.constant(np.arange(10))tf.convert_to_tensor(a) → <tf.Tensor: shape=(3,), dtype=float32, numpy=array([1., 2., 3.], dtype=float32)>Dataset 생성
raw_data1 = np.arange(10)
raw_data1
→ array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
→ 대상 raw dataset이 메모리에 있는 ndarray일 경우
⇒ Raw dataset으로 부터 데이터를 읽어 들이는 기능을 제공하는 dataset 생성
dataset = tf.data.Dataset.from_tensor_slices(raw_data1)
print(type(dataset))
→ <class 'tensorflow.python.data.ops.from_tensor_slices_op._TensorSliceDataset'>
Dataset은 Iterable타입
⇒ 반환 : tf.Tensor 타입
# dataset[0]으로는 조회X
for data in det:
print(data)

for data in dataset.take(5):
print(data)
