오늘은 LEAF라는 library에 대해 소개하도록 하겠습니다. LEAF는 realistic한 benchmark dataset을 제공합니다. 링크는 다음과 같습니다.
LEAF
우선, library설명에 앞서 federated learning종류에 관해 살펴보도록 하겠습니다. federated learning은 크게 horizontal/vertical로 구분됩니다.
Figure 1. Categorization of Federated Learning. a) Horizontal federated learning.
Figure 2. Categorization of Federated Learning. b) Vertical federated learning.
개별 client가 가지는 mobile device data는 다르기 때문에, vertical federated learning이 좀 더 realistic setting이라는 생각이 듭니다.
다시 돌아와서, LEAF library가 가지는 dataset에 대해 설명하도록 하겠습니다. LEAF는 dataset을 호출하면 전처리 후 standardized format으로 변환시켜주는 역할을 합니다.
Figure3. Statistics of datasets in LEAF
Data Description in LEAF
LEAF는 총 5가지 데이터셋을 가지고 있습니다. 하나씩 살펴보도록 하겠습니다.
Federated Extended MNIST
Sentiment140
Shakespeare (The Complete Works of Wiliam Shakespeare)
CelebA