연합 학습 (Federated Learning)이란?

이정민·2025년 8월 14일

지도학습, 비지도학습, 준지도학습은 들어봤지만 필자에게 연합학습은 생소하다.
연합학습이 무엇인지, 어떻게 사용되는지 알아보자.

연합학습의 등장 배경

AI 모델은 방대한 양의 데이터를 필요로 한다.
이러한 데이터 세트는 일반적으로 모델 훈련을 위해 하나의 위치에 중앙집중화 되어 있으며, 이로 인해 데이터 전송 또는 저장 중에 개인 식별 가능 정보 (PII)가 노출될 가능성이 있다.

연합 학습은 민감한 정보가 노드 내에 남아 있도록 하여 데이터 프라이버시를 보호하고 이러한 우려를 해소하는 데 도움이 된다. 또한 다양한 장치 또는 서버가 AI 모델의 개선에 기여하는 협업 학습이 가능하다.

							- IBM "연합학습이란 무엇인가요?
                            

연합학습의 정의

연합 학습은 머신러닝(ML) 모델을 훈련하는 분산형 접근 방식이다.
데이터를 중앙 서버에 모으지 않고, 각 기기나 서버에서 모델을 학습하고 파라미터만 공유하는 방식을 뜻하는 학습 구조이다.
이러한 학습 구조로 인하여 등장 배경에서 언급된 문제를 해결 할 수 있다.



연합학습의 작동 방식

연합 학습은 다음의 4가지 주요 단계로 구성된다.

- 초기화

- 로컬 훈련

- 글로벌 집계

- 반복

연합학습의 장점📈

1. 개인정보 보호

  • 각 클라이언트에서 수집된 데이터를 중앙 서버로 전송하지 않으므로 개인정보 보호에 우수한 성능을 보인다.


2. 대규모 데이터 다루기

  • 연합 학습은 대규모 데이터를 다룰 때 대역폭과 저장 용량 문제를 해결 할 수 있다.
    데이터를 로컬에서 처리하고 중앙 서버로 전송하는 것이 아니기 때문이다.


3. 분산 시스템에서의 사용

  • 연합 학습은 분산 시스템에서 사용할 수 있으므로, 여러 클라이언트에서 모델을 학습하고 결합할 수 있다.


4. 지속적인 학습

  • 연합 학습은 지속적인 학습을 가능하게 한다.
  • 모델을 로컬에서 학습하고, 중앙 서버로 업로드 하는 것을 반복함으로써 지속적인 모델 업데이트를 수행할 수 있다.


5. 분산된 데이터의 활용

  • 연합 학습은 분산된 데이터를 활용할 수 있다.
    분산된 여러 클라이언트에서 모델을 학습하고 결합함으로써, 전체 데이터셋을 활용하는 것과 비슷한 성능을 보인다.

연합학습의 단점📉

profile
아무 일도 없게 해주세요

0개의 댓글