Surrogate Model (대체 모델) 및 Active Learning 설명

jihyelee·2023년 12월 20일
0

Surrogate Model

  • metamodel, emulator, statistical model 등의 이름으로도 불림
  • 이름에서 힌트를 얻을 수 있듯이, surrogate model이란 실제 모델과 근사한 시뮬레이션 결과를 도출하는 모델
    • sensitivity analysis, optimizations, risk analysis 등은 대표적으로 많은 수의 시뮬레이션을 돌려봐야 분석이 가능한 항목들인데, 이러한 시뮬레이션을 다 돌리면 너무 비싸고 비효율적
    • surrogate model을 만들어서 시뮬레이션 output을 근사
    • 이를 통해 저렴하고 효율적으로 시뮬레이션 결과를 도출
  • 이는 데이터에 기반한 접근방식이며, 특별한 형태의 supervised learning (지도학습)
    • "training data is obtained via probing the simulation outputs at several intelligently selected locations in the design parameter space. At each of these locations, a full simulation is conducted to calculate the corresponding simulation output."
    • 실제 모델을 잘 설명할 수 있는 몇몇 지점을 선택해 전체 시뮬레이션을 돌리고, 실제 모델의 시뮬레이션 결과와 통계적으로 유사한 결과를 근사할 수 있도록 대체 모델을 학습

Active Learning

  • 훈련할 때 계속해서 훈련 데이터셋을 개선하고 증가시키는 과정
  • 기계가 학습할 때 사람에게 적극적으로 특정 데이터셋에 대한 라벨링(=정답)을 요구하는 것을 의미
    • "기계가 라벨링이 필요한 데이터 중 자동적으로, 점진적으로 가장 정보량이 많은 데이터를 선택하는 것을 목표로 한다. 라벨링이 이루어지지 않은 데이터 중 학습에 중요한 것들에 대해 기계가 human labelling(=사람이 정답을 알려주는 것)을 요구한다. 정보량이 풍부한 데이터를 이용해 학습 진행 및 데이터를 요구하는 사이클을 통해 모델은 점차 고도화된다." (link2)

관련 링크 (link1, link2)

profile
Graduate student at Seoul National University, majoring in Artificial Intelligence (NLP). Currently AI Researcher at LG CNS AI Lab

0개의 댓글