Interpretable Machine Learning:
A Guide for Making Black Box Models Explainable (2nd ed.)을 읽고 정리한 내용입니다.
인공지능을 이해하기 위해서 기계 학습에서의 주요 용어들을 정리하겠습니다
알고리즘은 기계가 특정한 목표를 달성하기 위해 따르는 규칙의 집합을 의미합니다. 입출력 및 입력에서 출력에 이르기까지 필요한 모든 단계를 정의하는 레시피라고 할 수 있습니다.
알고리즘을 요리에 비유하여 표현하면, 재료를 '입력'으로 한다면 요리된 음식은 '출력'으로 비유할 수 있으며, 재료를 다듬고 이를 조리하는 각 단계에 대한 설명인 레시피 자체를 '알고리즘'이라고 할 수 있습니다.
기계 학습은 인공지능이 데이터를 통해 학습하여 예측할 수 있도록 하는 일련의 방법을 의미합니다. 기계 학습은 즉 컴퓨터에 모든 명령어를 명시적으로 입력해야 하는 '일반적인 프로그래밍'에서 컴퓨터에 데이터만 부여하는 방법을 통해 이루어지는 '간접 프로그래밍'으로의 패러다임 전환이라고 할 수 있습니다.
학습자(Learner) 혹은 기계학습 알고리즘은 데이터로부터 기계학습 모델을 배우는데 사용하는 프로그램입니다. 다른 이름으로 '유도기(Inducer)'라고도 부릅니다.
기계학습 모델은 입력에 따른 결과를 예측하여 나타내는 학습된 프로그램입니다. 모델의 특성에 따라 예측하는 문제에 대한 모델의 경우 '예측기(Predictor)', 분류하는 모델의 경우 '분류기(Classifier)', 회귀 모델의 경우 '회귀 모델(Regression Model)'이라고 합니다.
공식에서 기계학습 모델은 또는 로 표현합니다.
위의 그림처럼 학습자(Learner)에 특성 와 해당 에 대한 답인 타겟 를 입력하여 학습시키면 모델(Model)이 완성되며, 이후 학습된 모델에 새로운 를 입력하게 되면 예상되는 결과인 가 출력되게 됩니다.
블랙박스 모델은 동작 원리가 밝혀지지 않은 시스템을 말합니다. 기계학습에서 블랙박스는 인공신경망(Neural Network)와 같은 모델의 매개변수를 보면 이해할 수 없는 모델을 주로 말합니다.
블랙박스와 반대되는 개념으로 화이트박스(White Box)가 있는데 여기서는 이를 해석 가능 모델(Interpretable Model)이라 칭하겠습니다. 해석력을 위한 모델 불특정법(Model-Agnostic) 기계학습 모델 또한 해석이 가능하다고 하더라도 블랙박스로 취급됩니다.
해석가능한 기계학습은 기계학습 모델의 행동과 예측 결과를 인간이 이해할 수 있게 만들어주는 방법론과 모델을 의미합니다.
위의 그림처럼 '왜 이와 같은 예측 결과가 나왔는지'에 대한 질문에 대해 침묵으로 일관하는 것이 아는 해석 가능한 정보를 제공하는 것이 해석 가능 모델의 목표라고 볼 수 있습니다.
.
.
.