TX-Ray: Quantifying and Explaining Model-Knowledge Transfer in (Un-)Supervised NLP

매일 공부(ML)·2022년 1월 25일

Hackathon

목록 보기

14/16

톺아보기

해커톤 3에서 XAI기법을 이용하여, 타당성 및 성능 개선을 하려고 합니다. 하지만, AI, ML, DL 그리고 지도, 비지도, 강화학습 등 다양한 방식들 중에서 어떠한 방식으로 어떻게 할지 모르기에 논문을 리서칭하던 중 기존의 XAI for NLP기법보다 성능이 좋고 최신인 논문을 찾게 되었습니다.

논문에 대한 내용 및 저자 깃허브에 있는 code를 어느정도로 이해하여 구축할지가 제겐 너무나 큰 도전이 될 것 같아서 기대됩니다.

Paper link:링크텍스트
Github link:링크텍스트

Abstract

*배경

기존 XAI 방식들은 지도학습 끝부분이나 조사방식에 대한 설명만 함
- (비)지도 학습 훈련 때, 모델 지식 전달이 불충분하게 설명이 된다.

*TX-Ray 뉴런

촘촘하게 knowledge 전달
사람처럼 분석하도록 가이드

*TX-Ray 효과

사전학습 때, self or 지도학습된 NLP모델이 처음 knowledge abstrations하는 것을 분석한다
새로운 도메인(영역)에 추상화된 것을 전달한다.
지도학습 시, fine-tuning을 돕는다.

*저자의 발견

pruning: 가지치기(학습 후 불필요한 부분을 제거하는 방식)
TX-ray with pruning
- test set 생성 향상: 자동적으로 자기주도학습을 통해 언어 추상화한다.
  - 품사 분류같은 것이 가능해진다.(효과가 뭘까?)

Introduction

pretraining: 입력 특징들 수집 단계
zero-shot: 재학습x, 새로운 값을 추가하게 되면 뉴런 활성함수가 바뀌고 그로 인해 벌어지는 색깔의 차이를 통해서 유사도 측정 후 potenial or data match전달
Supervised: 지도학습labels을 이용해서 fine tune encoder 생성되고 이를 통해 knowledge추출

Unsupervised Knowledge absorption