[Session] 자연어처리, 언어모델, 생성AI의 한계

박경민·2023년 4월 13일

[Sessions]

목록 보기

5/7

거짓 제공 답변들

문제는 거짓 진술이라도 그럴듯하게 답한다라는 것이다.

언어모델

확률적 모델은 이 문제를 모르지 않을까?

단어 시퀀스의 확률만 계산하기 때문이다.
물론 시퀀스의 확률은 컨텍스트에 따라 달라지긴 한다.

이 확률을 계산하는 데 있어서 NN 기반의 모델이 가미되는 것.

so 라는 단어가 주어지면 다음 단어인 long, so long 이 주어지면 and .. 다음 단어를 잘 예측하냐의 문제이다.

트랜스포머 블록은 무엇을 할까?

Self-Attention (단어간의 관계)

모든 칸에 빈칸이 뚫려있을 때보다 채워졌을 때 들어가는 단어들이 다르다.
단어 간의 관계를 사용하는 것이 Self-Attetion 이다.

따라서 언어모델을 학습한다는 것은

들어온 단어에 가중치, 예측하고 실제 단어를 Loss function으로 계산하고 역전파하는 것이다. (자랑하는 '파라미터가 많다'는 가중치 w의 개수를 말하는 것이다.)

여기서 한 문장 내 단어들의 관계를 추가적으로 계산하는 것이 self-attention 이다.

Auto-regressive LM: Decoding

전 단어를 기반으로 다음 단어를 예측하는 것이 Auto-regressive이다. GPT 가 여기에 속하는 것.

Decoding with Beam Search

챗봇

Task-oriented vs. Open-domain 🔽

Open-domain 으로 전환되면서 Evaluation 이 어려워졌다는 문제가 생김.
Context 를 따라가는 답변을 제공하는 것이 어렵다.

챗봇의 컴포넌트

Chain-of-Thought Promting 🔽

질문이 다르면 모델의 정확도를 높일 수 있다, 하는 것이 프롬프팅의 주요 주제다.

내가 11이라는 답을 어떻게 냈는지 풀이 과정을 추가로 주면
똑같은 질문에 대해 모델이 답을 맞춘다.

점수계산: InstructGPT 🔽

챗 GPT 에 들어가는 중요한 컴포넌트
1. 질문하고 라벨이 달린 정답으로 추가로 더 학습시킨다
1. 추가로 학습된 모델에 질문에 대한 답변을 생성하게 한다. 답변을 생성하고 사람이 랭킹을 매기는 과제를 수행한다. (Reward model 학습)
1. 실제 새로운 질문에 reward 을 계산한다. reward 가 업데이트.

생성 AI의 한계

reasoning
Zero-Shot Learning (처음 보는 데이터에 대한 답)
Out of Distribution Input (학습 데이터랑 굉장히 다르게 생긴)
Degeneration (비슷한 문장 재생성. 왜 일어나는지 모름.)
Hate Speech

생성 AI의 미래

지식그래프를 만드는 것은 어떨까?

한국어 혐오표현을 영어와 아랍어로 번역하고 해당 모델에 넣으면 혐오표현이 아니라고 나온다.

인상깊었던 것 중 하나가 GPT 가 모든 것을 해결해주지 못한다는 것이다. 성능적인 문제점에서가 아니라, 다양한 모델들을 개발하고 연구하는 관점에서 GPT 는 최종의 것도 아니며 그저 지나가고 지나온 모델 중 하나라는 생각이 든다. 대량의 리소스 + 확률 모델이 현재 GPT 가 내세운 전부인데, 이것으로도 어느정도 우리가 원하는 답변을 제공하는 것은 맞으나 여러 도메인의 여러 reasoning 에 문제가 있다는 것이 결론이었다. 적어보면

사회 각 도메인에 대한 이해는 부족하며 이해라 말할 수도 없다
지식 그래프를 만드려는 노력이 있으며 현재 GPT 에는 적용되지 않았다
현 진행 중인 연구에는 범용 AI가 아닌 이러한 Specific 한 문제들을 다루려는 접근과 시도들이 있다
따라서 과거의 모델들도 중요하다
개인적인 관점으로는 다시 Rule base 가 필요해질 날이 올 수도 있겠다는 생각.
인간의 Reasoning 과정은 생각보다 더 복잡하며 현재는 AI가 더 잘하는 분야도 있고 인간이 월등히 뛰어난 분야도 있다
인간의 다양한 추리 과정을 표현하는 데에는 뇌에 대한 이해도 필요하다

정리하면, 아직 할 일이 많다는 것!

박경민

Mathematics, Algorithm, and IDEA for AI research🦖

이전 포스트

[Session] Genome-based prediction of complex traits

다음 포스트