내가 아는 챗봇 이야기 2

곽정은·2021년 1월 15일
1

조각모음

목록 보기
2/3

안녕하세요. 곽정은입니다.

저번 글에서는 튜링테스트와 ELIZA라는 챗봇에 대해서 살펴보았죠. 이번 글에서는 다른 챗봇 2가지와 튜링테스트에 대한 반론 한 가지를 살펴보겠습니다. 다행히도 오늘은 하드디스크가 옆에 있거든요 ㅎㅅㅎ

(이번 글은 한국외국어대학교 언어인지과학과 남지순 교수님의 2016년도 '언어와 컴퓨터' 수업 자료를 참고하여 작성했습니다.)


A.L.I.C.E


이상한 나라의 앨리스를 연상시키는 이름를 가진 챗봇 A.L.I.C.E입니다. A.L.I.C.E는 Artificial Linguistic Internet Computer Entity의 줄임말입니다. 사실상 위 사진과는 관계가 없는 것이죠 ㅎㅎ

A.L.I.C.E는 보다 자연스러운 대화를 가능하게 하기 위해 AIML(Artificial Intelligence Markup Language)이라는 XML 기반 스크립트로 패턴과 탬플릿이 구성되어있습니다.

여기서 AIML은 인간의 모든 일상 대화가 제한된 문장 내에서 이루어진다는 특성을 반영하여 만들어진 언어입니다. 패턴 매칭과 문방 템플릿 등의 대화 기능을 제공하지요. 패턴에 있는 문장이 입력되면 탬플릿에 있는 답변을 출력하는 형식입니다.

그래서 A.L.I.C.E는 튜링테스트와 비슷한 기조를 가진 Loebner Prize라는 챗봇 대회에서 2000년과 2001년에 수상을 했다고 합니다.

Eugene Goostman


Eugene Goostman(유진 구스트만)은 2001년 상트페테르부르크에서 만들어졌습니다. 러시아 프로그래머 3명에 의해서 만들어졌는데, 그래서인지 유진 구스트만은 13세의 우크라이나 소년으로 묘사되어 있습니다.

재밌는 사실은 얘가 기니피그를 한 마리 키운다는 디테일한 설정도 가지고 있다는 것이죠.

유진 구스트만은 Loebner Prize와 같은 대회에서 다수 수상을 한 경력을 가지고 있습니다. 일부에서는 유진 구스트만이 2014년 6월에 튜링테스트에 통과했다는 말이 있죠.

이 당시 대회에는 5개의 챗봇과 25명의 사람, 그리고 30명의 심판이 있었습니다. 2014년의 튜링테스트 대회는 앨런튜링의 40주기라서 당시까지만 해도 가장 큰 규모로 열렸었다고 합니다.

유진 구스트만과 심사위원들은 5분 간 대화를 나누었고, 그 중 33%의 심사위원들이 유진 구스트만이 사람인지 챗봇인지 판별하지 못했다고 합니다. 이 결과 때문에 일부 사람들은 튜링 테스트를 유진 구스트만이 통과했다는 것이죠. 일반적으로 튜링테스트는 심사위원이 "얘는 기계가 아니라 사람입니다."라고 하는 비율이 30%를 넘기면 그 기계는 인간처럼 사고할 수 있다고 간주할 수 있다고 했기 때문입니다.

살짝은 어패가 있는 말입니다. 앨런튜링은 사실 30%라고 확실히 그 비율을 단정지어 놓지 않았습니다. 1950년 그가 쓴 이라는 논문에서 "50년 뒤에는 일반인으로 구선된 심사위원들이 5분 동안 대화를 한 뒤, 기계와 대화했다고 깨닫는 비율이 70%를 넘기지 않도록 프로그래밍하는 것이 가능해질 것"이라고 말했을 뿐이었죠. 그래서 논란이 있습니다.

게다가 미래학자로 유명한 레이 커즈와일이 이 소식을 접하고 직접 유진 구스트만과 대화를 해보고 너무 성급하게 축하한 것이라고 비판했다고 합니다. 저도 내용을 봤는데, 저정도로 답변을 내놓고 테스트에 통과했다는 것에 더 의구심이 생겼습니다. 궁금하신 분들은 아래 링크를 참고해주세요.

레이 커즈와일과 유진 구스트만의 대화 일부를 사용한 기사

그리고 유진 구스트만은 살짝 꼼수를 사용하기도 했습니다. 나이 설정을 13세로 했기 때문에 어느정도 대화에서 문법이든 구문오류가 나도 어린아이이기 때문에 사람들이 오류를 눈 감아줄 수 있다는 것이죠.

중국어 방


"아니, 저렇게 허점이 많은 챗봇이 대회를 통과했다고? 테스트 자체에 문제가 있는 건 아닐까?"라는 생각이 혹시 드시는 분이 계신가요? 사실 테스트에 대한 의구심, 튜링테스트 자체에 대한 반론도 옛날부터 있어왔습니다.

튜링테스트는 테스트를 통과하면 그 기계는 인간처럼 사고할 수 있다고 생각합니다. 하지만 과연 그럴까요? 여기 아주 재밌는 사고 실험이 하나 있습니다.

방을 하나 만들어서 그 안에 중국어를 전혀 모르고 평생 영어만 사용해온 영국인을 한 명 둡니다.

그리고 그 사람 옆에는 영어로 쓰여진 한자 매뉴얼과 바구니 안에 든 수백장의 한자가 적힌 카드있습니다. 바구니에는 매뉴얼에 적힌 모든 한자가 다 들어있죠.

이때 방 밖에 있는 중국인이 중국어로 질문을 써서 쪽지를 써서 방 안으로 넣어줍니다.

중국어를 하나도 모르는 방 안 사람은 쪽지를 보고 정말 아무것도 모를 겁니다. 대신 쪽지 속 글자와 매뉴얼 속 글자를 비교해서 적절한 답변을 만들어서 밖으로 보내죠.

그럼 밖에 있는 중국인은 그 답변을 받아 읽고 방 안의 사람이 중국어를 이해한다고 생각한다는 것입니다.

사실 이 실험에서 중국어를 정말로 이해하는 사람은 매뉴얼을 제작한 사람이랑 방 밖의 중국인 뿐이죠.

이 사고 실험은 "방 안에 중국어를 아는 사람이 하나도 없는데, 중국어로 대화가 가능함을 보여주고 있다. 그러니 언어를 이해하지 못해도 대화가 가능함을 보여주며, 나아가 단순히 사람과 대화가 된다고 그 기계가 인간처럼 사고한다고 할 수 있을까?"라는 결론을 도출할 수 있다고 합니다.

사실 사고 실험이라 이 실험도 반론을 가지고 있긴 합니다만, 튜링테스트에 대한 반론으로 가장 많이 언급되어 가져왔습니다 ㅎㅎ


사실 내용이 적으면 어떡하나 걱정을 많이 했는데, 쓰다보니 정말 장문이 되었군요. 다시 한번 자료를 읽고 검색을 하면서 이전에는 몰랐던 새로운 사실도 알게되고요, 정말 재밌네요 히히!

노드랑 프로젝트도 재밌는데 전 이게 더 재밌...(퍽)

엣헴, 챗봇으로 더 쓸 내용이 있을지는 모르겠네요. 다음에는 어떤 주제를 써볼까요~

그럼 20000~!

profile
인공지능 냉각시스템 개발기업 전략기획

0개의 댓글