# hallucination

4개의 포스트
post-thumbnail

A Token-level Reference-free Hallucination Detection Benchmark for Free-form Text Generation

A Token-level Reference-free Hallucination Detection Benchmark for Free-form Text Generation ACL 2022 분야 및 배경지식 hallucination (환각; 그럴듯한 거짓말) 거대한 사전학습 생성형 언어모델이 가지고 있는 주요 문제 중 하나 존재하지 않거나 정확하지 않은 내용을 모델이 마치 사실처럼 응답하는 문제 문제점 기존 hallucination 감지 연구들의 한계 참조(reference) 기반 정답 역할을 하는(ground-truth) 참고(reference) 자료가 존재하지 않을 수 있음 참고 자료를 어디에서 가져올지 정하는 것 또한 어려움 실시간으로 생성이 이루어지는 경우 기존의 참고 자료만 사용 가능 문장 혹은 문

2023년 8월 1일
·
1개의 댓글
·

Survey of Hallucination in Natural Language Generation

[Survey of Hallucination in Natural Language Generation ](https://arxiv.org/pdf/2202.03629.pdf) arXiv, 2022 Hallucination 심리학에서의 hallucination 진짜처럼 느껴지는 가짜 인식(perception) a percept, experienced by a waking individual, in the absence of an appropriate stimulus from extracorporeal world 자연어 생성모델의 hallucination 제공된 문맥과 상관이 없거나(nonsensical) 문맥과 상충되는(unfaithful) 내용을 생성 > intrinsic hallucination (내재적 환각) 주어진 문맥에 모순되는 결과를 생성 e.g. 주어진 문맥에 "2019년 FDA에 의해 첫번째 에볼라 백신이 승인되었다" 라

2023년 7월 24일
·
0개의 댓글
·
post-thumbnail

How Language Model Hallucinations Can Snowball

[How Language Model Hallucinations Can Snowball ](https://arxiv.org/pdf/2305.13534.pdf) arXiv, 2023 분야 및 배경지식 Hallucination (=환각, 그럴듯한 거짓말) 없는 사실을 만들어내거나 존재하지 않는 출처를 만드는 등 그럴듯한 거짓말을 생성하는 문제 produce plausible-sounding falsehoods 일반적으로 언어모델의 지식 차이(=knowledge gap) 때문에 야기되는 문제로 알려짐 언어모델이 사전학습 시 학습한 지식과 실제 지식이 다를 수 있음 (e.g. outdated, ...) 문제점 > Hallucination Snowballing ![](https://velog.velcdn.com/images/mmodestaa/post/06c0901b-dade-4fa0-9d10-0744b950c291/ima

2023년 6월 16일
·
0개의 댓글
·

[NLP #5] Mutual Information Alleviates Hallucinations in Abstractive Summarization (EMNLP, 2022)

paper: https://aclanthology.org/2022.emnlp-main.399.pdf > code: https://github.com/VanderpoelLiam/CPMI Abstract Background: hallucinate: 요약한게 source document 내용을 제대로 반영하지 못한 경우 어떤 모델이 더 hallucinated content를 생성할 확률이 높은지 확인해 봄 (= high model uncertatinty) 모델들은 cintunuation이 uncertain할 때 주로 많이 나오는 단어들을 디폴트로 사용한다. 이렇게 되면 decoding할 때도 방해가 된다. Research Goal: Propose a decoding strategy : 그냥 target token의 확률로 계산하는 게 아니라 source, target 토큰간의 PMI를 고려해 optimizing해서

2023년 3월 29일
·
0개의 댓글
·