# Semantics

박경민·2023년 7월 4일

[Linguistics]

목록 보기
6/7

semantics 는 의미론, pragmatics 는 화용론이다. 개념상으론 semantics 는 literal meaning, pragmatics 는 상황을 좀 더 고려한 말하기와 의미를 말한다. 그러나 모든 발화는 여기에 맞춰 자를 수 없으니, 비슷한 과목이라 생각하자.

Truth

문장의 의미를 안다는 것 >> 참, 거짓을 판단할 수 있다는 것 / 그러나 그러지 못할 때 존재.

  • John swims. : 존이 수영한다라는 문장은 이해가 가지만 참 거짓을 판단하기가 어렵다. 우리가 보는 많은 문장이 이러한 유형에 속한다.
  • tautologies 는 항상 참인 문장을 말한다. (원은 둥글다, 싱글인 사람은 결혼하지 않은 상태이다.)
  • contradiction 은 항상 거짓인 문장을 말한다 (원은 사각형이다, bachelor 는 결혼했다.)

Ambiguity

구조적 중의성과 어휘적 중의성이 있다.

"뚱뚱한 사장님의 사모님이 물에 빠졌다" >> 구조적 중의성 (사장님이 뚱뚱, 사모님이 뚱뚱)
"This will make you smart" >> 어휘적 중의성 (똑똑한, 얼얼하다)

Compositionality 는 이전에 살펴보았듯 단어와 단어가 모여 특정 의미를 형성하는 합성성을 말한다. 그러나 우리가 하는 많은 말들은 이러한 합성성을 따르지 않는다. 공유하는 게 많은 사람들끼리, 사적인 상황에서 더 흔하게 발생하는데 여기엔 Anomaly, Metaphor, idiom 이 있다.

  1. Anomaly
    "Coloress green ideas sleep furiously" 처럼 문법적으로 완벽하지만 의미적으로 해석이 되지 않는 것들을 말한다.

  2. Metaphor (은유)
    Anomaly 로 보이지만 의미를 가지고 있는 말을 뜻한다. literal 하는 의미로 한번에 해석이 되지 않는 문장을 듣고, 의미를 streching 하는 과정을 거치며, 실제로 의미가 생기면 Metaphor 이다. "Walls have ears" 라는 문장이 여기에 속할 수 있다.

  3. Idioms

Lexical Relations

Homonyms 는 철자도 동일, 소리도 동일한 이의어를 말한다. 예컨대 bank 는 소리도 철자도 같지만 은행이란 뜻과 둑이라는 뜻이 있다. 한국어의 다른 예로는 말, 배, 사과, 은행, 화장 등이 있다.

Homographs 철자는 같고, 소리는 다른, 다른 의미를 말한다. 영어에만 있는 경우로 bow 를 [바우] 라 읽을 때는 인사하다, [보우] 라 읽을 때는 활이라는 뜻을 가진다. 추가로 read를 [레드][리드] 라 읽을 때 각각 뜻이 다르다.

Homophones 는 철자는 다른데 소리는 같은, 다른 의미를 말한다. bear 과 bare 은 철자는 다르지만 발음은 같고, 각각 곰과 벌거벗은이란 뜻이 있다. flower 과 flour 도 있다.

Polysemy(다의어)는 앞에서 보았던 이의어와는 다르게, 의미가 다르지만 관련이 있게 다른 경우를 말한다. (coceptually or historically related meanings) 예컨대 '가슴을 내밀다', '가슴을 태우다' 또는 '아침이 밝아온다', '아침 먹는다' 등이 있다.

추가로 상의어 Hyponym 과 하의어 Hypernym 의 관계를 보자.

  • 상하의 관계에 있는 단어들은 바꿔써도 좋으나.. 어디서부턴가 이상한 지점은 존재한다. (백구 <> 척추동물 ?)
  • 상하의 관계가 단어마다 하나만 있는 것은 아니므로 Net 을 사용한다. (WordNet)
  • MindNet 또한 MS사에서 Automatically 하게 만든 단어 넷이다.
  • 다른 linguistic DB로는 PropBank, FrameNet, 한국어워드넷 등이 있다.

Argument Structure

Argument Structure 은 논항구조라 하며, Syntax 에서 constraints 와 subcategorization 과 유사한 개념이다. 모든 언어에 보편적으로 나타나는 특징이다!

다른 동사는 다른 수의 NP를 arguments 를 갖는다. 예컨대 자동사Intransitive verbs 는 다른 arguments 를 취하지 않는다. 그러나 어떤 동사의 경우 영어에서는 자동사, 한국어에서는 타동사인데 이것 때문에 translation 이 어렵다. 또한 Transitive verb는 추가적인 항을 가지고 (object) Ditransitive verbs 두 개의 추가 항을 가진다. (direct object, indirect object)

동사는 추가로 항의 수뿐만 아니라 뒤에 오는 목적어의 의미적인 성격을 결정한다. 예컨대 drink 라는 동사가 온다면 뒤에 liquid direct object가 와야 할 것이다.

이를 기계로 어떻게 학습시켜야 할까? Collocational or Bag-or-Words 를 이용하자! (같이 많이 나온 단어를 이용하는 방법)

  • 콜라-마시다
  • 물-마시다
  • 꽃-물
  • 화병-마시다 (X)
  • 수은-마시다 (X)

위의 3개는 가능, 밑의 2개는 자주 등장하지 않을 것이다.

profile
Mathematics, Algorithm, and IDEA for AI research🦖

0개의 댓글