Legal Judgment Prediction via Event Extraction with Constraint

상솜공방·2025년 4월 25일

논문 리뷰

목록 보기

2/49

Input data: 범죄 사실
Output data: 법 조항( $t_a$ ), 죄명( $t_b$ ), 형량( $t_c$ ) ( $t_a, t_c, t_p \in T$ )

h_1, h_2, ... h_{l_f} = \text{Legal-BERT}(x_1, x_2, ...x_{l_f})

\bar{h} = \text{maxpooling}(h_1, h_2, ...h_{l_f})

맥스풀링 레이어를 거쳐 context representation을 만든다.

이렇게 생성된 문맥 표현 $\bar{h}$ 와 관련된 법조항 사이의 연관관계를 학습시켜야 한다.
따라서 법조항을 위와 동일한 방식으로 Legal-BERT에 통과시킨 뒤 맥스풀링을 하여 context representation으로 만든다.

h_1, h_2, ... h_{l_a} = \text{Legal-BERT}(x_1, x_2, ...x_{l_a})

법조항을 토큰화 한 집합 $D_a = \{x_1, x_2, ...x_{l_a}\}$
피처 벡터 $H_a = \{h_1, h_2, ...h_{l_a}\}$ $c = \text{maxpooling}(h_1, h_2, ...h_{l_a})$

이후 범죄 사실 진술과 법조항 사이의 연관관계를 학습시키기 위해, 아래와 같은 과정을 진행한다.

\alpha_j = \bar{h}^T W_c c_j

이렇게 얻어진 $\alpha_j$ 는 $\bar{h}$ 와 $c_j$ 간의 연관관계에 대한 가중치이다.

\bar{c} = \sum \frac{exp(\alpha_j)}{\sum_{k=1} exp(\alpha_k)} c_j

해당 범죄 사실에 대한 모든 법조항 사이의 연관관계를 구하여 가중치화한다.
이후 이들을 혼합하여, 해당 범죄 사실과 관련된 법조항의 정보를 통합한다.

\hat{y_t} = \text{softmax}(W_t[\bar{h}; \bar{c}] + b_t)

상어 인형을 좋아하는 사람