[Paper Review] Optimal Knowledge Component Extracting Model for Knowledge-Concept Graph Completion in Education (2023.2.)

신 영·2024년 9월 21일

EdTech

목록 보기
2/8

✅ Background

지식맵을 구축하여 학생 개별의 학습 수준에 맞는 맞춤형 학습 경로를 제시하는 시스템을 만들고자 한다. 그러나 지식맵 구축은 해당 도메인 전문가가 많은 시간과 노력을 들여 세심하게 작업해야 하는 부분이다. 지식맵 구축 작업 전 관련 연구를 들여다보고 지식맵 구축을 위한 인사이트를 얻고자 하였다.

📌 Paper Introduction

지식그래프 생성을 위한 최적의 지식개념 추출 모델에 대한 연구
Optimal Knowledge Component Extracting Model for Knowledge-Concept Graph Completion in Education

  • 최현희, 이하윤, 이민정
  • IEEE Access

논문 보기

관련 기사 | 인공지능이 학습상태 효과적으로 예측한다!...라이브데이터 이민정 연구소장, 최적의 지식맵 산출하는 AI 개발

  • 인공지능(AI) 교육 솔루션 공급기업 라이브데이터(대표 박수정)가 세계 최고 권위를 인정받는 미국 전기전자공학자협회(IEEE)의 Access저널에 등재한 논문
  • 머신러닝 기법인 엘라스틱 넷(Elastic Net)과 랜덤 포레스트(Random Forest) 알고리즘에 딥러닝 기반 지식 추적 모델 (Deep Knowledge Tracing)을 결합한 듀얼넷(Dual-net)을 활용하여 학습상태를 효과적으로 예측할 수 있는 최적의 지식맵을 산출하는 알고리즘 개발
  • 통과된 논문은 상용화 된 교육 데이터 약 1백만 건을 활용한 연구로 학습자의 학습상태 예측 정확도를 향상할 수 있는 AI 기반 지식맵 생성 모델임을 입증

✅ Paper Review

📌 Overview

  • 엘라스틱넷으로 다중회귀분석을 진행해서 지식요소 수를 줄인 다음에
  • LSTM으로 DKT를 진행하는 듀얼넷 기반으로 kc 간 상관관계를 계산해서
  • 최적의 지식 개념 그래프를 만들 수 있다!

📌 Concept

1. Knowledge graph (지식 그래프)

Knowledge graph (지식 그래프)는 개념, 객체, 그리고 그들 간의 관계를 그래프 형태로 시각화한 데이터 구조다. 이 그래프는 특정 주제에 대한 정보나 지식을 구조화하고, 서로 연결된 데이터들 간의 관계를 표현하는 방식으로, 검색, 질문 응답, 추천 시스템 등에 활용된다.

주요 구성 요소는 다음과 같다.

  • 노드 (Nodes): 실체나 개념을 나타낸다. 예를 들어, 사람, 장소, 제품 등이 될 수 있다.
  • 엣지 (Edges): 노드 간의 관계를 나타낸다. 예를 들어, 'A는 B의 친구다'와 같은 연결을 표현한다.
  • 속성 (Attributes): 노드와 엣지가 가질 수 있는 추가적인 정보다. 예를 들어, 사람의 나이나 직업과 같은 속성을 포함할 수 있다.

Google의 Knowledge Graph나 Wikidata는 대표적인 예시이다. 이 기술은 검색 엔진이 사용자에게 더 정확하고 의미 있는 정보를 제공하도록 돕거나, AI가 문맥을 이해하고 추론할 수 있게 해주는 중요한 도구로 활용된다. 지식 그래프는 추천 시스템, AI 기반 챗봇, 지식 검색 등의 기능에서 큰 역할을 한다.

2. KC (Knowledge Component)

학습 과정에서 중요한 개념이나 기술을 의미하는 용어다. KC는 KC는 학습자가 습득해야 하는 핵심 지식이나 기술의 최소 단위로, 학습자가 특정 개념이나 기술을 숙달하기 위해 이해해야 할 중요한 요소들로 정의된다. 예를 들어, 수학에서 '분수의 덧셈'이라는 학습 목표가 있다면, 그 안에는 "공통 분모를 찾기," "분자와 분모의 덧셈," "결과를 기약분수로 만들기" 등의 여러 KC들이 포함될 수 있다. KC는 적응형 학습 시스템에서 학생의 학습 상태를 추적하고 맞춤형 학습을 제공하는 데 중요한 역할을 한다.

📌 OKCE (Optimal Knowledge Compenent Extraction)

  • 라이브데이터 사에서 연구하여 발표한 모델
  • 목적 : 학습자의 학습 상태에 따라 유효한 최적화 KC 선택하여 지식 개념 그래프를 완성

구조

  • Elastic Net (LASSO 파라미터 사용)
  • Random Forest
  • Dual Net (KC 간 상관관계 계산)
    • Operator Net : DKT(LSTM 사용)로 각 KC 학습 상태에 대한 인접 KC 영향 계산
    • Selector Net : operator net 피드백 기반 최적 이웃 KC 서브셋 추출 (지표 : AUC)

상세 내용

  • Elastic Net (LASSO)
    • 다른 KC와 상관관계 낮은 KC 추출
    • 대상 KC로 회귀하여 10% 유의수준 만족하는 KC 쌍 추출
    • RF 알고리즘 적용하여 KC 중요도 계산
    • 중요도 상위 20% 이내인 경우 유의미한 쌍으로 간주
10% 유의수준 만족 O10% 유의수준 만족 X
RF 상위 20% 중요도 OBOTH 할당RF 할당
RF 상위 20% 중요도 XLASSO 할당수 불충분할 경우 랜덤 선택 후 추가
  • Judgment Algorithm (operator net 반환 AUC와 best AUC 비교)

    • current AUC > best AUC

    • previous iteration < current AUC ≤ best AUC

    • current AUC < previous iteration

  • Dual net의 operator & selector net 왔다갔다 100번 반복, 같은 KC 서브셋 3회 연속 최고 AUC 기록할 경우 조기 종료 ( n(KC) ≥ 3 )

OKCE vs 타 모델 결과 비교

📌 OKCE 모델의 장점 및 활용

  • 다중 회귀 분석 → KC 범위 좁힘
  • DKT 기반 dual net → KC 학습 상태 정확하게 예측할 수 있는 최적의 KC 서브셋 추출

→ 개별 맞춤 학습, 모델 정확성 ⬆️, 데이터 크기 줄임으로써 DKT를 위한 데이터 처리 시간 및 모델 생성 시간 감소

✅ Insight

  • 지식 그래프 구축 시 활용할 수 있는 OKCE 모델에 대해 알아볼 수 있었다. DKT에 LSTM을 활용하고, 지식요소 수를 줄인 후 상관관계 분석을 진행하는 부분에서 효율성이 돋보였다. 즉각 활용은 어렵다고 생각하지만 추후 프로젝트 진행 상황에 따라 시도해 볼 수 있는 모델이라는 생각이 든다.
  • 다른 리뷰가 없기도 하고, 영어 논문을 읽거나 논문 리뷰를 한 경험이 적어 시간이 오래 걸렸다. 학부 때는 논문을 읽으면 용어나 어투가 어렵고 쉽게 바로 활용할 수 없는 내용들인 것 같았는데 지금 읽어보니 논문 리뷰를 왜 하는지 알겠다. 앞으로도 계속해서 논문 리뷰를 하며 학계 현황을 파악하고 서비스 적용점도 고민해 보며 성장해야겠다.

이미지 출처 : Knowledge graph - Wikipedia

0개의 댓글