테디노트영상에서 GraphRAG 의 신! 정이태님이 하신 강의를 정리 해놓은 블로그이다.
source : https://www.youtube.com/watch?v=zHN2jDZHvI0&t=4837s
GraphRAG의 발전은 다양한 기업과 연구기관의 주도로 이루어지고 있으며, 주로 Hard-prompting과 Soft-prompting 방식으로 나뉘어 전개되고 있다. 아래는 발표된 기술들을 중심으로 시간 순으로 정리한 내용이다.
2024년 4월 – Microsoft
최초의 GraphRAG 구조가 발표되었으며, hard prompting 기반의 정형화된 방식으로 질의 응답을 처리한다.
2024년 5월 27일 – Oxford, Meta, CMU
G-Retriever – Path Filtering이 발표되었으며, soft prompting과 hard prompting을 병행하여 사용자 질의에 맞는 경로를 필터링하는 방식
2024년 8월 9일 – NVIDIA
HybridRAG가 발표되었으며, 전통적인 RAG 구조와 그래프 기반 접근을 결합한 방식
2024년 9월 9일 – Microsoft
GraphRAG Auto-tuning 기술이 발표되었으며, hard prompting 기반의 프롬프트 최적화를 자동으로 수행
2024년 9월 13일 – G-Retrieval Module
그래프 기반 정보 검색을 위한 전용 모듈이 발표되었으며, 다양한 GraphRAG 구조와의 통합을 전제로 한다.
2024년 11월 7일 – KAIST, 고려대학교 등
LightRAG이 발표되었으며, 글로벌 및 로컬 수준의 키워드 및 엔티티 추출 기능을 강화한 방식이다.
2024년 11월 15일 – Microsoft
GraphRAG – Dynamic Community Selection 기술이 발표되었으며, 사용자 질의에 따라 관련 커뮤니티(서브그래프)를 동적으로 선택한다.
2024년 11월 25일 – Microsoft
LazyGraphRAG이 발표되었으며, 필요 시점에만 관련 서브그래프를 로딩하는 지연 처리 방식이 적용된다.
2025년 2월 3일 – 홍콩대학교
GFM-RAG (Graph Foundation Model)이 발표되었으며, 범용 그래프 기반의 프레임워크를 제안한다.
2025년 2월 18일 – LlamaIndex 등
PathRAG – Path Filtering 기술이 발표되었으며, 불필요한 경로를 제거해 응답의 정확도와 품질을 높인다.
2024년 초반에는 GraphRAG의 기본 구조가 정립되었으며, 하드 프롬프트 기반의 정적 질의 응답 방식이 주류를 이루었다.
2024년 하반기부터는 커뮤니티 기반의 동적 선택, 프롬프트 자동 튜닝, 그래프 지연 로딩 등 고도화된 기술들이 발표되었다.
2025년에는 범용 그래프 모델(GFM-RAG), 경로 필터링 최적화(PathRAG) 등으로 방향이 확장되고 있으며, Soft-prompting 방식은 비중은 작지만, 사용자 맞춤형 응답과 적응성 측면에서 병행되는 흐름을 보이고 있다.
Graph Strategy Planning 단계에서는 GraphRAG가 적용될 환경을 고려해야 한다.
이 환경은 클라우드 또는 온프레미스일 수 있으며, 사용 사례로는 사회, 법률, 이커머스, 제조, 통신 등의 다양한 산업군이 존재한다.
30개 이상의 실 사례 기반으로 전략을 수립하는 것이 바람직하다.
GraphRAG에서 사용할 메타데이터와 스키마가 존재해야 하며, 쿼리가 기존 RAG 파이프라인과 일관되게 구성되어야 한다.
이러한 데이터는 LLM 기반 또는 휴먼 라벨러에 의해 정제될 수 있다.
지식 그래프 구축은 두 가지 방식으로 접근할 수 있다.
그 다음 단계로 스키마 정렬(Schema Matching) 및 관계 매핑을 수행한다.
엔티티 연결 및 관계 구성은 자체 구축 또는 사전 학습된 기반 모델을 활용할 수 있다.
그래프 구조는 동적(Dynamic) 혹은 정적(Static) 방식으로 결정되며, 표현 방식은 다음 중 선택한다:
질의는 글로벌 쿼리 또는 로컬 쿼리로 구분된다.
그래프 데이터 레이아웃은 단일 레이아웃, 병렬 처리 또는 파티셔닝 방식으로 관리된다.
이때 계층 구조(Hierarchical), 정점(Vertex) 중심, 엣지(Edge) 중심 중 하나를 선택해야 한다.
단일 노드 또는 분산 그래프 처리 방식 중 하나를 선택하며, 공유 메모리를 사용하는지도 결정해야 한다.
하드웨어 및 소프트웨어는 다음을 기준으로 선택한다.
GraphRAG는 다음 세 가지 항목을 기준으로 구성된다.
LLM 연동 여부
Prompting 방식:
RAG 품질 측면
CI/CD 구성에는 평가 및 유지보수 체계가 포함된다.
주요 고려 항목은 다음과 같다.
평가 지표는 멀티홉 질의(Multi-hop)와 공통 지식(Common knowledge) 기반으로 구성된다.
Document에 있는 표(table)와 문서(text)를 그래프로 표현하는 방식은 GraphRAG을 구축할 때 매우 중요한 초기 단계이자, 이후의 정보 검색 품질에 직결되는 구조 설계 단계다. 각각을 구조화 방식, 노드/엣지 생성 방식, 대표 예시로 나누어 구체적인 정리를 해보자.
표는 기본적으로 행(row)과 열(column) 로 구성된 구조화된 데이터이므로, 이를 그래프로 표현하는 방식에는 몇 가지 패턴이 존재한다.
| 이름 | 직업 | 국적 |
|------|----------|-------|
| John | 의사 | 미국 |
| Mary | 간호사 | 영국 |
→ John 노드: {직업: 의사, 국적: 미국}
→ Mary 노드: {직업: 간호사, 국적: 영국}
방식: 셀 데이터 자체를 노드로 만들고, 행/열 구조를 연결 엣지로 표현
예시:
장점: 노드 간 관계가 명확하게 나타나 쿼리나 확장성에 유리함
단점: 노드 수가 많아지고 쿼리 복잡도가 증가할 수 있음
Table → Column(이름) → Value("John")
→ Column(직업) → Value("의사")
비정형 텍스트 문서의 경우에는 자연어 문장을 구조화하는 과정이 선행되며, 주로 정보 추출(NER, RE)과 요약 또는 chunking 이후 그래프화된다.
문장 A: "암은 세포가 비정상적으로 자라는 병이다."
문장 B: "비정상적인 세포 증식은 종양을 유발한다."
→ A —[semantic similarity]→ B
표현 대상 | 주요 방식 | 장점 | 단점 |
---|---|---|---|
표 | 행을 노드로, 열은 속성 | 간단하고 쿼리에 적합 | 관계 추론이 어려움 |
셀을 노드로, 엣지로 관계 표현 | 관계 표현 명확, 확장성 높음 | 복잡도 증가, 노드 수 많음 | |
테이블 스키마까지 계층 구조화 | 메타데이터 활용 가능 | 검색 효율 낮음 | |
문서 | 개체/관계 추출 기반 Knowledge Graph | QA, 검색에 가장 효과적 | NER/RE 정확도 민감 |
문장 유사도 기반 연결 | 문맥 흐름 반영 가능 | 관계 신뢰도 낮음 | |
문서 구조 기반 분해 | 시각화, 탐색성 좋음 | 정보 기반 검색에 부적합 |
그래프를 조회하는 방식은 GraphRAG 시스템의 핵심인 Graph Retrieval 단계에서 매우 중요하다.
이 단계에서 그래프 구조 안에 저장된 정보를 어떻게 "질문(Query)"에 맞게 효율적이고 정밀하게 꺼내올 수 있느냐가 전체 성능을 좌우한다.
MATCH (p:Person)-[:HAS_JOB]->(j:Job {name: '의사'})
WHERE p.nationality = '미국'
RETURN p
단일 노드 또는 특정 타입(예: 사람, 논문, 장소 등) 필터링
질문에 관련된 노드 집합과 그 주변 관계(1-hop, 2-hop 등)를 함께 추출
GraphRAG에서 LLM에 제공되는 context chunk는 보통 이 방식
두 노드 사이의 관계 흐름 추적
목적 | 방식 | 설명 |
---|---|---|
관련 정보 추출 | vector search + k-hop traversal | 의미적으로 비슷한 노드를 먼저 찾고, 주변 서브그래프 함께 추출 |
구조적 질의 대응 | Cypher pattern matching | 엣지 방향, 관계 타입 기반 필터링 |
빠른 응답 속도 | embedding prefilter → GNN scoring | 필터링 후 GNN으로 중요 노드 선별 |
LLM 연동용 | retrieved triples → prompt injection | 검색 결과를 LLM에게 텍스트형태로 제공 |
"미국 출신이며 암 치료 경력이 있는 의사는 누구인가?"
Query → embedding 변환
유사 노드 벡터 검색
관련 엣지를 따라 1-hop/2-hop 서브그래프 수집
triple로 재구성:
("John", "국적", "미국")
("John", "전문분야", "암 치료")
문서나 표에서 추출된 정보가 서로 다른 스키마 구조로 표현되어 연결이 어려워지는 문제가 발생한다.
예를 들어 동일한 보험 상품을 서로 다른 이름, 분류 체계로 기술한 경우가 대표적이다.
해결 방식
노드 타입이 다양하고 관계도 복잡하여 단순 쿼리 기반으로는 효율적인 탐색이 어렵다.
동일 노드라도 다른 타입 간 연결이 많아질 경우, 정확한 결과 도출이 힘들어진다.
해결 방식
RAG 시 불필요하거나 중복된 경로가 포함되면, LLM이 혼란을 겪고 정확도가 떨어진다.
해결 방식
같은 질문이어도 LLM이 어느 subgraph를 선택하느냐에 따라 응답이 달라질 수 있다.
해결 방식
Hard-prompting은 설계 복잡도가 높고, Soft-prompting은 정밀 제어가 어렵다.
해결 방식
다단계 reasoning이 필요한 질문에서 관련 경로를 제대로 찾지 못하는 문제가 있다.
해결 방식
결과 품질을 정량적으로 평가하기 어렵고, 실 사용자 피드백과 괴리가 발생할 수 있다.
해결 방식
단순 응답 정확도뿐 아니라, 그래프 구조가 유의미한 추론에 기여했는가를 평가해야 한다.
주요 평가 항목은 다음과 같다:
도메인 전문가가 직접 쿼리를 만들고, 정답/경로를 명시한다.
각 쿼리에 대해:
LLM을 활용해 도메인 기반 쿼리를 생성하고, 같은 LLM으로 정답 후보 생성 및 필터링을 진행한다.
이후 human validation으로 보강한다.
단순 정답뿐 아니라 필요 경로(노드, 엣지)를 함께 저장해야 한다.
예시:
{
"query": "네이버페이가 제공하는 자동차 보험에는 어떤 법률이 적용되는가?",
"answer": "자동차 보험법 제35조가 적용된다.",
"expected_path": ["Customer -> Fintech -> Insurance -> Product -> Law"]
}
항목 | 설명 |
---|---|
EM (Exact Match) | 답변이 GT와 완전히 일치하는가 |
Path Recall / Precision | LLM이 추론에 사용한 그래프 경로가 GT 경로와 얼마나 겹치는가 |
Query Latency | 쿼리 처리 시간 |
Answer Diversity | 다양한 질문에 대해 얼마나 일관성 있게 답하는가 |
Faithfulness | 그래프 기반 정보에 충실한 답인가 (LLM hallucination 방지 지표) |
CI/CD 파이프라인에 주기적으로 위 평가 쿼리셋을 돌려서 점수화한다.
특정 변경(예: 그래프 필터링 방식 수정) 이후 전/후 성능 비교가 가능하다.
Auto-eval 파이프라인 예:
QA Benchmarking Module
datasets
+ evaluate
라이브러리GDBMS(Graph Database Management System)를 선정할 때는 단순 성능뿐 아니라 비용, 운영 생태계, 데이터 사일로 해소 여부 등 실무적으로 중요한 요소들을 함께 고려해야 한다.
GDBMS | 생태계 특성 |
---|---|
Neo4j | 가장 활발한 커뮤니티, 풍부한 예제, AuraDB로 클라우드 지원 |
Amazon Neptune | AWS와 통합이 뛰어남, IAM/CloudWatch 지원 |
TigerGraph | 산업 적용 중심, 성능은 좋지만 커뮤니티는 다소 작음 |
GDBMS | 라이선스 / 비용 스키마 유연성 이기종 연결성 |
---|---|
Neo4j | 커뮤니티 무료 / 기업 유료 유연함 제한적 |
ArangoDB | 무료 / 엔터프라이즈 유료 JSON 기반 유연함 문서+그래프 복합 |
TerminusDB | 오픈소스 완전 무료 Git-like 관리 RDF & JSON 모두 지원 |
우선순위 | 상황 | 추천 |
---|---|---|
생태계 | 빠른 개발, 도입 쉬움이 중요할 때 | Neo4j, ArangoDB |
성능 | 수억 노드 이상의 데이터 처리 필요 | TigerGraph, DGL 기반 |
적합성 | 표준 지식베이스 (RDF), 비용 민감 | Blazegraph, TerminusDB |
통합성 | 다른 DB나 메타데이터 통합 | ArangoDB, JanusGraph |