문서 기반 지식 그래프 및 RAG 구축 파이프라인

문서 기반 한국어 지식 그래프 구축 및 RAG 시스템

사용방법

(선택적) 목적 기반 뉴스 기사 자동 추출

python crawling.py
python save_news.py

1. 문서 파일을 documents 디렉토리에 배치

cp your_files/* output/documents

2. 전체 파이프라인 실행

streamlit run app.py

3. 성능 평가

python evaluate_rag.py

환경설정

python 3.10.16

pip install -r requirements.txt

각 모듈의 구체적인 버전은 raw_requirements.txt 에서 확인 가능합니다.

개별 실행 방법

app.py를 통한 통합 인터페이스가 아닌 개별 파일로 각 step을 실행하고 싶다면 아래와 같은 순서로 실행 가능합니다.

crawling.py (뉴스 기사 수집)
save_news.py (뉴스 기사 저장 -> output/documents)
extract_schema.py (output/schema/schema.json)
extract_node.py (output/result/result.json)
extract_relation.py (output/result/result.json)
creat_cypher.py (output/graph.cypher)
send_cypher.py
rag.py

각 지식그래프 및 RAG 시스템에 대해 성능을 평가하고 싶다면 아래와 같이 실행 가능합니다.

(1) 지식그래프 평가

data/answer.json 으로 정답 스키마를 저장한다.
evaluate_json.py --gold data/answer.json --pred output/result/result.json 을 실행한다.

(2) RAG 평가

data/QAset.json 으로 각 정답 질의응답 데이터를 저장한다.
evaluate_rag.py를 실행한다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

문서 기반 지식 그래프 및 RAG 구축 파이프라인

사용방법

환경설정

개별 실행 방법

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 89 Commits
data		data
output		output
.gitignore		.gitignore
app.py		app.py
crawling.py		crawling.py
create_cypher.py		create_cypher.py
deduplication.py		deduplication.py
evaluate_json.py		evaluate_json.py
evaluate_rag.py		evaluate_rag.py
extract_node.py		extract_node.py
extract_relation.py		extract_relation.py
extract_schema.py		extract_schema.py
rag.py		rag.py
raw_requirements.txt		raw_requirements.txt
readme.md		readme.md
requirements.txt		requirements.txt
save_news.py		save_news.py
send_cypher.py		send_cypher.py
util.py		util.py

Folders and files

Latest commit

History

Repository files navigation

문서 기반 지식 그래프 및 RAG 구축 파이프라인

사용방법

환경설정

개별 실행 방법

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages