CustomServiceMj-Bit
diff --git a/‎.gitignore‎
Lines changed: 2 additions & 1 deletion b/‎.gitignore‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎README.md‎
Lines changed: 15 additions & 1 deletion b/‎README.md‎
Lines changed: 15 additions & 1 deletion
diff --git a/‎core/qna/agent/qna_agent.py‎
Lines changed: 146 additions & 11 deletions b/‎core/qna/agent/qna_agent.py‎
Lines changed: 146 additions & 11 deletions
diff --git a/‎core/qna/agent/test_qna_agent.py‎
Lines changed: 21 additions & 0 deletions b/‎core/qna/agent/test_qna_agent.py‎
Lines changed: 21 additions & 0 deletions
diff --git a/‎core/qna/config.py‎
Lines changed: 12 additions & 12 deletions b/‎core/qna/config.py‎
Lines changed: 12 additions & 12 deletions
diff --git a/‎core/qna/database.py‎
Lines changed: 0 additions & 51 deletions b/‎core/qna/database.py‎
Lines changed: 0 additions & 51 deletions
diff --git a/‎core/qna/encoder.py‎
Lines changed: 1 addition & 1 deletion b/‎core/qna/encoder.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎core/qna/generator.py‎
Lines changed: 1 addition & 1 deletion b/‎core/qna/generator.py‎
Lines changed: 1 addition & 1 deletion
@@ -13,4 +13,5 @@ models/*.ckpt
 
 # IDE 파일
 .idea/
-*.iml
+*.iml
+
@@ -21,4 +21,18 @@ docker compose up -d
 
 ```bash
 docker compose down
-```
+```
+
+## 📊 데이터베이스 설정
+
+### VectorDB 사용
+이 프로젝트는 기존 VectorDB의 pickle 파일들을 직접 사용합니다:
+- `core/qna/VectorDB/q_data.pkl`: 질문 임베딩 데이터
+- `core/qna/VectorDB/s_data.pkl`: 답변 스니펫 임베딩 데이터  
+- `core/qna/VectorDB/k_data.pkl`: 키워드 임베딩 데이터
+
+**장점**:
+- ChromaDB 없이도 동작
+- 빠른 로딩 속도
+- Git 저장소 크기 최적화
+- 간단한 구조
@@ -1,25 +1,160 @@
 from core.shared.states.states import CustomsAgentState
 from core.qna.main import RAGSystem
+from core.shared.utils.llm import get_llm
+from langchain_core.messages import HumanMessage
+import re
+
+def compare_responses(llm_response: str, rag_response: str, comparison_llm) -> bool:
+    """
+    LLM을 사용하여 두 응답의 유사성을 판단합니다.
+    
+    Args:
+        llm_response: LLM 기반 응답
+        rag_response: RAG 기반 응답
+        comparison_llm: 비교용 LLM 인스턴스
+        
+    Returns:
+        bool: True if responses are similar, False if they differ significantly
+    """
+    comparison_prompt = f"""다음은 동일한 질문에 대한 두 개의 답변입니다. 
+이 두 답변이 내용적으로 유사한지 판단해주세요.
+
+답변 1: {llm_response}
+
+답변 2: {rag_response}
+
+두 답변의 핵심 내용이 유사하거나 동일하다면 "유사함"이라고 답하고, 
+내용이 다르거나 모순되거나 추가 정보가 포함되어 있다면 "다름"이라고 답해주세요.
+
+답변:"""
+
+    try:
+        comparison_result = comparison_llm.invoke([HumanMessage(content=comparison_prompt)])
+        comparison_text = str(comparison_result.content) if hasattr(comparison_result, 'content') else str(comparison_result)
+        
+        # "유사함"이 포함되어 있으면 True 반환
+        return "유사함" in comparison_text or "similar" in comparison_text.lower()
+    except Exception as e:
+        # LLM 비교 실패 시 기본 로직 사용
+        print(f"LLM 비교 실패, 기본 로직 사용: {e}")
+        
+        # 간단한 키워드 기반 비교
+        def extract_keywords(text: str) -> set:
+            customs_keywords = [
+                '관세', '세금', '수입', '수출', '통관', '신고', '세율', '과세', '면세',
+                '반입', '반출', '검사', '검역', '위험물', '금지', '제한', '허가',
+                '서류', '증명', '신청', '처리', '기간', '비용', '요금', '부과'
+            ]
+            
+            keywords = set()
+            for keyword in customs_keywords:
+                if keyword in text:
+                    keywords.add(keyword)
+            return keywords
+        
+        llm_keywords = extract_keywords(llm_response.lower())
+        rag_keywords = extract_keywords(rag_response.lower())
+        
+        if llm_keywords and rag_keywords:
+            common_keywords = llm_keywords.intersection(rag_keywords)
+            total_keywords = llm_keywords.union(rag_keywords)
+            similarity = len(common_keywords) / len(total_keywords) if total_keywords else 0
+            return similarity >= 0.7
+        
+        return False
 
 def qna_agent(state: CustomsAgentState) -> CustomsAgentState:
-    """QNA RAG 에이전트 - 실제 RAG 시스템 사용"""
+    """QNA 에이전트 - RAG 우선, 부족시 LLM 활용"""
 
-    # RAG 시스템 초기화 및 데이터베이스 설정
-    rag_system = RAGSystem()
-    rag_system.setup_database()
+    query = state["query"]
 
-    # RAG 시스템을 사용하여 답변 생성
-    answer = rag_system.search_and_generate(
-        query=state["query"],
+    # 1. RAG 시스템을 사용한 응답 생성 (1차 우선)
+    rag_system = RAGSystem()
+    rag_response = rag_system.search_and_generate(
+        query=query,
         top_k=5,
         show_details=False
     )
 
-    state["final_response"] = answer
+    # 2. RAG 응답의 품질 평가
+    def evaluate_rag_quality(rag_response: str, query: str) -> bool:
+        """LLM을 사용하여 RAG 응답이 충분한 정보를 제공하는지 평가"""
+        llm = get_llm()
+        
+        evaluation_prompt = f"""다음은 사용자의 질문과 RAG 시스템이 제공한 답변입니다.
+이 답변이 사용자의 질문에 대해 충분하고 정확한 정보를 제공하는지 판단해주세요.
+
+사용자 질문: {query}
+
+RAG 답변: {rag_response}
+
+다음 중 하나에 해당하면 "부족함"이라고 답하고, 그렇지 않으면 "충분함"이라고 답해주세요:
+
+1. 답변이 너무 짧거나 구체적이지 않은 경우
+2. "정확한 정보를 제공할 수 없다", "참고할 수 있는 문서가 없다" 등의 문구가 포함된 경우
+3. 질문에 대한 구체적인 답변이 아닌 일반적인 설명만 있는 경우
+4. 문서에 없는 내용을 임의로 생성했다고 명시된 경우
+
+판단 결과:"""
+
+        try:
+            evaluation_result = llm.invoke([HumanMessage(content=evaluation_prompt)])
+            evaluation_text = str(evaluation_result.content) if hasattr(evaluation_result, 'content') else str(evaluation_result)
+            
+            # "부족함"이 포함되어 있으면 False 반환
+            return "부족함" not in evaluation_text and "insufficient" not in evaluation_text.lower()
+            
+        except Exception as e:
+            # 기본 로직: 간단한 키워드 체크
+            insufficient_indicators = [
+                "정확한 정보를 제공할 수 없다",
+                "참고할 수 있는 문서가 없다",
+                "문서에 없는 내용",
+                "정보가 부족하다",
+                "확실하지 않다"
+            ]
+            
+            for indicator in insufficient_indicators:
+                if indicator in rag_response:
+                    return False
+            
+            # 길이 체크
+            if len(rag_response.strip()) < 50:
+                return False
+                
+            return True
+    
+    rag_quality_good = evaluate_rag_quality(rag_response, query)
+    
+    # 3. 최종 응답 선택
+    if not rag_quality_good:
+        # RAG 응답이 부족한 경우 LLM 사용 + 불확실성 표시
+        llm = get_llm()
+        llm_prompt = f"""다음은 관세 관련 질문입니다. 사전 학습된 지식만을 사용하여 답변해주세요.
+        
+질문: {query}
+
+답변:"""
+        
+        llm_result = llm.invoke([HumanMessage(content=llm_prompt)])
+        llm_response = str(llm_result.content) if hasattr(llm_result, 'content') else str(llm_result)
+        
+        # 불확실성 표시 추가
+        final_response = f"{llm_response}\n\n※ 이 답변은 불확실할 수 있습니다."
+        response_source = "LLM (RAG 응답 부족)"
+        
+    else:
+        # RAG로 충분히 답변할 수 있는 경우 RAG만 사용
+        final_response = rag_response
+        response_source = "RAG (외부 지식 기반)"
+    
+    state["final_response"] = final_response
     state["intermediate_results"]["qna"] = {
-        "response": answer,
-        "query": state["query"]
+        "rag_response": rag_response,
+        "rag_quality_good": rag_quality_good,
+        "selected_response": final_response,
+        "response_source": response_source,
+        "query": query
     }
 
-    
     return state
@@ -0,0 +1,21 @@
+# -*- coding: utf-8 -*-
+import sys
+import os
+sys.path.append(os.path.abspath(os.path.join(os.path.dirname(__file__), '../../..')))
+
+from core.qna.agent.qna_agent import qna_agent
+from core.shared.states.states import CustomsAgentState
+
+if __name__ == "__main__":
+    # Test query
+    test_query = "How to declare customs?"
+    state = CustomsAgentState(query=test_query)
+    result = qna_agent(state)
+
+    print("=== QNA AGENT TEST RESULT ===")
+    print("Query:", test_query)
+    print("\nFinal Response:", result["final_response"])
+    print("\nResponse Source:", result["intermediate_results"]["qna"]["response_source"])
+    print("Responses Similar:", result["intermediate_results"]["qna"]["responses_similar"])
+    print("\nLLM Response:", result["intermediate_results"]["qna"]["llm_response"])
+    print("\nRAG Response:", result["intermediate_results"]["qna"]["rag_response"]) 
@@ -1,22 +1,22 @@
 import torch
+import os
+import warnings
+
+warnings.filterwarnings("ignore", category=FutureWarning)
+warnings.filterwarnings("ignore", message=".*resume_download.*")
+
+CURRENT_DIR = os.path.dirname(os.path.abspath(__file__))
+PROJECT_ROOT = os.path.dirname(os.path.dirname(os.path.dirname(CURRENT_DIR)))
 
 # Model configurations
 MODEL_NAME = 'BM-K/KoSimCSE-roberta'
 DEVICE = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
 
-# ChromaDB configurations
-CHROMA_DB_PATH = "./chroma_db"
-COLLECTION_NAMES = {
-    "question": "q_embeddings",
-    "snippet": "s_embeddings", 
-    "keyword": "k_embeddings"
-}
-
-# Data file paths
+# VectorDB data file paths
 DATA_FILES = {
-    "question": "VectorDB/q_data.pkl",
-    "snippet": "VectorDB/s_data.pkl",
-    "keyword": "VectorDB/k_data.pkl"
+    "question": os.path.join(CURRENT_DIR, "VectorDB", "q_data.pkl"),
+    "snippet": os.path.join(CURRENT_DIR, "VectorDB", "s_data.pkl"),
+    "keyword": os.path.join(CURRENT_DIR, "VectorDB", "k_data.pkl")
 }
 
 # Search configurations
 
@@ -4,7 +4,7 @@
 import torch
 import numpy as np
 from transformers import AutoTokenizer, AutoModel
-from config import MODEL_NAME, DEVICE
+from core.qna.config import MODEL_NAME, DEVICE
 
 
 class TextEncoder:
 
@@ -4,7 +4,7 @@
 import os
 from openai import OpenAI
 from dotenv import load_dotenv
-from config import OPENAI_MODEL, GENERATION_TEMPERATURE, MAX_REFERENCE_DOCS
+from core.qna.config import OPENAI_MODEL, GENERATION_TEMPERATURE, MAX_REFERENCE_DOCS
 
 load_dotenv()
-Original file line number
+Diff line change
 # IDE 파일
 .idea/
 -*.iml
 +*.iml
++