Merge pull request #18 from hanjuhn/main

dongyeon1031 · web-flow · commit 0b1cf648bc6e · 2025-07-19T19:27:28.000+09:00
chore: 입출력 디테일 수정
diff --git a/core/tariff_prediction/agent/step_api.py b/core/tariff_prediction/agent/step_api.py
@@ -3,6 +3,7 @@
 from core.tariff_prediction.tools.get_hs_classification import get_hs_classification
 from core.tariff_prediction.tools.parse_hs_results import parse_hs6_result, generate_hs10_candidates
 from core.tariff_prediction.tools.calculate_tariff_amount import calculate_tariff_amount
+from core.tariff_prediction.tools.parse_tariff_result import parse_tariff_result
 from core.shared.utils.llm import get_llm
 
 def tariff_prediction_step_api(req: TariffPredictionRequest) -> TariffPredictionResponse:
@@ -48,18 +49,27 @@ def tariff_prediction_step_api(req: TariffPredictionRequest) -> TariffPrediction
             "shipping_cost": req.shipping_cost,
             "situation": req.scenario
         })
-        if isinstance(result, str):
+        
+        # 결과를 문자열로 변환
+        result_str = str(result)
+        
+        # 에러 메시지인지 확인 (에러 메시지는 보통 짧고 특정 키워드를 포함)
+        if result_str.startswith("오류") or result_str.startswith("Error") or "실패" in result_str or "오류" in result_str:
             # 에러 메시지
             return TariffPredictionResponse(
                 step="result",
                 calculation_result=None,
-                message=result
+                message=result_str
             )
         else:
+            # 성공적인 결과 - 예쁘게 포맷팅
+            parsed_result = parse_tariff_result(result_str)
+            formatted_result = parsed_result['formatted_result']
+            
             return TariffPredictionResponse(
                 step="result",
-                calculation_result=result,
-                message="관세 계산 결과입니다."
+                calculation_result=parsed_result,  # 딕셔너리 형태로 전달
+                message=formatted_result  # 포맷팅된 결과를 message에 전달
             )
     else:
         return TariffPredictionResponse(
diff --git a/core/tariff_prediction/agent/tariff_prediction_agent.py b/core/tariff_prediction/agent/tariff_prediction_agent.py
@@ -229,6 +229,16 @@ def handle_input_collection(self, user_input: str) -> str:
                 enhanced_input = merge_context_with_current(context_info, current_part)
         
         parsed = self.parse_user_input(enhanced_input)
+        
+        # 상품명이 없으면 입력 전체를 상품명으로 사용
+        if 'product_name' not in parsed or not parsed['product_name']:
+            # 입력에서 불필요한 키워드 제거 후 상품명으로 사용
+            cleaned_input = user_input.strip()
+            for keyword in ['관세', '예측', '계산', '해줘', '알려줘', '어떻게', '해주세요']:
+                cleaned_input = cleaned_input.replace(keyword, '').strip()
+            if cleaned_input:
+                parsed['product_name'] = cleaned_input
+        
         # 필수 정보 확인
         missing_info = []
         if 'product_name' not in parsed or not parsed['product_name']:
@@ -450,8 +460,14 @@ def handle_hs10_selection(self, user_input: str) -> str:
                 )
                 resp: TariffPredictionResponse = tariff_prediction_step_api(req)
                 self.reset_session()
-                if resp.calculation_result:
-                    response = f"# 🎯 관세 계산 결과\n{resp.calculation_result}\n\n{resp.message or ''}"
+                if resp.message and "📊 관세 계산 결과" in resp.message:
+                    # 포맷팅된 결과가 message에 있음
+                    response = resp.message
+                    self.state['responses'].append(response)
+                    return response
+                elif resp.calculation_result:
+                    # 딕셔너리 형태의 결과가 있으면 포맷팅
+                    response = resp.calculation_result.get('formatted_result', str(resp.calculation_result))
                     self.state['responses'].append(response)
                     return response
                 else:
@@ -677,13 +693,11 @@ def tariff_prediction_agent(state: CustomsAgentState) -> CustomsAgentState:
     
     # 컨텍스트가 있으면 쿼리와 결합
     if enhanced_context:
-        enhanced_query = f"이전 대화 및 LLM 응답: {enhanced_context}\n\n현재 질문: {state['query']}"
-        print(f"[DEBUG] Enhanced query with LLM context: {enhanced_query}")
+        enhanced_query = f"{enhanced_context}\n\n{state['query']}"
         response = workflow.process_user_input(enhanced_query)
     else:
         response = workflow.process_user_input(state["query"])
     
-    print(f"[DEBUG] tariff_prediction_agent response: {response}")
     
     state["final_response"] = response
     return state
diff --git a/core/tariff_prediction/constants/constants.py b/core/tariff_prediction/constants/constants.py
@@ -123,9 +123,7 @@
     'prediction_failed': "HS 코드 예측에 실패했습니다. 상품명을 더 구체적으로 입력해 주세요.",
     'reprediction_failed': "HS 코드 예측에 다시 실패했습니다. 상품명을 더 구체적으로 입력해 주세요.",
     'reprediction_error': "HS 코드 재예측 중 오류가 발생했습니다. 다시 시도해 주세요.",
-    'no_hs6_code': "HS6 코드가 없어 HS10 코드 예측을 다시 시도할 수 없습니다. HS6 코드부터 다시 선택해 주세요.",
-    'hs10_prediction_failed': "HS10 코드 예측에 실패했습니다. HS6 코드를 다시 선택해 주세요.",
-    'hs10_reprediction_error': "HS10 코드 재예측 중 오류가 발생했습니다. 다시 시도해 주세요.",
+
     'input_processing_error': "입력 처리 중 오류가 발생했습니다. 숫자를 입력하거나, 재예측을 원하시면 '다시', '재예측' 등으로 입력해 주세요.",
     'unknown_state': "죄송합니다. 현재 상태를 인식할 수 없습니다. 처음부터 다시 시작하겠습니다.",
     'calculation_failed': "계산 결과를 가져오지 못했습니다.",
diff --git a/core/tariff_prediction/tools/parse_tariff_result.py b/core/tariff_prediction/tools/parse_tariff_result.py
@@ -1,15 +1,37 @@
 from typing import Dict, Any
 from langchain_core.tools import tool
 
+def format_price(price_str: str) -> str:
+    """가격을 깔끔하게 포맷팅합니다."""
+    try:
+        # 숫자 부분만 추출
+        price_str = price_str.replace('원', '').replace(',', '').strip()
+        price = float(price_str)
+        
+        # 정수인 경우 정수로, 소수인 경우 소수점 2자리까지
+        if price.is_integer():
+            return f"{int(price):,}원"
+        else:
+            return f"{price:,.2f}원"
+    except:
+        return price_str
+
 @tool
 def parse_tariff_result(tariff_result: str) -> Dict[str, Any]:
     """관세 계산 결과를 파싱하고 포맷팅합니다."""
     parsed = {
+        'hs_code': '',
+        'origin_country': '',
+        'product_price': '',
+        'quantity': '',
+        'shipping_cost': '',
         'tariff_rate': '0%',
         'tariff_amount': '0원',
         'vat_amount': '0원',
         'total_tax': '0원',
+        'tariff_rule': '',
         'fta_applied': 'No',
+        'note': '',
         'formatted_result': tariff_result
     }
     
@@ -18,38 +40,74 @@ def parse_tariff_result(tariff_result: str) -> Dict[str, Any]:
         lines = tariff_result.split('\n')
         for line in lines:
             line = line.strip()
-            if '관세율:' in line:
+            if 'HS코드:' in line:
+                parsed['hs_code'] = line.split(':')[-1].strip()
+            elif '원산지:' in line:
+                parsed['origin_country'] = line.split(':')[-1].strip()
+            elif '상품가격:' in line:
+                parsed['product_price'] = line.split(':')[-1].strip()
+            elif '수량:' in line:
+                parsed['quantity'] = line.split(':')[-1].strip()
+            elif '배송비:' in line:
+                parsed['shipping_cost'] = line.split(':')[-1].strip()
+            elif '관세율:' in line:
                 parsed['tariff_rate'] = line.split(':')[-1].strip()
             elif '관세금액:' in line:
                 parsed['tariff_amount'] = line.split(':')[-1].strip()
             elif '부가가치세:' in line:
                 parsed['vat_amount'] = line.split(':')[-1].strip()
             elif '총 세금:' in line:
                 parsed['total_tax'] = line.split(':')[-1].strip()
+            elif '적용 관세 규칙:' in line:
+                parsed['tariff_rule'] = line.split(':')[-1].strip()
             elif 'FTA 적용:' in line:
                 parsed['fta_applied'] = line.split(':')[-1].strip()
+            elif '비고:' in line:
+                parsed['note'] = line.split(':')[-1].strip()
+        
+        # 가격 포맷팅
+        formatted_price = format_price(parsed['product_price'])
+        formatted_shipping = format_price(parsed['shipping_cost'])
+        formatted_tariff = format_price(parsed['tariff_amount'])
+        formatted_vat = format_price(parsed['vat_amount'])
+        formatted_total = format_price(parsed['total_tax'])
         
         # 마크다운 형식의 결과 포맷팅
-        if parsed['tariff_amount'] != '0원':
-            formatted_result = f"""| 항목 | 금액 |
+        formatted_result = f"""## 📊 관세 계산 결과
+
+### 📦 상품 정보
+| 항목 | 내용 |
+|------|------|
+| **HS 코드** | `{parsed['hs_code']}` |
+| **원산지** | {parsed['origin_country']} |
+| **상품 가격** | {formatted_price} |
+| **수량** | {parsed['quantity']}개 |
+| **배송비** | {formatted_shipping} |
+
+### 💰 세금 정보
+| 항목 | 금액 |
 |------|------|
 | **관세율** | {parsed['tariff_rate']} |
-| **관세금액** | {parsed['tariff_amount']} |
-| **부가가치세** | {parsed['vat_amount']} |
-| **총 세금** | {parsed['total_tax']} |
-| **FTA 적용** | {parsed['fta_applied']} |"""
-        else:
-            formatted_result = f"""| 항목 | 금액 |
+| **관세금액** | {formatted_tariff} |
+| **부가가치세** | {formatted_vat} |
+| **총 세금** | **{formatted_total}** |
+
+### 📋 추가 정보
+| 항목 | 내용 |
 |------|------|
-| **관세금액** | {parsed['tariff_amount']} (면세) |
-| **부가가치세** | {parsed['vat_amount']} |
-| **총 세금** | {parsed['total_tax']} |
-| **FTA 적용** | {parsed['fta_applied']} |"""
+| **적용 관세 규칙** | {parsed['tariff_rule']} |
+| **FTA 적용** | {parsed['fta_applied']} |
+| **비고** | {parsed['note']} |"""
         
         parsed['formatted_result'] = formatted_result
         
     except Exception as e:
-        # 파싱 실패 시 원본 결과 사용
-        parsed['formatted_result'] = f"```\n{tariff_result}\n```"
+        # 파싱 실패 시 원본 결과를 예쁘게 포맷팅
+        formatted_result = f"""## 📊 관세 계산 결과
+
+```
+{tariff_result}
+```"""
+        parsed['formatted_result'] = formatted_result
     
     return parsed 
diff --git a/core/tariff_prediction/tools/parse_user_input.py b/core/tariff_prediction/tools/parse_user_input.py
@@ -7,6 +7,12 @@
 
 def parse_user_input_rule(user_input: str) -> Dict[str, Any]:
     parsed = {}
+    
+    # 상품명을 먼저 추출 (가장 중요한 정보)
+    product_name = extract_product_name(user_input)
+    if product_name:
+        parsed['product_name'] = product_name
+    
     # 가격 정보 추출 (만원, 천원, 원, 달러, 엔, 위안 등)
     price = None
     for pattern in PRICE_PATTERNS:
@@ -24,6 +30,7 @@ def parse_user_input_rule(user_input: str) -> Dict[str, Any]:
                 break
             except Exception:
                 continue
+    
     # 수량 정보 추출 (숫자+개, 한 개, 두 개 등)
     quantity = None
     for pattern in QUANTITY_PATTERNS + [r'([한두세네]) ?개']:
@@ -39,6 +46,7 @@ def parse_user_input_rule(user_input: str) -> Dict[str, Any]:
                 break
             except Exception:
                 continue
+    
     # 국가 정보 추출 (미국에서, 일본에서 등 조사 포함)
     country = None
     for c in SUPPORTED_COUNTRIES.keys():
@@ -50,49 +58,93 @@ def parse_user_input_rule(user_input: str) -> Dict[str, Any]:
             country = c
             parsed['country'] = c
             break
-    # 상품명/묘사 추출
+    
+    return parsed
+
+def extract_product_name(user_input: str) -> str:
+    """상품명을 추출하는 전용 함수"""
+    # 간단한 상품명 패턴 (단일 단어 또는 짧은 구문)
+    simple_patterns = [
+        r'^([가-힣a-zA-Z0-9]+)$',  # 단일 단어 (커피, 노트북 등)
+        r'^([가-힣a-zA-Z0-9\s]+)$',  # 단일 단어 + 공백
+        r'([가-힣a-zA-Z0-9]+)\s*(?:을|를|이|가|의)',  # 조사 앞의 단어
+        r'(?:이|가|을|를)\s*([가-힣a-zA-Z0-9]+)',  # 조사 뒤의 단어
+    ]
+    
+    for pattern in simple_patterns:
+        match = re.search(pattern, user_input.strip())
+        if match:
+            product = match.group(1).strip()
+            if product and len(product) >= 2:  # 최소 2글자 이상
+                return product
+    
+    # 기존 방식으로 정제
     cleaned = user_input
     for pattern in PRICE_PATTERNS + QUANTITY_PATTERNS + [r'([한두세네]) ?개']:
         cleaned = re.sub(pattern, '', cleaned)
-    if country:
-        cleaned = cleaned.replace(country, '')
-        cleaned = cleaned.replace(country + '에서', '')
-    for keyword in REMOVE_KEYWORDS + ['샀어요', '구매', '예측해줘', '관세', '예측', '해줘']:
+    
+    # 국가명 제거
+    for c in SUPPORTED_COUNTRIES.keys():
+        cleaned = cleaned.replace(c, '')
+        cleaned = cleaned.replace(c + '에서', '')
+    
+    # 불필요한 키워드 제거
+    for keyword in REMOVE_KEYWORDS + ['샀어요', '구매', '예측해줘', '관세', '예측', '해줘', '어떻게', '알려줘', '계산', '해주세요']:
         cleaned = cleaned.replace(keyword, '')
+    
     cleaned = cleaned.strip()
-    if cleaned and len(cleaned) > 1:
-        parsed['product_name'] = cleaned
-    return parsed
+    
+    # 정제된 결과가 있으면 반환
+    if cleaned and len(cleaned) >= 2:
+        return cleaned
+    
+    # 마지막 수단: 입력 전체를 상품명으로 사용 (단, 너무 길지 않은 경우)
+    if len(user_input.strip()) <= 20 and len(user_input.strip()) >= 2:
+        return user_input.strip()
+    
+    return ""
 
 @tool
 def parse_user_input(user_input: str) -> Dict[str, Any]:
     """자연어 입력을 LLM으로 파싱하여 상품 정보를 추출합니다. 실패 시 rule 기반 파싱을 fallback으로 사용합니다."""
+    
+    # 간단한 입력의 경우 rule 기반 파싱을 우선 사용
+    if len(user_input.strip()) <= 10:
+        rule_result = parse_user_input_rule(user_input)
+        if rule_result.get('product_name'):
+            return rule_result
+    
     prompt = f"""
 아래는 관세 예측을 위한 사용자 입력입니다. 입력에서 다음 정보를 추출해 JSON으로 반환하세요.
-- product_name: 상품명 또는 상품 설명 (예: 노트북, 운동화, 블루투스 이어폰)
+- product_name: 상품명 또는 상품 설명 (가장 중요한 정보, 반드시 추출해야 함)
 - country: 구매 국가 (예: 미국, 일본, 독일 등)
 - price: 상품 가격(원화가 아닌 경우 원래 통화 단위 그대로 유지, 숫자만)
 - price_unit: 가격 단위 (원, 달러, 엔, 위안, 유로 등)
 - quantity: 수량(숫자, 없으면 1)
 
 입력: "{user_input}"
 
+주의사항:
+1. product_name은 반드시 추출해야 합니다. 입력이 "커피"라면 product_name은 "커피"여야 합니다.
+2. 입력이 단순한 상품명만 있는 경우에도 product_name을 추출하세요.
+3. 가격이나 국가 정보가 없어도 상품명은 반드시 추출하세요.
+
 반환 예시:
 {{
-  "product_name": "노트북",
-  "country": "미국",
-  "price": 150,
-  "price_unit": "달러",
+  "product_name": "커피",
+  "country": null,
+  "price": null,
+  "price_unit": null,
   "quantity": 1
 }}
 
 또는
 
 {{
-  "product_name": "운동화",
-  "country": "독일",
-  "price": 80,
-  "price_unit": "유로",
+  "product_name": "노트북",
+  "country": "미국",
+  "price": 150,
+  "price_unit": "달러",
   "quantity": 1
 }}
 
@@ -107,10 +159,17 @@ def parse_user_input(user_input: str) -> Dict[str, Any]:
         json_start = json_str.find('{')
         json_end = json_str.rfind('}') + 1
         parsed = json.loads(json_str[json_start:json_end])
-        # 값이 하나라도 있으면 반환
-        if parsed and (parsed.get('product_name') or parsed.get('country') or parsed.get('price')):
+        # product_name이 있으면 반환 (가장 중요한 정보)
+        if parsed and parsed.get('product_name'):
             return parsed
     except Exception:
         pass
+    
     # 실패 시 rule 기반 파싱
-    return parse_user_input_rule(user_input) 
+    rule_result = parse_user_input_rule(user_input)
+    
+    # rule 기반 파싱에서도 product_name이 없으면 입력 전체를 상품명으로 사용
+    if not rule_result.get('product_name') and user_input.strip():
+        rule_result['product_name'] = user_input.strip()
+    
+    return rule_result