參考 DelphiAgent: Multi-agent verification framework for automated fact verification 架構實作的 Multi-agent framework
| Model | Label | Precision | Recall | Accuracy |
|---|---|---|---|---|
| llm | true | 75.00% | 60.00% | 61.00% |
| false | 45.83% | 62.86% | ||
| llm + search | true | 76.54% | 95.38% | 78.00% |
| false | 84.21% | 45.71% | ||
| framework + search | true | 80.60% | 83.08% | 76.00% |
| false | 70.97% | 62.86% |
- 本框架除了很慢還比較弱,跟問題有關?
- FIRE 框架成本低,像是優化的 LLM agent,更適合這種任務
-
MCP: 以 web search + web fetch MCP 讓 LLM 到 planner agent 的網站中自己找證據 (不用自己寫爬蟲)
-
Crawler: 以 SERP 找出 url,用 trafilatura 去爬蟲,影片用 youtube-transcript-api,PDF 用 PyMuPDF
-
SERP
-
crawler
-
開源套件
- crawl4ai: 多 link 雜訊
- trafilatura: 不穩定
- crawl4ai + mistune: 搭 crawl4ai 沒啥用
- readability-lxml + bs4: 似乎可用,但有以下問題
- header, footer 雜訊
-
怎麼辨別來源是否可信?
- 檢查 domain
- Python 3.11
- uv
Windows (PowerShell):
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"macOS/Linux:
curl -LsSf https://astral.sh/uv/install.sh | shuv venvuv pip synccp .env.example .env編輯 .env 檔案並輸入你的 API key:
API_KEY=your_api_key_here
uv run python script.py