Skip to content

breezedeus/docai-skills

Repository files navigation

DocAI Skills Marketplace

一个专注于文档 AI 相关技能的 Claude Code Skill 集合。

安装到 Claude Code

GitHub Marketplace(推荐)

# 1. 添加 marketplace 来源
/plugin marketplace add breezedeus/docai-skills

# 2. 安装具体 skills
/plugin install docai-web2md
/plugin install docai-web2summary

# 3. 或安装所有
/plugin install docai-skills

已实现的 Skills

docai:web2md - 网页转 Markdown

将网页链接转换为 Markdown 格式,支持多种平台。

支持:

  • 静态页面(博客、文档)
  • 动态页面(React/Vue SPA)
  • 社交媒体(X.com, Twitter)
  • 微信公众号文章
  • arXiv 论文(HTML 优先,PDF 回退)
  • 纯文本模式

转换方式: 并行发起 Jina Reader / Firecrawl / Python,取最快成功的结果。

安装 Python 依赖(仅用于回退方法):

pip install requests beautifulsoup4 markdownify pymupdf

使用:

帮我把 https://www.breezedeus.com/article/ai-agent-context-engineering 转换成 Markdown

测试结果:

  • ✅ arXiv 论文:HTML 优先,~1-3 秒
  • ✅ 静态博客:Jina Reader,~1-2 秒
  • ✅ 微信公众号:Python 直连,~2-5 秒
  • ✅ 动态页面:Python,~5-10 秒

详见: skills/docai-web2md/README.md | 使用指南


docai:web2summary - 网页智能总结

基于 docai-web2md 获取网页内容,由 AI 直接完成结构化总结。

工作流程:

  1. 调用 docai-web2md 将 URL 转为 Markdown
  2. AI 自动判断内容类型,按规范输出深度总结
  3. 可选:使用 info-card-designer 生成信息卡图片

使用:

帮我总结这个链接:https://arxiv.org/abs/2601.04500v1
总结 https://mp.weixin.qq.com/s/...

支持六种内容类型(自动判断):

  • 🔬 技术论文 → 核心洞见、技术细节、性能数据、应用场景、长期意义
  • 📰 新闻报道 → 核心事件、关键人物/机构、背景与影响、后续展望
  • 📚 教程指南 → 学习目标、前置条件、关键步骤、注意事项
  • 🚀 产品评测 → 产品定位、核心功能、竞品对比、适用人群
  • 🤖 AI 动态 → 核心动态、技术要点、行业影响、值得关注的信号
  • 📄 通用 → 核心内容、关键要点、价值与启发

详见: skills/docai-web2summary/README.md | 使用指南

计划中的 Skills

  • docai:pdf-extract - PDF 内容提取
  • docai:table-recognize - 表格识别与提取
  • docai:ocr - 图片文字识别
  • docai:layout-analyze - 文档布局分析
  • docai:doc-classify - 文档分类

🛠️ 开发环境设置

使用 uv(推荐)

# 1. 安装 uv(如果尚未安装)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 克隆项目
git clone <repo>
cd docai-skills

# 3. 初始化虚拟环境
uv sync

# 4. 执行脚本(方式 A:使用 uv run)
uv run python skills/docai-web2md/tools/convert.py https://example.com

# 4.1 启用 pre-commit hook
uv run pre-commit install

# 5. 或激活环境后执行(方式 B)
source .venv/bin/activate
python skills/docai-web2md/tools/convert.py https://example.com

使用 pip(传统方式)

# 1. 创建虚拟环境
python -m venv .venv
source .venv/bin/activate

# 2. 安装依赖
pip install -r requirements.txt  # 或手动安装
pip install requests beautifulsoup4 markdownify pymupdf

# 3. 执行脚本
python skills/docai-web2md/tools/convert.py https://example.com

⚠️ Claude Code Skill 集成

重要:Claude Code 调用 Skill 时使用系统 Python,需要额外配置:

# 选项 1: 安装到系统 Python(一次性)
uv pip install --system requests beautifulsoup4 markdownify pymupdf

# 选项 2: 使用 pip 安装到系统
pip install requests beautifulsoup4 markdownify pymupdf

详见:UV_ENVIRONMENT.md - 完整的 uv 环境管理指南

许可证

MIT License

About

Agent Skills with Document AI

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages