Skip to content

Latest commit

 

History

History
246 lines (191 loc) · 12.2 KB

File metadata and controls

246 lines (191 loc) · 12.2 KB

SAM3_VIDEO_DEMO.mp4
自动训练
UltralyticsTrainingPlatforms.mp4
自动标注
annotation.mp4
检测一切
分割一切
可提示概念定位
YOLOE.mp4
视觉问答
VQA-v2.mp4
聊天机器人
图像分类器
image_classifier_demo.mp4
OCR识别
PaddleOCR-VL-1.5.mp4

🥳 新功能

  • 2026-04-26: 新增客户端(本地 ONNX)支持 SAM 3 文本驱动分割。
  • 2026-04-25: 新增支持 GeCo2 目标计数模型。
  • 2026-04-19: 新增标注检查状态流程,便于快速复核已标注图片。
  • 2026-04-19: 新增支持 YOLO 模型 TensorRT 后端推理。
  • 2026-04-18: 新增支持将标注可视化结果导出为图片或视频。
  • 2026-04-18: 新增支持 PaddleOCR 文档解析与智能文字识别标注面板。
  • 2026-04-01: 新增支持日语和韩语界面语言(ja_JPko_KR)。
  • 2026-03-22: 新增支持在 GUI 中通过内置设置面板直接调整常用选项。
  • 2026-03-10: 新增支持从矩形生成 3D Cuboid 对象标注。
  • 2026-03-01: 完成 PyQt5 到 PyQt6 的升级重构(Beta 版本),并同步修复与优化若干功能细节。
  • 更多详情,请参考更新日志

简介

X-AnyLabeling 是一款基于AI推理引擎和丰富功能特性于一体的强大辅助标注工具,其专注于实际应用,致力于为多模态数据工程师提供工业级的一站式解决方案,可自动快速进行各种复杂任务的标定。

此外,我们强烈推荐您尝试 X-AnyLabeling-Server,这是一个简单、轻量级且可扩展的框架,为 X-AnyLabeling 提供远程推理能力。

新特性

  • 支持远程推理服务。
  • 支持 ONNX RuntimeTensorRTOpenCV DNN 等灵活后端加速推理。
  • 支持一键预测所有图像。
  • 支持图像视频处理。
  • 支持英文中文日文韩文 四种界面语言。
  • 支持自定义模型和二次开发。
  • 支持一键导入和导出多种标签格式,如 COCOVOCYOLODOTAMOTMASKPPOCRMMGFVLM-R1ShareGPT 等;
  • 支持多种图像标注样式,包括 多边形矩形长方体旋转框圆形线条,以及 文本检测识别KIE 标注;
  • 支持各类视觉任务,如图像分类目标检测实例分割姿态估计旋转检测多目标跟踪光学字符识别图像文本描述车道线检测分割一切视觉问答文档解析等。

模型库

任务类别 支持模型
🖼️ 图像分类 YOLOv5-Cls, YOLOv8-Cls, YOLO11-Cls, InternImage, PULC
🎯 目标检测 YOLOv5/6/7/8/9/10, YOLO11/12/26, YOLOX, YOLO-NAS, D-FINE, DAMO-YOLO, Gold_YOLO, RT-DETR, RF-DETR, DEIMv2
🖌️ 实例分割 YOLOv5-Seg, YOLOv8-Seg, YOLO11-Seg, YOLO26-Seg, Hyper-YOLO-Seg, RF-DETR-Seg
🏃 姿态估计 YOLOv8-Pose, YOLO11-Pose, YOLO26-Pose, DWPose, RTMO
👣 目标跟踪 Bot-SORT, ByteTrack, SAM2/3-Video
🔄 旋转目标检测 YOLOv5-Obb, YOLOv8-Obb, YOLO11-Obb, YOLO26-Obb
📏 深度估计 Depth Anything
🧩 分割一切 SAM 1/2/3, SAM-HQ, SAM-Med2D, EdgeSAM, EfficientViT-SAM, MobileSAM
✂️ 图像抠图 RMBG 1.4/2.0
💡 候选框提取 UPN
🏷️ 图像标记 RAM, RAM++
📄 光学字符识别 PP-OCRv4, PP-OCRv5
🧾 综合版面分析 PP-DocLayoutV3
📑 文档解析 PaddleOCR-VL, PaddleOCR-VL-1.5
🗣️ 视觉基础模型 Rex-Omni, Florence2
👁️ 视觉语言模型 Qwen3-VL, Gemini, ChatGPT, GLM
🛣️ 车道线检测 CLRNet
🔢 目标计数 CountGD, GeCO, GeCo2
📍 视觉定位 Grounding DINO, YOLO-World, YOLOE
📚 其他 👉 model_zoo 👈

文档

  1. 远程推理服务
  2. 安装文档
  3. 用户手册
  4. 命令行界面
  5. 自定义模型
  6. 常见问题答疑
  7. 聊天机器人
  8. 视觉问答
  9. 多类别图像分类器
  10. 文档解析与智能文字识别

示例

贡献指南

我们欢迎社区协作!X‑AnyLabeling 项目的成长离不开开发者们的共同参与,无论是修复 Bug、优化文档、还是添加新功能,您的贡献都非常宝贵。

在参与前请阅读我们的 贡献指南,并在提交 Pull Request 前确认您已同意 贡献者许可协议 (CLA)

如果你觉得这个项目有帮助,请点亮右上角的⭐星标⭐。如有任何问题或疑问,欢迎创建 issue 或发送邮件至 cv_hub@163.com

衷心感谢每一位为项目贡献力量的朋友 🙏

许可

本项目遵循 GPL-3.0 license 协议,完全开源免费,初衷是希望让更多开发者、研究者和企业能够便捷地使用 AI 应用平台,推动整个行业的发展。我们鼓励大家自由使用(包括商业用途),也可以基于本项目添加功能并进行商业化,但必须保留品牌标识并标注源项目地址。

此外,为了了解 X-AnyLabeling 的生态和使用情况,如果您将本项目用于学术、科研、教学或是企业用户,请在此填写登记表。此登记仅用于统计使用情况,不会产生任何费用,我们会对信息严格保密。

X-AnyLabeling 由个人独立开发和维护。如果本项目对您有所帮助,欢迎通过下方捐赠链接支持项目持续发展,您的支持是对我最大的鼓励!如对项目有任何疑问或希望合作,欢迎随时微信联系:ww10874。

赞助

微信支付 支付宝

感谢您的支持!

引用

如果您在研究中使用了这个软件,请按照以下方式引用它:

@misc{X-AnyLabeling,
  year = {2023},
  author = {Wei Wang},
  publisher = {Github},
  organization = {CVHub},
  journal = {Github repository},
  title = {Advanced Auto Labeling Solution with Added Features},
  howpublished = {\url{https://github.com/CVHub520/X-AnyLabeling}}
}

Star History Chart