X-AnyLabeling/README_zh-CN.md at main · CVHub520/X-AnyLabeling

简体中文 | English

SAM3_VIDEO_DEMO.mp4

自动训练

UltralyticsTrainingPlatforms.mp4

自动标注

annotation.mp4

检测一切

分割一切

可提示概念定位

YOLOE.mp4

视觉问答

VQA-v2.mp4

聊天机器人

图像分类器

image_classifier_demo.mp4

OCR识别

PaddleOCR-VL-1.5.mp4

🥳 新功能

2026-04-26: 新增客户端（本地 ONNX）支持 SAM 3 文本驱动分割。
2026-04-25: 新增支持 GeCo2 目标计数模型。
2026-04-19: 新增标注检查状态流程，便于快速复核已标注图片。
2026-04-19: 新增支持 YOLO 模型 TensorRT 后端推理。
2026-04-18: 新增支持将标注可视化结果导出为图片或视频。
2026-04-18: 新增支持 PaddleOCR 文档解析与智能文字识别标注面板。
2026-04-01: 新增支持日语和韩语界面语言（ja_JP、ko_KR）。
2026-03-22: 新增支持在 GUI 中通过内置设置面板直接调整常用选项。
2026-03-10: 新增支持从矩形生成 3D Cuboid 对象标注。
2026-03-01: 完成 PyQt5 到 PyQt6 的升级重构（Beta 版本），并同步修复与优化若干功能细节。
更多详情，请参考更新日志

简介

X-AnyLabeling 是一款基于AI推理引擎和丰富功能特性于一体的强大辅助标注工具，其专注于实际应用，致力于为多模态数据工程师提供工业级的一站式解决方案，可自动快速进行各种复杂任务的标定。

此外，我们强烈推荐您尝试 X-AnyLabeling-Server，这是一个简单、轻量级且可扩展的框架，为 X-AnyLabeling 提供远程推理能力。

新特性

支持远程推理服务。
支持 ONNX Runtime、TensorRT、OpenCV DNN 等灵活后端加速推理。
支持一键预测所有图像。
支持图像和视频处理。
支持英文、中文、日文、韩文 四种界面语言。
支持自定义模型和二次开发。
支持一键导入和导出多种标签格式，如 COCO、VOC、YOLO、DOTA、MOT、MASK、PPOCR、MMGF、VLM-R1、ShareGPT 等；
支持多种图像标注样式，包括 多边形、矩形、长方体、旋转框、圆形、线条、点，以及 文本检测、识别 和 KIE 标注；
支持各类视觉任务，如图像分类、目标检测、实例分割、姿态估计、旋转检测、多目标跟踪、光学字符识别、图像文本描述、车道线检测、分割一切、视觉问答、文档解析等。

模型库

任务类别	支持模型
🖼️ 图像分类	YOLOv5-Cls, YOLOv8-Cls, YOLO11-Cls, InternImage, PULC
🎯 目标检测	YOLOv5/6/7/8/9/10, YOLO11/12/26, YOLOX, YOLO-NAS, D-FINE, DAMO-YOLO, Gold_YOLO, RT-DETR, RF-DETR, DEIMv2
🖌️ 实例分割	YOLOv5-Seg, YOLOv8-Seg, YOLO11-Seg, YOLO26-Seg, Hyper-YOLO-Seg, RF-DETR-Seg
🏃 姿态估计	YOLOv8-Pose, YOLO11-Pose, YOLO26-Pose, DWPose, RTMO
👣 目标跟踪	Bot-SORT, ByteTrack, SAM2/3-Video
🔄 旋转目标检测	YOLOv5-Obb, YOLOv8-Obb, YOLO11-Obb, YOLO26-Obb
📏 深度估计	Depth Anything
🧩 分割一切	SAM 1/2/3, SAM-HQ, SAM-Med2D, EdgeSAM, EfficientViT-SAM, MobileSAM
✂️ 图像抠图	RMBG 1.4/2.0
💡 候选框提取	UPN
🏷️ 图像标记	RAM, RAM++
📄 光学字符识别	PP-OCRv4, PP-OCRv5
🧾 综合版面分析	PP-DocLayoutV3
📑 文档解析	PaddleOCR-VL, PaddleOCR-VL-1.5
🗣️ 视觉基础模型	Rex-Omni, Florence2
👁️ 视觉语言模型	Qwen3-VL, Gemini, ChatGPT, GLM
🛣️ 车道线检测	CLRNet
🔢 目标计数	CountGD, GeCO, GeCo2
📍 视觉定位	Grounding DINO, YOLO-World, YOLOE
📚 其他	👉 model_zoo 👈

文档

示例

贡献指南

我们欢迎社区协作！X‑AnyLabeling 项目的成长离不开开发者们的共同参与，无论是修复 Bug、优化文档、还是添加新功能，您的贡献都非常宝贵。

在参与前请阅读我们的贡献指南，并在提交 Pull Request 前确认您已同意贡献者许可协议 (CLA)。

如果你觉得这个项目有帮助，请点亮右上角的⭐星标⭐。如有任何问题或疑问，欢迎创建 issue 或发送邮件至 cv_hub@163.com。

衷心感谢每一位为项目贡献力量的朋友 🙏

许可

本项目遵循 GPL-3.0 license 协议，完全开源免费，初衷是希望让更多开发者、研究者和企业能够便捷地使用 AI 应用平台，推动整个行业的发展。我们鼓励大家自由使用（包括商业用途），也可以基于本项目添加功能并进行商业化，但必须保留品牌标识并标注源项目地址。

此外，为了了解 X-AnyLabeling 的生态和使用情况，如果您将本项目用于学术、科研、教学或是企业用户，请在此填写登记表。此登记仅用于统计使用情况，不会产生任何费用，我们会对信息严格保密。

X-AnyLabeling 由个人独立开发和维护。如果本项目对您有所帮助，欢迎通过下方捐赠链接支持项目持续发展，您的支持是对我最大的鼓励！如对项目有任何疑问或希望合作，欢迎随时微信联系：ww10874。

赞助

微信支付	支付宝

感谢您的支持！

引用

如果您在研究中使用了这个软件，请按照以下方式引用它：

@misc{X-AnyLabeling,
  year = {2023},
  author = {Wei Wang},
  publisher = {Github},
  organization = {CVHub},
  journal = {Github repository},
  title = {Advanced Auto Labeling Solution with Added Features},
  howpublished = {\url{https://github.com/CVHub520/X-AnyLabeling}}
}

🔝 返回顶部

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

🥳 新功能

简介

新特性

模型库

文档

示例

贡献指南

许可

赞助

引用

Uh oh!

FilesExpand file tree

README_zh-CN.md

Latest commit

History

README_zh-CN.md

File metadata and controls

🥳 新功能

简介

新特性

模型库

文档

示例

贡献指南

许可

赞助

引用