SAM3_VIDEO_DEMO.mp4
自动训练
UltralyticsTrainingPlatforms.mp4
自动标注
annotation.mp4
可提示概念定位
YOLOE.mp4
视觉问答
VQA-v2.mp4
图像分类器
image_classifier_demo.mp4
OCR识别
PaddleOCR-VL-1.5.mp4
2026-04-26: 新增客户端(本地 ONNX)支持 SAM 3 文本驱动分割。2026-04-25: 新增支持 GeCo2 目标计数模型。2026-04-19: 新增标注检查状态流程,便于快速复核已标注图片。2026-04-19: 新增支持 YOLO 模型 TensorRT 后端推理。2026-04-18: 新增支持将标注可视化结果导出为图片或视频。2026-04-18: 新增支持 PaddleOCR 文档解析与智能文字识别标注面板。2026-04-01: 新增支持日语和韩语界面语言(ja_JP、ko_KR)。2026-03-22: 新增支持在 GUI 中通过内置设置面板直接调整常用选项。2026-03-10: 新增支持从矩形生成 3D Cuboid 对象标注。2026-03-01: 完成 PyQt5 到 PyQt6 的升级重构(Beta 版本),并同步修复与优化若干功能细节。- 更多详情,请参考更新日志
X-AnyLabeling 是一款基于AI推理引擎和丰富功能特性于一体的强大辅助标注工具,其专注于实际应用,致力于为多模态数据工程师提供工业级的一站式解决方案,可自动快速进行各种复杂任务的标定。
此外,我们强烈推荐您尝试 X-AnyLabeling-Server,这是一个简单、轻量级且可扩展的框架,为 X-AnyLabeling 提供远程推理能力。
- 支持远程推理服务。
- 支持
ONNX Runtime、TensorRT、OpenCV DNN等灵活后端加速推理。 - 支持一键预测所有图像。
- 支持
图像和视频处理。 - 支持
英文、中文、日文、韩文四种界面语言。 - 支持自定义模型和二次开发。
- 支持一键导入和导出多种标签格式,如
COCO、VOC、YOLO、DOTA、MOT、MASK、PPOCR、MMGF、VLM-R1、ShareGPT等; - 支持多种图像标注样式,包括
多边形、矩形、长方体、旋转框、圆形、线条、点,以及文本检测、识别和KIE标注; - 支持各类视觉任务,如
图像分类、目标检测、实例分割、姿态估计、旋转检测、多目标跟踪、光学字符识别、图像文本描述、车道线检测、分割一切、视觉问答、文档解析等。
| 任务类别 | 支持模型 |
|---|---|
| 🖼️ 图像分类 | YOLOv5-Cls, YOLOv8-Cls, YOLO11-Cls, InternImage, PULC |
| 🎯 目标检测 | YOLOv5/6/7/8/9/10, YOLO11/12/26, YOLOX, YOLO-NAS, D-FINE, DAMO-YOLO, Gold_YOLO, RT-DETR, RF-DETR, DEIMv2 |
| 🖌️ 实例分割 | YOLOv5-Seg, YOLOv8-Seg, YOLO11-Seg, YOLO26-Seg, Hyper-YOLO-Seg, RF-DETR-Seg |
| 🏃 姿态估计 | YOLOv8-Pose, YOLO11-Pose, YOLO26-Pose, DWPose, RTMO |
| 👣 目标跟踪 | Bot-SORT, ByteTrack, SAM2/3-Video |
| 🔄 旋转目标检测 | YOLOv5-Obb, YOLOv8-Obb, YOLO11-Obb, YOLO26-Obb |
| 📏 深度估计 | Depth Anything |
| 🧩 分割一切 | SAM 1/2/3, SAM-HQ, SAM-Med2D, EdgeSAM, EfficientViT-SAM, MobileSAM |
| ✂️ 图像抠图 | RMBG 1.4/2.0 |
| 💡 候选框提取 | UPN |
| 🏷️ 图像标记 | RAM, RAM++ |
| 📄 光学字符识别 | PP-OCRv4, PP-OCRv5 |
| 🧾 综合版面分析 | PP-DocLayoutV3 |
| 📑 文档解析 | PaddleOCR-VL, PaddleOCR-VL-1.5 |
| 🗣️ 视觉基础模型 | Rex-Omni, Florence2 |
| 👁️ 视觉语言模型 | Qwen3-VL, Gemini, ChatGPT, GLM |
| 🛣️ 车道线检测 | CLRNet |
| 🔢 目标计数 | CountGD, GeCO, GeCo2 |
| 📍 视觉定位 | Grounding DINO, YOLO-World, YOLOE |
| 📚 其他 | 👉 model_zoo 👈 |
- Classification
- Detection
- Segmentation
- Description
- Estimation
- OCR
- MOT
- iVOS
- Matting
- Vision-Language
- Counting
- Grounding
- Training
我们欢迎社区协作!X‑AnyLabeling 项目的成长离不开开发者们的共同参与,无论是修复 Bug、优化文档、还是添加新功能,您的贡献都非常宝贵。
在参与前请阅读我们的 贡献指南,并在提交 Pull Request 前确认您已同意 贡献者许可协议 (CLA)。
如果你觉得这个项目有帮助,请点亮右上角的⭐星标⭐。如有任何问题或疑问,欢迎创建 issue 或发送邮件至 cv_hub@163.com。
衷心感谢每一位为项目贡献力量的朋友 🙏
本项目遵循 GPL-3.0 license 协议,完全开源免费,初衷是希望让更多开发者、研究者和企业能够便捷地使用 AI 应用平台,推动整个行业的发展。我们鼓励大家自由使用(包括商业用途),也可以基于本项目添加功能并进行商业化,但必须保留品牌标识并标注源项目地址。
此外,为了了解 X-AnyLabeling 的生态和使用情况,如果您将本项目用于学术、科研、教学或是企业用户,请在此填写登记表。此登记仅用于统计使用情况,不会产生任何费用,我们会对信息严格保密。
X-AnyLabeling 由个人独立开发和维护。如果本项目对您有所帮助,欢迎通过下方捐赠链接支持项目持续发展,您的支持是对我最大的鼓励!如对项目有任何疑问或希望合作,欢迎随时微信联系:ww10874。
| 微信支付 | 支付宝 |
|---|---|
![]() |
![]() |
感谢您的支持!
如果您在研究中使用了这个软件,请按照以下方式引用它:
@misc{X-AnyLabeling,
year = {2023},
author = {Wei Wang},
publisher = {Github},
organization = {CVHub},
journal = {Github repository},
title = {Advanced Auto Labeling Solution with Added Features},
howpublished = {\url{https://github.com/CVHub520/X-AnyLabeling}}
}






