X-AnyLabeling 聊天机器人 是一个集成的 AI 助手,使用户可以直接在标注工作流程中与大型语言模型 (LLM) 交互。此功能允许您使用自然语言进行聊天对话,批量运行图文问答数据,并支持一键导入或导出基于单轮、多轮对话的 Sharegpt 格式的多模态图像数据直接用于 LLaMA-Factory 等大模型微调框架进行训练。
open_chatbot_and_chat.mp4
要打开聊天机器人,请点击 X-AnyLabeling 中左侧工具栏的聊天机器人图标或使用如下快捷键快速启动聊天机器人对话界面。
- Windows/Linux:
Ctrl+1 - macOS:
⌘+1
首次启动时,您需要在 Chatbot 聊天窗口的右侧面板中配置必要的 API 凭据和模型。
该聊天机器人具有一个三面板界面,旨在简化交互。
select_model.mp4
| 提供商 | API 密钥 | API 文档 | 模型文档 |
|---|---|---|---|
| Anthropic | Link | Link | Link |
| DeepSeek | Link | Link | Link |
| Google AI | Link | Link | Link |
| Ollama | - | Link | Link |
| OpenAI | Link | Link | Link |
| OpenRouter | Link | Link | Link |
| Qwen | Link | Link | Link |
Note
Custom 提供商支持配置兼容 OpenAI API 格式的自定义端点。切换提供商后,模型列表将自动更新显示当前提供商的可用模型。
- 聊天窗口:查看您与 AI 的对话历史,支持复制、编辑、删除、重新运行功能
- 消息输入:输入您的问题或指令,支持一键清除当前对话历史记录
- 特殊命令:导入图像后,使用
@image提示包含当前图像
- 图像预览: 显示当前图像
- 功能组件:
- 图像导航: 切换上一张/下一张图像。
- 图像导入: 导入单个图像文件或整个目录。
- 数据导出: 导出标注结果文件。
- 批量处理: 对多个图像运行处理任务。
- 后端设置: 支持配置 API 端点和密钥,模型选择
- 生成参数: 支持输入系统提示、温度参数、最大输出长度
import_image_folder.mp4
针对当前图像提出问题,以帮助您高效升成单轮或多轮图文对话:
@image 请描述这张图像。
batch_run.mp4
使用相同的提示处理多张图片以加快工作流程:
- 加载一个图片文件夹
- 点击“运行所有图片”按钮
- 输入要应用于所有图片的提示
- 可设置并发数以控制处理速度(默认值为 CPU 核心数的 80%,最大值为 95%)
export_sharegpt.mp4
支持一键导出基于 Sharegpt 格式的多模态图像数据。
聊天机器人将其配置存储在用户目录下的如下位置:
~/.xanylabeling_data/chatbot/
这包括:
models.json:包含用户偏好设置和模型配置providers.json:API 提供商设置
Ctrl/⌘+Enter: 发送消息Enter: 在消息输入中添加新行
- 聊天机器人功能处于测试阶段,可能会在未来版本中更新
- 通过 Ollama 的本地模型可以在没有互联网连接的情况下使用,且理论上支持所有满足 OpenAI 兼容 API 的模型