Skip to content

Latest commit

 

History

History
113 lines (73 loc) · 5.29 KB

File metadata and controls

113 lines (73 loc) · 5.29 KB

概述

X-AnyLabeling 聊天机器人 是一个集成的 AI 助手,使用户可以直接在标注工作流程中与大型语言模型 (LLM) 交互。此功能允许您使用自然语言进行聊天对话,批量运行图文问答数据,并支持一键导入或导出基于单轮、多轮对话的 Sharegpt 格式的多模态图像数据直接用于 LLaMA-Factory 等大模型微调框架进行训练。

open_chatbot_and_chat.mp4

入门

访问聊天机器人

要打开聊天机器人,请点击 X-AnyLabeling 中左侧工具栏的聊天机器人图标或使用如下快捷键快速启动聊天机器人对话界面。

  • Windows/Linux: Ctrl + 1
  • macOS: + 1

初始设置

首次启动时,您需要在 Chatbot 聊天窗口的右侧面板中配置必要的 API 凭据和模型。

用户界面

该聊天机器人具有一个三面板界面,旨在简化交互。

select_model.mp4

左侧面板 - 模型提供商

提供商 API 密钥 API 文档 模型文档
Anthropic Link Link Link
DeepSeek Link Link Link
Google AI Link Link Link
Ollama - Link Link
OpenAI Link Link Link
OpenRouter Link Link Link
Qwen Link Link Link

Note

Custom 提供商支持配置兼容 OpenAI API 格式的自定义端点。切换提供商后,模型列表将自动更新显示当前提供商的可用模型。

中间面板 - 聊天界面

  • 聊天窗口:查看您与 AI 的对话历史,支持复制、编辑、删除、重新运行功能
  • 消息输入:输入您的问题或指令,支持一键清除当前对话历史记录
  • 特殊命令:导入图像后,使用 @image 提示包含当前图像

右侧面板 - 图像预览和相关设置

  • 图像预览: 显示当前图像
  • 功能组件:
    • 图像导航: 切换上一张/下一张图像。
    • 图像导入: 导入单个图像文件或整个目录。
    • 数据导出: 导出标注结果文件。
    • 批量处理: 对多个图像运行处理任务。
  • 后端设置: 支持配置 API 端点和密钥,模型选择
  • 生成参数: 支持输入系统提示、温度参数、最大输出长度

关键特性

视觉问答

import_image_folder.mp4

针对当前图像提出问题,以帮助您高效升成单轮或多轮图文对话:

@image 请描述这张图像。

图像批量处理

batch_run.mp4

使用相同的提示处理多张图片以加快工作流程:

  1. 加载一个图片文件夹
  2. 点击“运行所有图片”按钮
  3. 输入要应用于所有图片的提示
  4. 可设置并发数以控制处理速度(默认值为 CPU 核心数的 80%,最大值为 95%)

数据集导入/导出

export_sharegpt.mp4

支持一键导出基于 Sharegpt 格式的多模态图像数据。

其它

配置文件

聊天机器人将其配置存储在用户目录下的如下位置:

~/.xanylabeling_data/chatbot/

这包括:

  • models.json:包含用户偏好设置和模型配置
  • providers.json:API 提供商设置

键盘快捷键

  • Ctrl/+Enter: 发送消息
  • Enter: 在消息输入中添加新行

注意事项

  • 聊天机器人功能处于测试阶段,可能会在未来版本中更新
  • 通过 Ollama 的本地模型可以在没有互联网连接的情况下使用,且理论上支持所有满足 OpenAI 兼容 API 的模型