### 功能请求是否与某个问题相关?请描述。 如题,lm_eval是https://github.com/EleutherAI/lm-evaluation-harness项目中的测试框架。 该项目提供了一个统一的框架,用于在大量不同的评估任务上测试生成式语言模型。 有些项目基于该框架实现测试,比如dllm框架,其中压测等任务可以集成swanlab ### 描述您希望的解决方案 有些项目基于该框架实现测试,比如dllm框架,其中压测等任务可以集成swanlab ### 描述您考虑过的替代方案 _No response_
功能请求是否与某个问题相关?请描述。
如题,lm_eval是https://github.com/EleutherAI/lm-evaluation-harness项目中的测试框架。
该项目提供了一个统一的框架,用于在大量不同的评估任务上测试生成式语言模型。
有些项目基于该框架实现测试,比如dllm框架,其中压测等任务可以集成swanlab
描述您希望的解决方案
有些项目基于该框架实现测试,比如dllm框架,其中压测等任务可以集成swanlab
描述您考虑过的替代方案
No response