一个轻量级的 LLM 评测工具,支持批量测试用例,记录响应时间、token 用量和输出质量。 前往工具 →
主页 » 项目 LLM Bench 在线 LLM 评测工具,快速测试和比较不同模型的响应质量与延迟。 三月 1, 2025 · 1 分钟 · huangshanxiaoyao 一个轻量级的 LLM 评测工具,支持批量测试用例,记录响应时间、token 用量和输出质量。 前往工具 →