AI 模型对比 | 客观专业测评 -ai.ppgooo.com

熊猫PPG-专注 AI 导航

AI模型评测

PubMedQA

生物医学研究问答数据集和模型得分排行...

H2O EvalGPT

H2O.ai推出的基于Elo评级方法...

LLMEval3

由复旦大学NLP实验室推出的大模型评...

LMArena

AI模型评估平台

HELM

斯坦福大学推出的大模型评测体系

MMBench

全方位的多模态大模型能力评测体系

CMMLU

一个综合性的大模型中文评估基准

AGI-Eval

AI大模型评测社区

C-Eval

一个全面的中文基础模型评估套件

Open LLM Leaderboard

Hugging Face推出的开源大...

MMLU

大规模多任务语言理解基准

OpenCompass

上海人工智能实验室推出的大模型开放评...

SuperCLUE

中文通用大模型综合性测评基准

FlagEval

智源研究院推出的FlagEval（天...

MagicArena

字节推出的视觉生成模型对战平台

AI Ping

AI大模型服务性能评测平台

共1页 16条

Copyright © 2025 熊猫PPG_AI工具网版权所有备案号：粤ICP备2024311299号

您已浏览： 00:00:00