熊猫PPG 熊猫PPG-专注 AI 导航
  • 首页
  • AI聊天助手
  • AI写作工具
    • AI内容检测
  • AI图像工具
  • AI视频工具
  • AI办公工具
  • AI新智能体
  • AI搜索引擎
  • AI音频工具
  • AI开发平台
    • AI编程工具
    • AI训练模型
    • AI学习网站
    • AI模型评测
    • AI提示指令
  1. 首页 > AI开发平台 > AI模型评测
AI模型评测
PubMedQA

PubMedQA

生物医学研究问答数据集和模型得分排行...

H2O EvalGPT

H2O EvalGPT

H2O.ai推出的基于Elo评级方法...

LLMEval3

LLMEval3

由复旦大学NLP实验室推出的大模型评...

LMArena

LMArena

AI模型评估平台

HELM

HELM

斯坦福大学推出的大模型评测体系

MMBench

MMBench

全方位的多模态大模型能力评测体系

CMMLU

CMMLU

一个综合性的大模型中文评估基准

AGI-Eval

AGI-Eval

AI大模型评测社区

C-Eval

C-Eval

一个全面的中文基础模型评估套件

Open LLM Leaderboard

Open LLM Leaderboard

Hugging Face推出的开源大...

MMLU

MMLU

大规模多任务语言理解基准

OpenCompass

OpenCompass

上海人工智能实验室推出的大模型开放评...

SuperCLUE

SuperCLUE

中文通用大模型综合性测评基准

FlagEval

FlagEval

智源研究院推出的FlagEval(天...

MagicArena

MagicArena

字节推出的视觉生成模型对战平台

AI Ping

AI Ping

AI大模型服务性能评测平台

共1页 16条

标签

  • OpenBMB (1)
  • 麦当秀MindShow (1)
  • 通义万相 (1)
  • Civitai (1)
  • Stable Diffusion (1)
  • Midjourney (1)
  • LiblibAI·哩布哩布AI (1)
  • 堆友AI反应堆 (1)
  • 笔灵AI小说 (1)
  • GetDraft (1)

分类

  • AI编程工具 (22)
  • AI训练模型 (23)
  • AI学习网站 (26)
  • AI模型评测 (16)
  • AI提示指令 (18)
Copyright © 2025 熊猫PPG_AI工具网 版权所有 备案号:粤ICP备2024311299号