56分类目录

56分类目录 56分类目录 56分类目录 56分类目录
  • 热门网站
  • 人工智能
  • 生活服务
    • 手机通讯
    • 母婴儿童
    • 房产家居
    • 汽车周边
    • 婚庆交友
  • 休闲娱乐
    • 小说文学
    • 图片动漫
    • 明星模特
    • 摄影周边
    • 星座命理
  • 电脑网络
    • 网站建设
    • 社区论坛
    • 网址目录
    • 硬件数码
    • 软件综合
  • 视频音乐
  • 实用查询
  • 广告设计
  • 卫生健康
  • 程序编程
  • 游戏网游
  • 商业经济
  • 政法军事
  • 新闻媒体
  • 科技文化
  • 体育健身
  • 旅游交通
  • 教育培训
  • 艺术爱好
56分类目录 56分类目录
  • 56分类目录
    • 人工智能
    • 生活服务
    • 休闲娱乐
    • 电脑网络
    • 视频音乐
    • 实用查询
    • 广告设计
    • 卫生健康
    • 程序编程
    • 游戏网游
    • 商业经济
    • 政法军事
    • 新闻媒体
    • 科技文化
    • 体育健身
    • 旅游交通
    • 教育培训
    • 艺术爱好
  • 热门网站
  • 文章博客
    • 创业资讯
    • 建站教程
    • 站长百科
    • 生活百科
    • 文章资讯
  • 关于我们
56分类目录 56分类目录

    旅游交通

    艺龙旅行
    艺龙旅行

    铁友
    铁友

    8264户外旅游
    8264户外旅游

    途牛旅游网
    途牛旅游网

    速8酒店
    速8酒店

    梦之旅
    梦之旅

    中青旅遨游网
    中青旅遨游网

    中旅旅行
    中旅旅行

    穷游
    穷游

    同程旅行
    同程旅行

    携程旅游网
    携程旅游网

    MMLU
    MMLU

    大规模多任务语言理解基准

    C-Eval
    C-Eval

    一个全面的中文基础模型评估套件

    Open LLM Leaderboard
    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单

    FlagEval
    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台

    OpenCompass
    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系

    SuperCLUE
    SuperCLUE

    中文通用大模型综合性测评基准

    CMMLU
    CMMLU

    一个综合性的大模型中文评估基准

    HELM
    HELM

    斯坦福大学推出的大模型评测体系

    MMBench
    MMBench

    全方位的多模态大模型能力评测体系

    LLMEval3
    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准

    Chatbot Arena
    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台

    PubMedQA
    PubMedQA

    生物医学研究问答数据集和模型得分排行榜

    H2O EvalGPT
    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统

    56分类目录 56分类目录
    56分类目录收录了上万个全网知名网站,并每日不断更新和添加最新优秀网站,帮助你更快的找到你想要的网站,高效完成浏览! Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

    56分类目录 广告投放 关于我们 免责声明

    Copyright © 2026 56分类目录 蜀ICP备2024098358号-2