大模型体验-零帕网

人工智能大模型体验报告2.0

在2023年6月首次发布的《人工智能大模型体验报告》基础之上，本次测评在题目设计、对标Benchmark（人类）、打分权重、专家测评团队四大维度进行了全面升级。在题目设计方面，测评题目由300道扩展至500道，并进一步完善了题目分类；在对标Benchmark方面，本次测评将接受过高等教育的人类作为对照，来考评大模型真实能力；在打分标准上，本次测评根据对产业、生活的实际价值，对四大测评维度进行了权重设计；在测评团队方面，本次测评特邀北京大学文化与传播研究所及其他业界、学界专家全程参与。[NeadP

2023-08-21 336"1.5 积分