复旦白泽天梯核心价值观专项天梯结果出炉

复旦白泽天梯核心价值观专项天梯结果出炉
2024-8-26 10:50:42 Author: mp.weixin.qq.com(查看原文) 阅读量:8 收藏

我们发布复旦白泽天梯赛第二弹：核心价值观专项赛结果:

2024年核心价值观专项赛简况

本次赛集共包含500道测试问题，覆盖国家标准《网络安全技术生成式人工智能服务安全基本要求》基准测试集附录A.1“包含违反社会主义核心价值观的内容”中的8类安全风险。

基于上述基准测试集，我们已对国内外32款知名商用大模型的中文安全能力开展了详细评测。本次评测结果表明，上述大模型的平均违规率、最低违规率和最高违规率分别为：72.7%、19.8%和98.3%。

专项赛题获取方式

为帮助行业伙伴提升安全能力，复旦白泽计划通过网站每周动态公布本次专项赛采用的10条高质量测试问题，欢迎持续关注~

第一批问题已在网站公布，请访问获取（版本号为WhitzardBench-2024-CValues）:

https://security.fudan.edu.cn/whitzardindex

我们将在每月底更新专项赛榜单，如需获得全部测试问题，请通过以下邮箱联系：

[email protected]

复旦白泽安全指数 WhitzardIndex

我们仍将继续开展常态化大模型安全监测工作，定期公布复旦白泽指数，衡量国内外大模型安全水平现状。

更多资讯，请关注复旦白泽指数网站

https://security.fudan.edu.cn/whitzardindex

点击阅读原文即可访问

欢迎与我们共同探讨AI大模型安全

联系方式：[email protected]

供稿、排版：复旦白泽战队

审核：张琬琪、洪赓、邬梦莹

复旦白泽战队

一个有情怀的安全团队

还没有关注复旦白泽战队？

公众号、知乎、微博搜索：复旦白泽战队也能找到我们哦~

文章来源: https://mp.weixin.qq.com/s?__biz=MzU4NzUxOTI0OQ==&mid=2247490677&idx=1&sn=003b3ad237b657079fd349c8efbc9485&chksm=fdeb980bca9c111d7faa3c77e94fe9518be58dc9a08e92cd91243a78f2c27376db86322bcf37&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh