中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架
2024-5-8 09:39:23 Author: mp.weixin.qq.com(查看原文) 阅读量:13 收藏

原文标题：GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models
原文作者：Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu
发表会议：ACM CCS 2024
论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf
主题类型：大模型安全
笔记作者：唐坤生@USTC
主编：黄诚@安全学术圈

针对LLMs的性别偏见评估与去偏框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受，作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海，南洋理工大学的张杰、邓格雷、张天威，北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

文章来源: https://mp.weixin.qq.com/s?__biz=MzU5MTM5MTQ2MA==&mid=2247490695&idx=1&sn=97e752c0f04b0682738ff430ba0fad5f&chksm=fe2ee30cc9596a1aa87d705ea831099c0def1f7031a65c11cb05b9937df84137e30656abbb33&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh