中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架
2024-5-8 09:39:23 Author: mp.weixin.qq.com(查看原文) 阅读量:11 收藏

  • 原文标题:GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models
  • 原文作者:Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu
  • 发表会议:ACM CCS 2024
  • 论文连接:https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf
  • 主题类型:大模型安全
  • 笔记作者:唐坤生@USTC
  • 主编:黄诚@安全学术圈

针对LLMs的性别偏见评估与去偏框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接:https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受,作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海,南洋理工大学的张杰、邓格雷、张天威,北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing 
有兴趣加入学术圈的请联系 secdr#qq.com

文章来源: https://mp.weixin.qq.com/s?__biz=MzU5MTM5MTQ2MA==&mid=2247490695&idx=1&sn=97e752c0f04b0682738ff430ba0fad5f&chksm=fe2ee30cc9596a1aa87d705ea831099c0def1f7031a65c11cb05b9937df84137e30656abbb33&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh