讲座信息｜南洋理工大学计算机科学与工程学院博士研究生刘艺8日与您相约江湾

讲座信息｜南洋理工大学计算机科学与工程学院博士研究生刘艺8日与您相约江湾
2023-11-6 12:12:43 Author: mp.weixin.qq.com(查看原文) 阅读量:3 收藏

基于提示词工程的大模型安全

演讲者：刘艺南洋理工大学计算机科学与工程学院博士研究生

时间：2023年11月8日（周三）上午10：00-11：30

地点：江湾校区二号交叉学科楼A6007

演讲简介

随着大模型在各种领域如医疗、金融、娱乐和教育的广泛应用，其带来的安全挑战也逐渐浮现。大模型虽然为我们带来了很多便利，但与此同时，与其相关的安全隐患也开始备受工业界与学术界的关注。在本次报告中，我们将深入探讨了大语言模型中出现的一种新型且危险的攻击方法——提示词注入攻击。这种攻击利用特定的提示词来诱导模型产生非预期的输出。除此之外，我们还详细研究了大模型越狱问题，这是一个关于如何逃避模型原有对齐限制的技术挑战。报告将分享大模型越狱提示词的最新实证研究进展，并深入讨论如何运用自动化工具来加速和完善这种攻击方式。

关于讲者

刘艺，南洋理工大学计算机科学与工程学院博士研究生，师从国际软件工程领域知名专家刘杨教授。主要研究方向为大模型安全，软件测试等。

他的研究主要集中在大模型安全和软件测试，相关工作发表在USENIX、S&P、NDSS、ICSE、ASE等顶级国际会议上。在大模型安全上，他较早完成了越狱提示词的实证研究，并设计自动化越狱提示词生成方法；同时，在提示词注入方面，较早实现了对于集成大语言模型商业应用的攻击，并设计自动化提示词注入攻击工具。在软件测试中，他主导设计的RESTful API自主测试工具，获得华为云十大优秀技术合作项目奖，并已落地华为公司内部多个产品线应用，华为云对外商用邀测。

审核：张琬琪、洪赓、邬梦莹

排版：王涛

复旦白泽战队

一个有情怀的安全团队

还没有关注复旦白泽战队？

公众号、知乎、微博搜索：复旦白泽战队也能找到我们哦~

文章来源: https://mp.weixin.qq.com/s?__biz=MzU4NzUxOTI0OQ==&mid=2247487805&idx=1&sn=a1411050275bbe40e5312dfaffe63d09&chksm=fdeb9543ca9c1c55eb451edcb045ba4a42b00753430cf90f9fdc90906350407c24a557424f3b&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh