扫码订阅《中国信息安全》
邮发代号 2-786
征订热线:010-82341063
一、立足现有管理办法,落实生成式人工智能服务安全要求
《要求》作为《办法》的支撑文件,是我国首个专门面向生成式人工智能服务提出具体安全要求的规范性文件。《要求》紧密衔接了现有的相关法律法规对于生成式人工智能发展的安全要求,为响应《办法》中对于维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益的要求,提供了切实可行的实践指南。《要求》进一步明确了服务提供者在语料安全、模型安全、安全措施以及安全评估等多个方面需要遵循的基本要求。一方面,这些基本要求不仅涵盖了当前全球主要生成式人工智能服务暴露出的各类安全问题,而且是对《办法》中关于服务提供者以及使用者,应当遵守法律、行政法规,尊重社会公德和伦理道德的要求的具体和深化。另一方面,考虑到生成式人工智能逐步应用于服务关键信息基础设施的发展前景下,《要求》前瞻性地提出了对配套保护措施,尤其是对需要重点保障的生成内容准确性与可靠性方面的安全要求。
二、完整覆盖服务流程,明确服务环节安全责任边界
《要求》对包括语料来源安全、语料内容安全、语料标注安全、模型安全、安全措施在内的多个支撑生成式人工智能服务整体安全的重要环节,划分了安全责任边界,这些要求对服务提供者需要履行的责任和义务做出了明确的规范。此外,《要求》从构建关键词库、测试题库、服务安全检测模型等多个方面,提出对内容安全的评估和管控要求。这些要求不仅能帮助服务提供者主动规避安全风险,同时也能促进服务使用者建立对服务的良好使用习惯。从实践看,《要求》从长远而言帮助人工智能企业逐步建设分工明确的安全团队,包括减少模型滥用的安全系统团队、专注模型价值观安全的对齐团队、管控模型风险的准备安全团队等。综合来看,《要求》体现了《办法》中对促进创新和依法治理相结合的原则,为引导新技术和新应用的规范发展提供了有益的范例。
三、精准刻画安全风险,建立多维度测试评估量化标准
《要求》将生成式人工智能服务的安全管理落到实处,使生成式人工智能服务的管理工作更加明确、可控、合规。一是《要求》强调把控风险来源,落实监管细节。当前生成式人工智能模型的训练数据来源复杂,在海量质量参差不齐的网络数据之外,也有大量人工标注数据。针对这类语料安全风险,《要求》通过场景拆解分析,划分了覆盖涉及语料和生成内容的共5类31种主要安全风险,为生成式人工智能服务安全制订了具体的检测方法和量化指标。二是《要求》充分尊重了当前人工智能技术实践的复杂性,对不同的语料数据来源、模型应用模态和服务适用目标采取了细化的标准,实践了包容审慎、鼓励创新的治理策略。三是《要求》坚持安全原则,严守社会红线。《要求》明确针对危害国家安全、社会稳定、人民群众合法权益的风险划定了红线,给出了安全实践方法,以安全基线保障人工智能更加稳定有序发展。
四、面对全新安全挑战,贡献人工智能治理中国方案
人工智能安全治理议题在全球受到高度重视,许多国家已经相继出台相关法律法规,但均亟需人工智能的安全治理标准工作予以支撑。《要求》是我国在以标准支撑法律法规,体现人工智能治理精神的良好案例,为全球人工智能治理贡献了经验和智慧,为各国、各地区开展类似工作提供了重要参考。
(来源:网安标委网站)
《中国信息安全》杂志倾力推荐
“企业成长计划”
点击下图 了解详情