产业观察 丨知道创宇推出基于SecGPT架构的新一代内容安全治理方案
2023-6-1 14:14:32 Author: www.aqniu.com(查看原文) 阅读量:12 收藏

产业观察 丨知道创宇推出基于SecGPT架构的新一代内容安全治理方案

日期:2023年06月01日 阅:138

随着AI技术的不断完善及拓展,以ChatGPT为代表的生成式人工智能(AI Generated Content,“AIGC”) 产品正在成为一种堪称颠覆式的生产力工具,必然将渗透到经济社会生活的每个角落。但在为社会带来便利的同时,AIGC产品蕴含的潜在风险也为网络安全行业带来巨大挑战。

面对AIGC产品可能引发的各种应用风险,我国的监管部门已敏锐察觉到AIGC野蛮生长所带来的风险。今年4月11日,国家网信办正式发布《生成式人工智能服务管理办法(征求意见稿)》,就AIGC产品应用制定了明确的监管要求。为了帮助企业组织做好AIGC内容治理,满足行业主管部门的监管要求,知道创宇日前推出了基于SecGPT架构的新一代内容安全治理方案。

知道创宇公司高级副总裁李伟辰表示:SecGPT是知道创宇在2015年世界互联网大会上提出新一代先进技术理念架构,实现了将整个网络空间的各种数据放到一起进行跨域、跨层的数据关联,然后寻找风险以及应对方法。该架构由大数据AI安全基座、大数据AI安全模型算法中台、大数据AI安全能力引擎、大数据AI安全业务应用构建,可以根据客户需求制定不同的针对性解决方案。

针对互联网应用平台的内容安全风险,知道创宇基于SecGPT技术架构,可提供4套防护方案:

  1. AIGC智能审核定制:使用 Instruction GPT 类模型强大的指令执行特性,极速指定审核模板,分钟级上线定制化的机审能力。
  2. 内容合规鉴别服务:积极参与AIGC内容管理相关法令法规制定,契合监管需求,提供AIGC模型的内容合规测试服务以及AIGC违规内容的识别服务。
  3. AIGC训练标注服务:充分发挥人审专家优势,为各大厂商提供专业的、高质量的RLHF(Reinforcement Learning Human Feedback)服务,助力客户厂商的GPT类模型训练。
  4. AIGC合规基线评测:提供内容安全领域专业的测试人员对AIGC基线开展测试和评估,最终评测结果将为人工智能系统的开发和应用提供参考和指导。

针对企业组织的大模型工具安全应用,知道创宇推出了三位一体的合规解决方案:在训练阶段可以提供无监督预训练、RLHF;评估阶段可以帮助客户建立问题库、问题答案请求模型;推理阶段可以进行用户请求分析以及内容传播分析等。

「三位一体」的大模型安全&合规解决方案


此外,针对企业的不同业务场景,知道创宇还提供了ScanA全栈式内容风控体系解决方案,包括机审和人审。客户可以根据需要的业务场景选择机审引擎或者机审引擎+人工复核,审核的内容包括图文音视文档等,覆盖AI对话、AI绘画、AI办公、AI搜索、AI视频、AI音频等AIGC应用场景。

据李伟辰介绍:在本次推出的新一代内容安全治理解决方案中,还包括了一套AI系统创新解决架构——CDAI(Cognitive Domain Artificial Intelligence)认知域AI引擎系统,基于知道创宇多年业务审核实践经验,联合众多内容安全审核领域专家智囊,使用了数十种前沿数据科学算法作为能力核心。该系统目前已完全接入ScanA内容安全监测、ScanA智能审核平台、资质审核平台、数据精标平台等诸多产品及AIGC应用内容安全风控方案。

知道创宇是一家基于AI和大数据驱动的云安全公司,专注于为政府机构、企事业单位提供全方位的网络安全解决方案。公司成立于2007年,由数位资深的安全专家创办,总部位于北京,2013年获得腾讯投资,拥有北京、成都、武汉三大研发中心和近百位国内一线安全人才组成的核心安全研究团队,在深圳、广州、上海、香港等地区设有35个分公司和办事处。知道创宇是国内较早提出云监测与云防御理念的网络安全公司,目前在云防御产品上建设有由创宇盾、抗D保、加速乐等组成的云安全防御平台,形成了从网站防护到加速,再到品牌线上商业保护的一整套解决方案;在云监测方面,形成了从区域资产,到漏洞威胁,再到攻击态势全面的获取能力。招商银行、中信证券、广发证券、腾讯、京东、今日头条、新浪微博、抖音、比特大陆、火币网、和讯网、云南卫视等都是知道创宇的客户。


文章来源: https://www.aqniu.com/tools-tech/96588.html
如有侵权请联系:admin#unsafe.sh