蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0”,用 AI 识别 AI 模型安全漏洞

蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0”,用 AI 识别 AI 模型安全漏洞

人工智能 2023-07-10 21:11:02 1年以前

7 月 7 日下午消息,2023 世界人工智能大会期间,在“聚焦・大模型时代 AIGC 新浪潮 — 可信 AI”论坛上,蚂蚁集团联合清华大学发布 AI 安全检测平台“蚁鉴 2.0”。

蚁鉴 2.0 可实现用生成式 AI 能力检测生成式 AI 模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型 AI 安全检测平台。

在该论坛上,蚂蚁集团同时宣布,“蚁鉴 2.0”全面开放,面向全球开发者免费提供 AIGC 安全性、AI 可解释性、AI 鲁棒性(稳健性)三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

蚂蚁集团大安全事业群技术部总裁李俊奎表示,“生成式大模型是一种‘深黑盒’技术,‘蚁鉴 2.0’通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,可实现‘生成式机器人’对‘AIGC 生成式模型’的诱导式检测计算,很像一个 24 小时不眠不休的‘安全黑客’在找茬大模型,从而找到大模型存在的弱点和安全问题所在。”

据了解,“蚁鉴 2.0”集成了蚂蚁近 10 年可信 AI 实践、1000 余项可信 AI 专利,支持零编码测评。开发者通过 API 接口,将 AI 模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

此次论坛上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起《AIGC 可信倡议》,围绕人工智能可能引发的经济、安全、隐私和数据治理等问题,提出构建 AIGC 可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升 AIGC 可信工程化能力,最大限度确保生成式 AI 安全、透明、可释。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 为了更高效“上分”,USAF 的 AI 无人机在模拟测试中选择击杀人类操作者
  • OpenAI 对手 Cohere 获 2.7 亿美元融资,欲与其展开正面竞争
  • OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格
  • 笔神作文称学而思 AI 大模型盗窃其数据,后者回应称调用均与合同要求相符
  • Stack Overflow 发布 2023 年度报告:JavaScript 位列榜首,83% 的人用过 ChatGPT
  • 消息称东盟正起草 AI 监管法案:新加坡牵头,最快今年底完成
  • 【IT之家评测室】讯飞星火认知大模型 V1.5 体验:真变成随身智能助理了
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • Opera 向桌面和安卓用户开放浏览器 AI“Aria”
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 科大讯飞星火 AI 大模型出海东南亚,将在新加坡实施“1+4”战略
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 最新资讯

    热门资讯