蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0”,用 AI 识别 AI 模型安全漏洞

蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0”,用 AI 识别 AI 模型安全漏洞

人工智能 2023-07-10 21:11:02 1年以前

7 月 7 日下午消息,2023 世界人工智能大会期间,在“聚焦・大模型时代 AIGC 新浪潮 — 可信 AI”论坛上,蚂蚁集团联合清华大学发布 AI 安全检测平台“蚁鉴 2.0”。

蚁鉴 2.0 可实现用生成式 AI 能力检测生成式 AI 模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型 AI 安全检测平台。

在该论坛上,蚂蚁集团同时宣布,“蚁鉴 2.0”全面开放,面向全球开发者免费提供 AIGC 安全性、AI 可解释性、AI 鲁棒性(稳健性)三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

蚂蚁集团大安全事业群技术部总裁李俊奎表示,“生成式大模型是一种‘深黑盒’技术,‘蚁鉴 2.0’通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,可实现‘生成式机器人’对‘AIGC 生成式模型’的诱导式检测计算,很像一个 24 小时不眠不休的‘安全黑客’在找茬大模型,从而找到大模型存在的弱点和安全问题所在。”

据了解,“蚁鉴 2.0”集成了蚂蚁近 10 年可信 AI 实践、1000 余项可信 AI 专利,支持零编码测评。开发者通过 API 接口,将 AI 模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

此次论坛上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起《AIGC 可信倡议》,围绕人工智能可能引发的经济、安全、隐私和数据治理等问题,提出构建 AIGC 可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升 AIGC 可信工程化能力,最大限度确保生成式 AI 安全、透明、可释。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 《黑镜》主创坦言曾试用 ChatGPT 编写剧本,但效果不理想
  • 2023 世界人工智能大会 7 月举办,OpenAI、微软、谷歌等 AI 巨头齐聚上海
  • 联合国秘书长称支持建立全球人工智能监管机构
  • 360 发布 AI 数字人广场,可同孙悟空、爱因斯坦等古今中外人物角色对话
  • 网易云音乐和小冰联合推出 AI 歌手音乐创作软件,首发内置 12 名 AI 歌手
  • 宜家发布由 AI 设计的下一代沙发:轻便、扁平、模块化,采用 100% 可回收材料
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • 波音宣布与日本航空合作,用 AI 排查 787 梦想客机零件老化和故障迹象
  • 报告称 5 月美国生成式 AI 岗位激增 20%
  • 英伟达赚翻了,甲骨文今年将斥资数十亿美元买 GPU 发力 AI 云服务
  • AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头
  • 2023 全球 AI 指数排名公布:美中稳居前二,亚洲国家表现亮眼
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • ChatGPT 的 Bing 浏览功能让用户免费阅读付费内容,OpenAI 暂停测试
  • AI 作画工具 Midjourney 推出“pan”功能,可上下左右平移扩展图片外场景
  • 最新资讯

    热门资讯