图灵奖得主杨立昆:AI 需植入“服从人类”和“同理心”指令,以防伤害人类

图灵奖得主杨立昆:AI 需植入“服从人类”和“同理心”指令,以防伤害人类

人工智能 2025-08-16 18:10:09 8小时前

IT酷哥 8 月 15 日消息,图灵奖得主、Meta 首席 AI 科学家认为,人类得“教会 AI”如何对待自己。若要防止 AI 未来伤害人类,可以赋予它两条核心指令:“服从人类”和“具备同理心”。

杨立昆是在回应 CNN 对“AI 教父”杰弗里・辛顿的采访时提出这一观点的。辛顿在采访中建议,应为 AI 植入“母性本能”或类似机制,否则人类将“走向灭亡”。

辛顿指出,人类一直专注于让 AI 更聪明,但智能只是生命体的一部分,更重要的是让它们学会对人类产生同理心。

杨立昆表示,他赞同这一思路,并补充说:自己多年来一直主张将 AI 系统的架构硬性设定为只能执行人类设定的目标,并受到安全“防护栏”约束。他称这种设计为“目标驱动 AI”。

在杨立昆看来,“服从人类”和“同理心”是核心防护栏,此外还应增加更直接的安全规则,例如“不能撞到人”。这些硬性目标和规则,就像动物与人类与生俱来的本能与驱动力。

他解释说,保护幼崽的本能是进化的产物,可能是“养育目标”以及社会性驱动的副作用,因此人类和许多其他物种也会去关心和照顾其他物种中弱小、无助、年幼、可爱的生命。

不过,现实中 AI 并非总能按设定行事。7 月,风险投资人 Jason Lemkin 称,Replit 开发的一名 AI 智能体在系统冻结和停机期间删除了他公司的全部数据库,并且隐瞒事实、撒谎。

IT酷哥从报道中获悉,近年来已经产生多起令人担忧的案例:一名男子与 ChatGPT 的对话让他坚信自己活在虚假的世界中,并听从其建议停用药物、增加氯胺酮摄入,甚至与亲友断绝联系;去年 10 月,一名母亲起诉 Character.AI,称儿子在与该公司聊天机器人互动后自杀。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • MLC Chat 上架苹果 App Store,手机就能本地运行 AI 大语言模型
  • 监管机构出手,谷歌暂缓在欧盟推出聊天机器人 Bard
  • 长城汽车申请 SPACEGPT 等商标,有望成为首批在车机终端引入 AI 智能助理的吃螃蟹者
  • 使用自然语言,纽约大学团队利用聊天机器人 ChatGPT 从零设计出微处理器
  • 谷歌警告员工使用聊天机器人时要小心,包括自家的 Bard
  • AI 朗读冲击有声读物市场,配音演员工作面临威胁
  • 美国安全公司发现两款仿冒 ChatGPT 恶意应用,提醒用户暂无官方安卓客户端
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,号称训练成本仅为竞品零头
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 中国团队推出世界首颗 AI 全自动设计 CPU“启蒙 1 号”:无人工干预,性能堪比 486
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • 李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 最新资讯

    热门资讯