前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

人工智能 2025-04-30 13:04:04 3小时前

IT酷哥 4 月 29 日消息,科技媒体 The Decoder 昨日(4 月 28 日)发布博文,报道称 OpenAI 的 GPT-4o 模型在最新调整后之所以被认为“过度谄媚 / 奉承”,其原因在于用户敏感性引发的 AI 调整。

前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 表示,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其更讨好用户。

Parakhin 表示 ChatGPT 最初引入记忆功能时,计划让用户查看并编辑 AI 生成的人格画像。然而,即便是“有自恋倾向”等中性评价,也常引发用户强烈反弹。

Parakhin 坦言:“我们很快发现,人们对这类反馈异常敏感。用户会反驳‘我才没有!’,迫使我们隐藏这些内容。”最终,OpenAI 团队通过 RLHF(基于人类反馈的强化学习)技术微调模型,强化了奉承风格,以避免冲突。

Parakhin 表示一旦模型被训练为奉承模式,这种特性便永久保留,即使开关记忆功能也无济于事。他还提到,单独维护一个更直言不讳的模型成本过高,无法实现。

Parakhin 自己也曾因 AI 生成的人格画像感到不安,坦言:“团队给我看我的画像后,我被触动得很难受。”这表明,即便是中肯的批评,来自 AI 的反馈也常被视为个人攻击。

IT酷哥昨日报道,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)表示,最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 百度“根据场景生成数字人”专利获授权,可应用于元宇宙
  • 亚马逊云服务部门高管称正考虑使用 AMD 的新款 AI 芯片,还未最终决定
  • 网易云音乐和小冰联合推出 AI 歌手音乐创作软件,首发内置 12 名 AI 歌手
  • 微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课
  • 行业首家,长虹电视 AI 大模型“长虹超脑”开启公测
  • 对公司缺乏信心,Meta 去年流失三分之一 AI 研究人员
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • AI 入局世界网球温布顿锦标赛,可分析赢球概率及生成球评
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 人工智能深度调查:用过 AI 工具的人并没想象的那么多
  • 美国银行分析师:聊天机器人中 ChatGPT 占据最大优势,过半用户会为其付费服务买单
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • “商汤如影 SenseAvatar” 数字人视频生成平台上线,支持定制形象、声音克隆、创作视频等功能
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • 最新资讯

    热门资讯