Meta 发布 ReasonIR-8B:破解 AI 复杂推理检索难题,刷新 BRIGHT 纪录

Meta 发布 ReasonIR-8B:破解 AI 复杂推理检索难题,刷新 BRIGHT 纪录

人工智能 2025-05-03 18:01:03 3天前

IT酷哥 5 月 1 日消息,科技媒体 marktechpost 昨日(4 月 30 日)发布博文,报道称 Meta AI 推出 ReasonIR-8B 模型,专为推理密集型检索设计,不仅在检索精度上取得突破,其低成本和高效率也使其成为实际应用的理想选择。

当前检索增强生成(RAG)系统在处理复杂推理任务时,常常因检索器性能不足而受限。传统检索器多针对简短事实性问题训练,擅长文档级别的词语或语义匹配,但面对长篇或跨领域查询时,难以整合分散知识,这种缺陷会导致错误信息传递,影响后续推理效果。

Meta AI 推出的 ReasonIR-8B 模型直击这一痛点,基于 LLaMA3.1-8B 训练,结合创新数据生成工具 ReasonIR-SYNTHESIZER,构建模拟真实推理挑战的合成查询和文档对,更精准支持复杂任务。

ReasonIR-8B 采用双编码器(bi-encoder)架构,将查询和文档独立编码为嵌入向量,通过余弦相似度评分。其训练数据包括长达 2000 个 token 的多样长度查询(VL Queries)和需逻辑推理的困难查询(HQ),有效提升模型处理长上下文和抽象问题的能力。

在 BRIGHT 基准测试中,该模型原查询得分达 24.4 nDCG@10,结合 Qwen2.5 重新排序后提升至 36.9,远超更大的 Rank1-32B 模型,且计算成本低至后者的 1/200。此外,在 MMLU 和 GPQA 等 RAG 任务中,模型分别带来 6.4% 和 22.6% 的显著提升。

Meta AI 目前已在 Hugging Face 上开源 ReasonIR-8B 模型、训练代码及合成数据工具,鼓励研究社区进一步探索多语言和多模态检索器的开发。

IT酷哥附上参考地址

ReasonIR: Training Retrievers for Reasoning Tasks

huggingface

GitHub

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 又一起 AI 换脸诈骗:安徽男子 9 秒被骗 132 万元
  • 武大版 ChatGPT 大模型 CheeseChat 问世:提供日常咨询、学业帮助
  • 英伟达宣布将人工智能引入游戏,玩家可跟 NPC 角色实时语音聊天
  • 消息称三星正开发“类 ChatGPT”AI 大语言模型供内部使用,投入全部 GPU 资源
  • OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示“非常乐观”
  • 美国安全公司发现两款仿冒 ChatGPT 恶意应用,提醒用户暂无官方安卓客户端
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 人工智能深度调查:用过 AI 工具的人并没想象的那么多
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 混合 AI 时代将至,这是你从未有过的全新体验
  • 特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • 多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展
  • ChatGPT 的 Bing 浏览功能让用户免费阅读付费内容,OpenAI 暂停测试
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • ChatGPT 技术被滥用,绍兴警方侦破团伙制作虚假视频案
  • 《自然》杂志正刊发表华为云旗下盘古气象大模型研究成果,天气预报更精准
  • 最新资讯

    热门资讯