谷歌 DeepMind 推 QuestBench 基准,评估 AI 模型的推理“补漏”能力 人工智能

热文谷歌 DeepMind 推 QuestBench 基准,评估 AI 模型的推理“补漏”能力

【导读】IT酷哥4月26日消息,科技媒体marktechpost昨日(4月25日)发布博文,报道称谷歌DeepMind团队推出QuestBench新基准,通过约束满足问题(CSPs)框架,评估模型在推理任务中识别和获取缺失信息的能力。现实挑战与信息获取需求大型语言模型(LLMs)在推理任务中广受关注,涵盖数学、逻辑、规划和编码等领域。然而,现实世界的应用场景常常充满不确定性。用户在提出数学问题时常忽略重要细节,机器人等自主系统也必须在部分可观测的环境中工作。这种理想化完整信息设定与现实不完备问题之间的矛盾,迫使LLMs发展主动信息获取能力。IT酷哥援引博文介绍,识别信息缺口并生成针对性地澄清问题,成为...

从分钟到秒级:Meta Space Llama 模型登陆国际空间站,刷新太空 AI 速度 人工智能

热文从分钟到秒级:Meta Space Llama 模型登陆国际空间站,刷新太空 AI 速度

【导读】IT酷哥4月26日消息,Meta公司昨日(4月25日)发布公告,宣布携手BoozAllen,已经在国际空间站(ISS)美国国家实验室部署SpaceLlama,是基于开源Llama3.2打造的定制AI模型。由于Llama模型的完整“modelweights”公开可用,研究人员可在无互联网连接的独立硬件上安装并运行该模型,避免了数据通过地球服务器传输的风险,同时提升了数据安全性和响应速度。IT酷哥援引博文介绍,SpaceLlama整合了多项尖端技术,包括BoozAllen的A2E2(AIforEdgeEnvironments)框架、慧与科技的SpaceborneComputer-2、英伟达加速计算...

谷歌升级 Music AI Sandbox:新增 Lyria 2 模型,音乐创作迈步新时代 人工智能

热文谷歌升级 Music AI Sandbox:新增 Lyria 2 模型,音乐创作迈步新时代

【导读】IT酷哥4月26日消息,科技媒体WinBuzzer昨日(4月25日)发布博文,报道称谷歌DeepMind扩展其MusicAISandbox平台,搭载最新的Lyria2音乐生成模型,并向音乐人、词作者和制作人推出全新功能。IT酷哥援引博文介绍,MusicAISandbox平台新增Lyria2模型,能够生成专业级别的48kHz高保真立体声音频,适应多种音乐风格;此外扩展LyriaRealTime模型,支持实时创作和调整音乐。该平台还新增了“Create”功能,通过文本描述或用户歌词生成音乐片段;“Extend”功能基于现有音频片段生成延续内容;“Edit”功能通过预设或文本提示调整音频情绪与风格,...

蚂蚁集团推“Plan A”人才专项,招募全球顶尖 AI 人才 人工智能

热文蚂蚁集团推“Plan A”人才专项,招募全球顶尖 AI 人才

【导读】IT酷哥4月25日消息,今日蚂蚁集团宣布推出“PlanA”AI人才专项,这是蚂蚁集团基于TOP校园人才计划“蚂蚁星”新设的顶尖AI人才专项,旨在面向全球一流高校招募最精英的人工智能研究人员,加入蚂蚁AGI的探索之旅。蚂蚁集团称,希望在全球范围内持续寻找心怀技术热忱、勇于创新突破、研究能力卓越的潜力新锐,通过提供前沿技术课题、优质技术资源和顶配发展空间,培养下一代AI科技领军者。据IT酷哥了解,“PlanA”AI人才专项招募对象包括但不局限于计算机、软件工程、人工智能、网络安全、信息与通信工程、数学、统计学,以及其他前沿交叉学科等理工科类专业的硕博毕业生。毕业时间:2025年11月及以后毕业的同...

深圳市委:将推动人工智能技术与电子产品深度融合,加快规划建设算力设施 人工智能

热文深圳市委:将推动人工智能技术与电子产品深度融合,加快规划建设算力设施

【导读】IT酷哥4月25日消息,深圳市委今天发布《奋力在推进新型工业化中走在前列勇当尖兵》一文,主要围绕当前工业化智造体系,鼓励各大企业推动人工智能技术与电子产品深度融合,加快规划建设算力设施。IT酷哥获悉,相应文章中指出,深圳市有关部门将支持大模型算法企业创新发展,鼓励企业研发细分领域垂类模型,支持企业开展“人工智能+”行动,实现智能制造、智能检测等,进一步降本增效。同时,有关部门还将鼓励企业推动人工智能技术与电子产品深度融合,研发推出更多智能硬件产品,打造“硬件升级、软件迭代、软硬协同发展”的智能产品矩阵。围绕人工智能算力、算法、数据三大要素,加快规划建设通用算力、智能算力、超级算力等算力设施,支...

谷歌确认:Gemini 聊天机器人今年将登陆智能手表、Android Auto 人工智能

热文谷歌确认:Gemini 聊天机器人今年将登陆智能手表、Android Auto

【导读】IT酷哥4月25日消息,谷歌的Gemini聊天机器人目前已可在手机App和网页端上使用,但在智能手表、AndroidAuto、智能显示屏等设备上,谷歌依然依赖于GoogleAssistant。不过,谷歌公司已经确认,Gemini即将在今年晚些时候拓展其应用范围。IT酷哥注意到,在2025年第一季度财报电话会议中,谷歌首席执行官桑达尔・皮查伊(SundarPichai)宣布了Gemini的拓展计划,他指出:“我们将在移动设备上将GoogleAssistant升级为Gemini,并且在今年晚些时候,我们还将对平板电脑、汽车以及与手机连接的设备,如耳机和手表等进行升级。”尽管皮查伊并未透露此次拓展的...

AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录 人工智能

热文AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录

【导读】IT酷哥4月25日消息,科技媒体marktechpost今天(4月25日)发布博文,报道称英伟达专为数学推理设计,发布OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle两款先进AI模型。数学推理一直是AI领域的巨大挑战。传统的语言模型擅长生成流畅文本,却在解决复杂数学问题时显得力不从心,这些问题不仅需要理解抽象概念,还要求多步骤的逻辑推导。IT酷哥援引博文介绍,英伟达针对这一难题,推出了OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle两款模型,基于Qwen系列transformer模型,通过在...

Adobe 发布 Firefly Image Model 4 模型:AI 生图再升级 人工智能

热文Adobe 发布 Firefly Image Model 4 模型:AI 生图再升级

【导读】IT酷哥4月25日消息,Adobe昨日(4月24日)发布博文,推出FireflyImageModel4和FireflyImageModel4Ultra两款文本生成图像AI模型,并预告针对Photoshop和Illustrator的CreativeCloud应用更新。FireflyImageModel4强调速度与操控性,被Adobe称为“迄今最快、最可控、最逼真的图像模型”,最高支持生成2K分辨率的图像,风格、尺寸和相机角度控制更加精准。IT酷哥援引博文介绍,FireflyImageModel4Ultra则擅长处理“复杂场景与细小结构”,带来更高水平的细节与真实感。相比前代,这两款模型确保生成过...

首席执行官皮查伊:谷歌超 30% 代码现由 AI 协助编写 人工智能

热文首席执行官皮查伊:谷歌超 30% 代码现由 AI 协助编写

【导读】IT酷哥4月25日消息,在Alphabet2025年第一季度财报电话会议上,谷歌首席执行官桑达尔・皮查伊(SundarPichai)表示,公司超过30%的代码现由AI协助编写。皮查伊表示得益于AI模型愈发强大,以及引入Agenticworkflows(智能体工作流),AI辅助编码在各团队中迅速普及。目前开发者频繁采纳AI生成建议,平均每三次代码变更中就有一次依赖AI支持。这些AI系统能规划并执行多步骤任务,已在公司各领域深度部署,其中客户服务团队的采用率尤为突出。谷歌近期推出的Gemini2.5Pro模型广受开发者与消费者好评。皮查伊称,该模型在多项基准测试中表现“最先进”,并在Chatbot...

消息称 AI 智能体公司 Manus 融资 7500 万美元,估值大涨四倍 人工智能

热文消息称 AI 智能体公司 Manus 融资 7500 万美元,估值大涨四倍

【导读】IT酷哥4月25日消息,据彭博社报道,通用型AI智能体ManusAI背后的中国创业公司蝴蝶效应近期完成了一轮7500万美元(IT酷哥注:现汇率约合5.47亿元人民币)的融资。此轮融资由美国知名风险投资公司Benchmark领投,同时吸引了现有投资者的参与。据知情人士透露,该轮融资使蝴蝶效应的估值飙升至接近5亿美元(现汇率约合36.46亿元人民币),较此前增长了四倍。据报道,蝴蝶效应计划利用这笔资金加速其全球化布局,目标市场包括美国、日本以及中东地区。该公司旗下的ManusAI项目自今年3月推出一款通用型AI智能体后,便迅速吸引了市场的关注。该AI智能体能够高效完成诸如简历筛选、旅行规划以及股票...

最新资讯

热门资讯