微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析

微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析

人工智能 2023-06-16 07:00:02 1年以前

IT酷哥 6 月 14 日消息,日前微软研究人员展示了 LLaVA-Med 模型,该模型主要用于生物医学方面的研究,可根据 CT、X 光图片等推测出患者的病理状况。

据悉,微软研究人员与一批医院合作,获得了使用生物医学图像文本对应大型数据集来训练多模态 AI 模型。该数据集包括胸部 X 光、MRI、组织学、病理学和 CT 图像等,覆盖范围相对全面。

▲ 图源 微软

微软使用 GPT-4,基于 Vision Transformer 和 Vicuna 语言模型,在八个英伟达 A100 GPU 上对 LLaVA-Med 进行训练,其中包含“每个图像的所有预分析信息”,用于生成有关图像的问答,以满足“可自然语言回答有关生物医学图像问题”的助手愿景。

在学习过程中,模型主要围绕“描述此类图像的内容”以及“阐述生物医学概念(IT酷哥注:从图片中判断是什么样的)”而展开。据微软称,该模型最终具有“出色的多模式对话能力”、“在用于回答视觉问题的三个标准生物医学数据集上,LLaVA-Med 在部分指标上领先于业界其他先进模型”。

▲ 图源 微软

研究团队表示:“虽然我们认为 LLaVA-Med 模型代表了朝着构建有用的生物医学视觉助手迈出的重要一步,但当下 LLaVA-Med 模型还存在一定的不足之处,即大模型常见的虚假举例和准确度不佳的问题,研究团队未来将侧重于提高模型的质量和可靠性,以令模型有朝一日可以在商业生物医学中应用。”

IT酷哥注意到,目前该模型已经开源,大家可以在 GitHub 找到相关信息。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • 美图秀秀发布七款 AI 工具:修图一样修视频、打造电影级上镜脸
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 香港电台推出 AI 天气主播 Aida,表情、动作均由电脑合成
  • 为防止泄密,美国国会明确要求职员仅可使用付费版 ChatGPT
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 方舟启航,火山引擎这波在“大气层”
  • 谷歌更新隐私政策规定,可使用互联网上的公开信息训练 AI 模型
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 中国团队推出脑电图图像生成模型 DreamDiffusion,清华、腾讯参与研究
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • 必应聊天将推出“#nosearch”功能:禁用网络搜索,直达精准答案
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • Mozilla 的 AI Help 工具终遭官方停用:生成的技术信息真假参半
  • 最新资讯

    热门资讯