达人打造外形像喇叭的奇特相机:通过听声音构建周围环境图像

达人打造外形像喇叭的奇特相机:通过听声音构建周围环境图像

人工智能 2023-06-06 11:04:02 1年以前

IT酷哥 6 月 4 日消息,墨西哥创客和开发者 Diego Trujillo Pisanty 近日设计了一款独特的相机,它不是通过镜头捕捉光线来拍照,而是通过听声音来构建周围环境的图像。这款相机使用了树莓派 3B 模块和人工神经网络,可以将声音转化为视觉。

这款相机的外形类似于一个喇叭,前端有一个巨大的喇叭口,用来放大声音的采集。用户只需将喇叭口对准想要拍摄的方向,按下按钮,相机就会根据捕捉到的声音通过人工智能生成一张图片。相机还配备了一个小屏幕,可以显示图片的处理进度和预览效果。

Pisanty 表示,他为这个项目开发了一个定制的人工神经网络(Artificial Neural Network,即 ANN ),并用他自己拍摄的墨西哥城周边的视频来训练它。他将每一帧视频和对应的一秒钟声音配对起来,建立了声音和视频之间的关联。因此,这个相机生成的图片都是基于墨西哥城内部的影像。

Pisanty 说,他想要探索声音和视觉之间的关系,以及人工智能如何理解和创造世界。他认为这个项目是一个艺术实验,也是一个技术挑战。他希望这个相机能够激发人们对声音和图像之间的联系和差异的思考。

Pisanty 在 YouTube 上分享了这个项目的视频,并在他的网站上提供了更多细节,有兴趣的IT酷哥小伙伴可以去看看。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 百度推出集成在手表的 AI 产品“小表 AI”App,上架苹果 Apple Watch 应用商店
  • 笔神作文称学而思 AI 大模型盗窃其数据,后者回应称调用均与合同要求相符
  • 网易云音乐和小冰联合推出 AI 歌手音乐创作软件,首发内置 12 名 AI 歌手
  • 必应聊天周报:iOS 端引入小组件、为语音聊天扩展语言支持
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • 长虹电视 AI 大模型“长虹超脑”发布:三大核心能力,可连续自然对话
  • 英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
  • 全球首个 AI 广播频道公司完成 1900 万美元融资,开发无障碍及游戏 NPC 技术
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • 李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 国内 AI 初创公司第四范式获得证监会赴港 IPO 批准,有望近期进行上市聆讯
  • 必应聊天将推出“#nosearch”功能:禁用网络搜索,直达精准答案
  • 小冰 CEO 李笛:马斯克呼吁停止研发 AI 大模型,可能是想给自己争取更多时间
  • 蚂蚁集团发布 AI 安全检测平台“蚁鉴 2.0”,用 AI 识别 AI 模型安全漏洞
  • 最新资讯

    热门资讯