达人打造外形像喇叭的奇特相机：通过听声音构建周围环境图像

达人打造外形像喇叭的奇特相机：通过听声音构建周围环境图像

人工智能 2023-06-06 11:04:02 1年以前

IT酷哥 6 月 4 日消息，墨西哥创客和开发者 Diego Trujillo Pisanty 近日设计了一款独特的相机，它不是通过镜头捕捉光线来拍照，而是通过听声音来构建周围环境的图像。这款相机使用了树莓派 3B 模块和人工神经网络，可以将声音转化为视觉。

这款相机的外形类似于一个喇叭，前端有一个巨大的喇叭口，用来放大声音的采集。用户只需将喇叭口对准想要拍摄的方向，按下按钮，相机就会根据捕捉到的声音通过人工智能生成一张图片。相机还配备了一个小屏幕，可以显示图片的处理进度和预览效果。

Pisanty 表示，他为这个项目开发了一个定制的人工神经网络（Artificial Neural Network，即 ANN ），并用他自己拍摄的墨西哥城周边的视频来训练它。他将每一帧视频和对应的一秒钟声音配对起来，建立了声音和视频之间的关联。因此，这个相机生成的图片都是基于墨西哥城内部的影像。

Pisanty 说，他想要探索声音和视觉之间的关系，以及人工智能如何理解和创造世界。他认为这个项目是一个艺术实验，也是一个技术挑战。他希望这个相机能够激发人们对声音和图像之间的联系和差异的思考。

Pisanty 在 YouTube 上分享了这个项目的视频，并在他的网站上提供了更多细节，有兴趣的IT酷哥小伙伴可以去看看。

声音相机墨西哥城喇叭口神经网络

相关阅读

研究：女性工作更易被 AI 取代，再培训成关键

统信深度 deepin 宣布成立 AI SIG 社区：将 AI 引入操作系统，共同维护软件包

行业首家，长虹电视 AI 大模型“长虹超脑”开启公测

折腾十年，扎克伯格痛失 AI 好局

全球 AI 人才需求激增，部分岗位年薪逼近 40 万美元

理想汽车负责人：我们在 ChatGPT 问世之前就已启动 AI 大语言模型训练

腾讯首次披露行业大模型进展：不追求参数高，希望成本预算可控

全球首个 AI 广播频道公司完成 1900 万美元融资，开发无障碍及游戏 NPC 技术

特斯拉创建 Tesla AI 推特账户，称下月开始生产 Dojo 超级计算机

Stability AI 推出文字生成图片模型 SDXL 0.9，硬件要求下探至消费级 GPU 水平

人工智能深度调查：用过 AI 工具的人并没想象的那么多

近 12 年由 AI 造成的事故暴涨 15 倍，Facebook、特斯拉、OpenAI 位居总量前三

16 名匿名人士起诉 ChatGPT 侵犯隐私，向微软和 OpenAI 索赔 30 亿美元

版权问题难解，OpenAI 被控非法使用图书数据训练 AI 系统

微软在 Bing 和 Edge 浏览器中拓展网购服务，帮用户选购心仪产品

正版文心一言上架 App Store，百度此前起诉苹果“盗版 App 泛滥”

北京出台机器人产业新政，支持 AI 大模型与机器人融合发展

韩媒称三星先进封装技术落后于台积电，导致难以取得 AI 芯片订单

MetaGPT AI 模型开源：可模拟软件公司开发过程，生成高质量代码

“世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3，现场完成作画