,Techritual 香港科技电脑资讯网站,,Techritual 香港科技电脑资讯网站,,Cerebral Valley 黑客团队打造 20 美元开源智能眼镜,18/05/2024, 十斗,1151,,
上周末的一场 36 小时黑客松活动引发了一项重要的创新,可能会让开源社区颠覆智能眼镜行业。一支由五人组成的团队成功打造了一款价格仅为 20 美元的智能眼镜,名为 Open Glass,该眼镜能够将视觉和听觉与 AI 聊天机器人相连,例如 Meta 的 Llama 3。
上周六早上,Scott Fitsimones 前往旧金山市中心与 Nik Shevchenko 会面,当时他并不知道接下来的 36 小时将与他一同参加 AI 黑客松,共同打造一款新设备。当时,Fitsimones 认为他要取回的是 Shevchenko 制造的 AI 项链,他被描述为旧金山蓬勃发展的 AI 可穿戴设备运动的领导者。到了周末结束时,他们的团队赢得了黑客松比赛,并有大约 1500 人在等待名单中预订他们的开源智能眼镜。
Fitsimones 表示:“我对这次黑客松一无所知,这真是一个很巧合的机会。”他说:“然後,你知道,我们开始对最初的原型进行改进和构建。”根据他的团队成员所说,Shevchenko 参加黑客松时已经知道他想要为某种智能眼镜建造硬件元件(Shevchenko 没有回应 Gizmodo 的采访请求)。他与解决该项目最困难的软件挑战的 Stepnan Korshakov 一起参加比赛。这两位与 Fitsimones、Shreeganesh Ramanan 和 Jatin Gupta 组成的团队一起成为了冠军。
在一个俯瞰着湾区蔚蓝海水和绿山的宽敞房间里,软件工程师们坐在舒适的沙发上,旁边摆满了 La Croix 饮料。Cerebral Valley 经常举办这样的黑客松活动,汇聚了旧金山蓬勃发展的 AI 初创企业圈。Shevchenko 是少数使用焊接笔而不是笔记本电脑的人之一,而团队的其他成员则继续着软件开发工作。在周六晚上的某个时刻,Shevchenko 离开活动现场去 3D 打印 Open Glass 的电脑外壳。
经过大约 36 小时的努力,Shevchenko 和团队自豪地展示了一副便宜的太阳眼镜,右侧突出一个黑盒子。这款眼镜配备了一个每五秒拍摄一次照片的相机,以及一个不断进行语音转录的麦克风。这样就可以收集照片和文字的数据库,以反映你的视觉和听觉所感知的事物。按下眼镜侧面的按钮,你可以向 Meta 的 Llama 3 聊天机器人提问有关自己生活的问题。
在演示过程中,AI 回答了一些问题,例如:“那个人叫什麽名字?”,“我把钥匙放在哪里了?”,以及“这些水果有多少卡路里?”这项技术对许多人来说都有用处,但对视力不佳或听力不佳的人尤其有帮助。尽管在演示过程中眼镜的语音转文字功能出现了一个错误,Shevchenko 的团队仍然在黑客松比赛中获得了第一名。他们得到了 Meta 和 Groq 的高层的认可,以及 Hugging Face 的 CEO Clem Delangue 的评判。几个小时之内,Shevchenko 的创业思维迅速启动,他创建了一个预订该原型版本的等待名单。
尽管目前市场上已经有其他智能眼镜,例如 Meta 的 Ray-Bans,但它们并不是开源的,也不像这麽便宜。Open Glass 提供了一个相对便宜的套件,允许开发人员选择他们想要使用的 LLM(聊天机器人)并决定眼镜的功能。例如,并非每副 Open Glass 都需要拍照或不断记录音频。这为智能眼镜提供了一个价格合理、可修改的选择,以前这种设备的价格昂贵且功能有限。
Ramanan 在一次电话访问中表示:“你可以将它连接到 OpenAI,你可以将它连接到 Gemini。”他说:“这主要是关於拥有混合和匹配所有最佳选项的能力,然後创建自己有趣的应用和框架。”智能眼镜还没有像其他可穿戴设备那样普及起来。然而,多模态 AI 模型的进步使得现在是智能眼镜的一个令人兴奋的时刻。很容易想像到,像 OpenAI 的新 GPT-4 Omni 这样可以同时处理视频、音频和文本的技术可以应用於这样的眼镜中。甚至 Google 在最新的 AI 演示中展示了新的 Google 眼镜的原型。Open Glass 希望通过让开源社区获得这项技术,促进该领域的更大创新。
智能眼镜一直存在隐私问题。Meta 的 Ray-Bans 并不会不断录制音频和视频,以将你的生活变成一个数据库,这可能是一件好事。但在矽谷有一个不断增长的 AI 设备爱好者社区,他们对不断记录自己生活以创建终极个人助理的想法很感兴趣。从旧金山的初创企业中冒出了戒指、项链,现在又有了眼镜,所有这些都对这种潜力充满好奇。
尽管开源技术将使开发人员能够以更本土化的方式创新这些想法,但隐私和成本仍然是需要解决的重大问题。这些问题对於这项技术的早期开发者来说很重要,但更重要的是使其变得有用。
一些非技术人员可能会购买 Open Glass,仅仅是为了使用一副便宜的智能眼镜。该团队仍在研究产品,但似乎它将预先内置大型语言模型并配有相应的移动应用程序。实际设备的价格还有待确定,但所有的源代码在 GitHub 上都可以免费获得。
Open Glass 的故事证明了旧金山蓬勃发展的 AI 初创企业文化。开源社区可能会在智能眼镜等技术上实现重要突破。从实用角度来看,它还可以为非技术人员提供一副价格与一张电影票相当的智能眼镜。
______
最全面,最真心的「手机开箱」即睇: 手机、平板真心评测
更多 SIM Card 评测请即睇:电话卡速度测试比较
更多手机消息:https://www.techritual.com/category/news/mobile-handheld/
,十斗https://www.techritual.com/author/tenten/十斗在知名大学取得了计算机科学与工程学位,并在学术研究方面表现出色。她的研究领域包括人工智能、机器学习和数据科学。一斗为十升,一升为十合,一合为十分之一升。谢灵运言天下才学一石,曹植占八斗,以此赞誉。後用以比喻才学极高。,Techritual 香港River