开放语音助手的时代已经到来

TL;DR: 查看产品页面

我们都值得拥有一个不会收集数据、也不会随意限制功能的语音助手。正如 Home Assistant 让私密且本地化的家庭自动化成为现实选择一样,我们相信,语音助手也完全可以,而且必须如此。

自从我们开始为 Home Assistant 开发开源语音助手以来,始终缺少一个关键元素:真正优秀、而且易于设置和使用的硬件。它应该能听清你的声音、给出明确反馈,并自然地融入家庭环境。价格合理且高质量的语音硬件,将让更多人参与到它的发展中,也让任何人都能在今天就预览语音助手的未来。这也将成为未来几年我们继续开发时所围绕的标准。

Voice Preview Edition with packaging

我们推出 Home Assistant Voice Preview Edition,是为了加速实现我们的目标:不仅追平现有语音助手的能力,还要超越它们。这几乎是注定的事情:他们会把重点放在语音变现上,而我们的社区会专注于打造开放且私密的语音体验。我们会支持那些大型科技公司忽视的语言,也会真正把“你如何在家里运行语音”这件事的选择权交还给你。

开放且私密的语音助手时代,从现在开始,而我们也很希望你能成为其中的一部分。

目录

介绍 Home Assistant Voice Preview Edition

Voice Preview Edition with packaging

我们打造 Voice Preview Edition 的首要目标,就是做出体验 Assist 的最佳入门硬件。Assist 是 Home Assistant 内置的语音助手。如果你已经在使用其他第三方硬件来运行 Assist,那这会是一次巨大的升级。我们优先关注它“听见命令”的能力,因此为它配备了行业领先的专用音频处理器和双麦克风。我每次都会惊讶于它在房间里捕捉我声音的表现究竟有多好。

接下来,我们确保它能够自然融入家居环境,因此给它做了一个简洁但不张扬的外观设计。当然,这并不代表它没有个性。当你真正拿到 Voice Preview Edition 时,首先注意到的会是它质感十足的注塑外壳,半透明的效果很像你最喜欢的 90 年代科技产品。LED 光环也非常吸睛,而且你可以随心定制,从夸张的 gamer RGB 到低调柔和的光效都可以。

3 different views of Voice Preview Edition

很难准确形容这个旋钮用起来有多舒服;细腻的段落感再加上 LED 动画,让人很难不去拨几下。更重要的是,这个旋钮让家里任何人都可以直观地调节音量。多功能按钮和静音开关也是如此,而静音开关会直接物理断开麦克风电源,以实现极致隐私。我们知道,如果它要发挥最佳效果,就必须自然地摆放在家中显眼的位置。所以可以这么说,在设计它的时候,Home Approval Factor 始终都是我们非常重视的一点。

我们也努力把价格控制在亲民范围内,让它与其他语音助手硬件保持可比性,建议零售价仅为 59 美元(不同零售商的实际价格会略有差异)。这不是预售,现在就可以买到!

Voice Preview Edition price

为什么叫 Preview Edition

对有些人来说,我们的语音助手已经足够了;他们只是想说几个命令、设置计时器、管理购物清单,以及控制最常用的设备。对另一些人来说,我们理解他们可能还希望语音助手会学鲸鱼叫,或者告诉他们 Taylor Swift 有多高——而这个语音助手目前还不能完全做到这些(暂时还不行)。

我们认为,在它真正准备好走进每一个家庭之前,我们还有很多工作要做。因此,在那之前,我们销售的是语音助手未来的一个Preview。我们打造了目前市场上最好的硬件,并树立了未来几年的新标准,让我们可以在继续完善语音助手、为每个家庭做好准备的同时,更有方向地推进开发。重新夺回隐私并不是每个人都会立刻接受的事——这是一段旅程——而我们希望有尽可能多的人能尽早加入,一起把它变得更好。

为 Home Assistant 而生

有很多其他语音助手也能与 Home Assistant 配合使用,但这一款是专门 Home Assistant 打造的。不同于其他可以运行 Assist 的语音硬件,它不需要刷写固件,也不需要任何组装。你只要把它接上电源,Home Assistant 就会自动发现它。设置向导会立刻开始帮助你完成语音助手配置,更重要的是,如果你以前从未用过语音,它会快速带你完成获得最佳体验所需的每一步。

Video of Assist wizard通过我们的新向导,几分钟内就能让 Voice Preview Edition 开始工作

这不是一个 DIY 产品。我们努力让整个体验尽可能顺滑,包括简单、快速的更新流程,以及可以直接从 Home Assistant UI 中管理的各项设置。

高级音频处理

如果你一直关注我们在语音方面的工作,你就会知道我们尝试过很多不同的语音助手硬件。市面上大多数支持 Assist 的硬件,在最重要的任务上其实都表现一般:听清你的声音,然后提供清楚的视听反馈。而这正是推动我们打造 Voice Preview Edition 的根本原因。

即使正在大声播放音乐,Voice Preview Edition 的麦克风和音频处理器也能轻松听清命令

面对质量欠佳的音频,我们的 Assist 软件能做的始终有限,而一旦音频清晰,它的整体表现就会有巨大提升。双麦克风配合 XMOS 音频处理芯片,就是它如此强大的关键。它们共同带来了回声消除、固定噪声去除,以及自动增益控制,这些能力叠加在一起,最终就是更清晰的音频。再加上配备 8 MB 八路 PSRAM 的 ESP32-S3——这是目前速度最快的 ESP 与内存组合之一——让整个设备响应极其迅速。这是你现在能买到的最好的 Assist 硬件,而且随着未来几年 Assist 功能持续扩展,它也会继续提供优秀的体验。

把选择权带回语音

Assist 可以做到一件几乎没有其他语音助手能做到的事:它可以在没有互联网的情况下运行 🤯。你可以直接对 Voice Preview Edition 说话,而这些命令可以完全在你家中本地处理。当然,在撰写本文时,这仍然有一些明显前提,尤其是你需要说一种受支持的语言,并且还需要足够强大的硬件来本地运行它(我们建议使用至少 Intel N100 级别或更强的 Home Assistant 系统)。

graphic of local vs cloud云端与本地语音处理对比示意图

如果你使用的是性能较低的 Home Assistant 硬件,也有一种简单且价格合理的互联网方案可选:Home Assistant Cloud。这项以隐私为中心的服务可以帮你承担语音转文本和文本转语音处理,同时保持很高的响应速度,并让你的能耗更低。语音转文本是两者中更难本地运行的一项,而我们的云处理在更多语言上几乎总是更准确(你可以查看我们的语言支持检查器)。

我们的目标,是让 Assist 在所有语言上都能做到轻松、实惠并且完全本地化运行。作为一个见证了这项技术在过去几年快速发展的人,我对此非常乐观。但在那之前,很多语言已经拥有一系列兼顾强隐私与可用性的选择。

完全开放且可定制

Some interesting cartoon-inspired 3D prints for Voice Preview Edition如果你想 3D 打印一个新外壳,我们正在公开设计文件……这些造型几乎是注定会出现的

我们不只是推出一款新产品,而是把整套东西全部开源。这是我们为 Home Assistant 社区打造的。我们的社区并不想要“唯一的一个”语音助手,他们想要的是“最适合自己”的那个——他们要的是选择权。打造语音助手并不容易,而直到现在,其中一些关键部分仍被昂贵的授权和专有软件锁住。随着 Voice Preview Edition 以开源方式发布,我们希望它能成为一个语音助手生态系统的起点。

我们尽可能让 Voice Preview Edition 的每一个方面都可定制,而当你与 ESPHome 和 Home Assistant 协同工作时,这其实非常容易。默认设置下它就已经很好用,但如果你有兴趣,也可以自行定制 Assist 软件、ESP32 固件和 XMOS 固件。

Voice Preview Edition with packaging连接 Grove 传感器后,你可以把 Voice Preview Edition 当作更传统的 ESPHome 设备来使用——这里它同时充当语音助手和空气监测器

我们也让这款硬件在内外都更容易改造。例如,附带的扬声器主要用于提醒和语音提示;但如果你想把它作为媒体播放器使用,也可以通过附带的 3.5 mm 耳机接口连接外部音箱,并使用 Music Assistant 这样的软件来控制。内置 DAC 的素质很不错,支持无损音频播放。它本身也可以作为一个相当强大的 ESP32 设备来使用。设备底部有一个 Grove 接口(藏在一个可永久拆除的盖板下),你可以接入一个庞大的传感器与配件生态。

我们还让它拆起来尽可能不费劲:螺丝容易接触,没有卡扣。我们甚至在电路板上保留了裸露焊盘,让进一步改造更直接。我们会提供完整的 3D 文件,这样你就可以打印自己的零件……哪怕是卡通风格的外壳。我们并不想规定你能对自己的设备做什么或不能做什么,我们尽了最大努力不去阻碍你。

社区驱动

Home Assistant 与 ESPHome 最美妙的一点,就是当你修复问题或新增功能时,你从来都不是一个人。我们打造这款设备,就是希望社区能在语音领域更紧密地协作;我们甚至一度考虑把它命名为 Community edition。归根结底,推动语音不断前进的正是社区——有人亲自参与开发,也有人通过购买官方硬件或 Home Assistant Cloud 来支持开发。语音领域已经取得了很多成果,而我也迫不及待想看到我们接下来一起实现的进步。

结语

Home Assistant 重视 倡导选择。今天,我们正在提供语音硬件领域最好的选择之一:一个真正私密、而且完全开放的选择。我为团队打造出这样一款既好用又有质感的硬件感到无比自豪——这对语音硬件来说是一次巨大的飞跃。我相信,在未来很多年里,它都会成为开放语音项目的硬件标杆。我也想感谢那些正在扩大这个项目语言覆盖范围的语言负责人、Preview Edition 的测试人员,以及过去几年里所有参与我们语音工作的每一个人。

硬件其实只占整个图景的一半,真正把这一切串联起来的是软件。Mike Hansen 刚刚写了一篇配合本次发布的 Voice Chapter 8 博客,其中详细解释了过去两年里我们为让 Assist 真正适用于家庭场景所做的一切。他也重点介绍了 Voice Preview Edition 被设计出来后,将如何帮助进一步加速这些开发。

看看今天的语音已经能做到什么