字节的第一款 AI 硬件,只是一次悄悄试水?
2024-10-12 21:4:0 Author: mp.weixin.qq.com(查看原文) 阅读量:17 收藏


1199元的AI朋友,买一个带耳边?
作者 | 连冉
编辑 | 郑玄
几个月前刚收购开放式耳机品牌 Oladance 的字节跳动,这就发布了首款生成式 AI 硬件设备。
10 日上午,字节跳动豆包发布了一款硬件产品——AI 智能体耳机 Ola Friend。该产品是一款开放式耳机,单耳 6.6 克同类最轻;可接入豆包大模型,并与豆包 APP 深度结合;已在各大电商平台开启预售,将于 10 月 17 日正式发货,售价 1199 元,一个价格对比是,苹果最新款 AirPods 4 主动降噪款售价 1399 元。
用户戴上耳机后,无需打开手机,只需喊出关键词「豆包豆包」,便能唤起豆包进行对话,后者能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。
今年以来,随着大模型应用落地的加速,AI 硬件也如雨后春笋般蓬勃发展,AI 手机、AI 耳机、AI 眼镜等新品纷纷涌现,就连苹果也忍不住下场,不仅在新 iPhone 和新版本 iOS 中加入 AI 功能,还传出要做 AI 眼镜。
谁能成为 AI 时代,用户与人工智能交互的第一个入口?今天看来智能眼镜和智能耳机,是最有可能的热门候选。很显然,收购了 Oladance 和 Pico 的字节两者都不会错过,而 Ola Friend 就是字节打出的第一张牌。

01

Ola Friend:

字节版「Her」?

字节的这次发布很是低调,连发布会都没开,仅仅是在微信公众号、小红书等官方账号做了线上发布。
从发布页面信息来看,Ola Friend 主打陪伴,「TA 是一个随时陪伴在耳边的 AI 朋友,在你需要的时候,TA 都在你耳边。」
图片来源:Ola Friend
Ola Friend 是一款开放式耳机,单耳 6.6 克同类最轻,据称实现了几乎无感的佩戴感受。该款耳机接入豆包大模型,并与豆包 APP 深度结合。
用户戴上耳机后,无需打开手机,只需喊出关键词「豆包豆包」,便能唤起豆包进行对话,后者能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。
目前,Ola Friend 已经在各大电商平台开启预售,将于 10 月 17 日正式发货,售价 1199 元。
作为首款基于豆包大模型的 AI 硬件产品,Ola Friend 的推出意味着字节跳动从硬件到内容的 AI 生态系统进一步完善。
Ola Friend 耳机的硬件部分由字节跳动不久前收购的原 Oladance 团队完成。该团队以其创新的 OWS 专利技术闻名。尽管该并购案完成时并未掀起特别大的波澜,但业界人士都在讨论字节跳动的意图非常明确——要将 AI 跟耳机产品深度结合。
所谓 OWS,即 Open Wearable Stereo,开放式可穿戴立体声系统,是 Oladance 全球性提出的一种全新的全开放不入耳的声音解决方案。
相比传统的骨传导耳机要通过骨骼将振动传递到内耳,绕过耳膜,OWS 耳机则采用气导技术,通过空气将声音传递到耳朵,更自然 ;同时,骨传导耳机需要紧密贴合头部,可能不适合长时间佩戴,OWS 耳机不入耳、无需紧贴,更舒适,更适合长时间佩戴。
Oladance 此前被字节跳动收购,后者对该品牌 100% 控股。Oladance 成立于 2019 年,由前 BOSE 高管李浩乾与多名 BOSE 工程师共同创立,核心产品线包括 OWS 全开放真无线蓝牙耳机系列,主打佩戴轻盈舒适、续航超长以及独特的开放不入耳设计。
通过这次收购,字节跳动不仅获得了 Oladance 的核心技术,还吸纳了一支由前 Bose 工程师组成的经验丰富的团队,打好了其在音频技术领域的「基本功」。
Oladance 的技术应该能够帮字节跳动提升其 VR/AR 设备的音频表现,开放式耳机的设计不仅为更大容量的电池提供了空间,还为集成多种传感器创造了可能性。结合字节跳动此前收购的头显厂商 Pico,这些技术的融合为其在视听体验和可穿戴设备领域的扩展带来了更多潜力。
过去一年里有不少 AI 耳机产品已经陆续发布。目前看起来 Ola Friend 并没有特别的形态创新,跟 Oladance 之前的耳机大差不差,就是一款「耳机」,也没有想象中的摄像头,只是接入了大模型,唤起调用模型不用打开手机——这样的「AI 耳机」,似乎没有想象中有那么多黑科技。
不过,在前两天极客公园的「今夜科技谈」中,灵宇宙创始人顾嘉唯谈到,字节此次推出 Ola Friend,意在探求类似「Her」的 personal AI 场景,尽管它在外观设计上跟传统的 OWS 耳机没有明显区别,也没有把个性化的很多能力和边界无限的提高预期,但这正是拿捏用户预期的一种管理方式,「本质上,他们是让你知道这首先是一个普通的耳机,然后当它的软件端的能力和体现出来的时候,就会有一些超预期的可能性」。
在他看来,字节推出这款耳机,很重要的目的之一,其实是为了让豆包有更多的更快能触达的便捷方式,降低访问豆包的门槛。
豆包已经是国内用户最多的原生 AI 应用。同时,在 AI 大模型与应用方面,字节已经全面布局,开发了多个文本和多模态大模型,包括豆包大模型家族,涵盖通用模型、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图模型、Function Call 模型和向量化模型。
此外,字节也开发有多个基于豆包大模型的 AI 原生应用,除了豆包,还有 AI 应用开发平台「扣子」、互动娱乐应用「猫箱」等超 10 款 AI 产品。
而端到端的 AI 硬件,可能是字节补齐 AI 布局的最后一块拼图。

02

眼镜 or 耳机,

大模型落地现实的

第一个入口?

下半年以来,大模型软件的商业化似乎不及预期,大模型+硬件似乎成了新的出路,尤其是在 Meta Ray-Ban 智能眼镜大热之后。
早前国金证券发布研报称,估算 Meta Ray-Ban 在 2024 年 Q2 季度出货量或达 50 万台,年销量达 200 万台。
图片来源:雷朋官网
国外巨头里,苹果似乎同样有意加入战场。据彭博社报道,苹果旗下的 Vision Products Group 事业群正在研发的设备包括平价版 Apple Vision、第二代 Apple Vision Pro、以及一款类似于 Ray Ban Meta 的 AI 智能眼镜。
国内各家公司也纷纷推出产品。4 月,小米米家智能音频眼镜悦享版正式发售;5 月,华为推出了搭载盘古大模型的智能眼镜;8 月,蜂巢科技推出了界环 AI 音频眼镜。
那为什么字节先推出的是耳机,而不是眼镜?
「字节肯定是有在做眼镜的」,在顾看嘉唯来,无论是头盔式 VR,还是其他轻量型设备,或者透过光机画幅技术实现透视效果的设备,字节都有在积极探索和做迭代。
对于像字节这样的互联网大厂来说,选择做硬件不仅是基于情怀,更是对构建入口的持续追求,探索和试错都是必经之路。
尽管目前还没看到字节发布类似 Ray-Ban Meta 这样的硬件产品,但可以预见,他们必然会沿着这条路径寻找机会并逐步推出相关设备。不要低估字节在布局硬件上的资金、动力以及决心。
当然 AI 耳机也不止字节在做,5月,未来智能和科大讯飞就推出了讯飞 AI 会议耳机 Pro 2,具备录音速记、语音识别、同声传译等功能,还集成了 viaim AI 会议助理,能够智能分析会议内容,自动生成摘要和待办事项,并支持智能问答功能。
之前在 7 月,小米发布了新款耳机 Buds 5,虽然没有明确定位为 AI 硬件,但该产品支持语音快速转文字,并能一键生成会议摘要,展示了其越来越智能化的特性;3 月,前魅族副总裁李楠创立的怒喵科技宣布正在与魅族合作研发一款 AI 耳机。
不过,如果从更长的时间周期来看,不论是 AI+眼镜还是耳机,大模型要落地现实搭载硬件成为用户的个人助理,还有距离。这不仅涉及技术本身,还包括商业生态的打通。在新兴的技术入口之争中,首先入局的往往是手机厂商,紧随其后的是像微信这样的超级应用。也就是说,一旦 AI 助理技术发展到一个高度成熟的 PMF 阶段,手机厂商和这些超级应用巨头都会迅速涌入。
字节这时推出 Ola Friend,只是率先行动,谋求占得先机。
*头图来源:Ola Friend
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你认为智能硬件的兴起是
当前大模型商业化的趋势吗
 

热点视频

马斯克:我宁愿乐观而错误,也不愿意悲观而正确。
点赞关注极客公园视频号
观看更多精彩视频
 

更多阅读


文章来源: https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653057853&idx=1&sn=ec6d14019618101e613deb370ab27aad&chksm=7e570e8b4920879d51409dc3ef8e8b63727a830ea9a63d55548546b43a24899ea8408ff8a55d&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh