字节首款AI耳机评测来了!豆包大模型加持 交互体验仍有提升空间

《科创板日报》10月16日讯(记者 唐植潇) 字节跳动加入AI耳机战场。

近日,字节跳动发布了首款AI智能体耳机Ola Friend。根据此前《科创板日报》独家报道,字节跳动于今年9月份前后正式完成对Oladance(主体公司:深圳市大十未来科技有限公司)收购。而Ola Friend耳机的硬件部分正是由原Oladance团队完成。 字节跳动首款AI硬件Ola Friend耳机意义非凡,其背后连接的是字节自研的豆包大模型。有观点认为,豆包大模型更贴近中国用户习惯的语言理解和生成能力。鉴于字节跳动旗下还拥有抖音、汽水音乐等热门APP,这也为其日后的AI硬件应用场景提供了更广阔的想象空间。

据悉,Ola Friend 已经在各大电商平台开启预售,将于10月17日正式发货,售价1199元。而我们也在第一时间拿到了这款产品并做了评测。

沿用开放式设计,单只耳机重量仅为6.6g

中国通信工业协会数字经济平台分会副会长高泽龙对《科创板日报》记者表示:“硬件行业确实需要长期的研发投入和市场培育,字节跳动作为一个以软件起家的企业,进入硬件领域意味着将面临新的挑战。”

因此,字节跳动并没有选择直接下场,而是采取收购方式,结合豆包大模型的能力,进入生成式AI硬件领域。

公开资料显示,Oladance成立于2019年,由前 BOSE 高管李浩乾与多名 BOSE 工程师共同创立。Oladance是业内最早提出OWS(全开放穿戴式耳机)专利技术的专业耳机厂商,还推出了全球首款OWS全开放耳机。此前,Oladance一直主攻海外中高端耳机市场,被黑蚁资本和蓝驰创投等投资机构看好。

《科创板日报》记者注意到,Ola Friend耳机也沿用了此前的OWS开放式耳机设计,主打无感佩戴,单只耳机重量仅为6.6g。

此外,为了确保耳机佩戴的舒适性,在耳机发声单元与供电单元之间,Ola Friend使用了亲肤硅胶进行连接,耳机并不影响佩戴眼镜用户的使用。同时,支持IP54级别防水,能够有效防止运动过程中的汗液,以及小雨的淋溅。

与传统的设计方案不同的是,Ola Friend耳机盒有着自己的巧思。采用类似“零钱包”式外观设计,一侧印有产品标识和“Creating Sound to live with”的标语,另一侧预留有开孔,可挂在钥匙扣上。

根据官方提供的数据,仅聆听音乐的情况下,单只耳机可实现8小时续航时长,搭配充电盒可实现28小时续航时长。

耳机本体标识为触控操作区域,长按两侧可激活配对,用户可通过“豆包”App中设置页面,就可以连接豆包AI账户和耳机,以实现AI语音助手功能。

使用中,任意一侧双击为播放/暂停音乐和接听电话,长按为快速开启单轮对话,用户也可以通过唤醒词“豆包,豆包”以进入到豆包AI的连续对话。

买Ola Friend送豆包大模型?

体验中《科创板日报》记者注意到,在安卓手机上,用户必须要允许豆包App常驻后台,iPhone上需要开启允许后台App刷新功能,并保持网络通畅,否则仅能唤醒豆包,但无法调用其AI能力。

以音乐功能为例,《科创板日报》记者体验中发现,豆包App默认集成的音乐服务为抖音旗下的汽水音乐,购买设备赠送了一个月VIP会员,结合目前汽水音乐签到赠送VIP资格的活动,暂时不用担心歌曲收费问题。

不过,豆包AI无法直接切换音乐播放源为QQ音乐、网易云音乐和酷狗音乐等第三方音乐APP。相比较之下,QQ音乐的曲库规模更为庞大,大约有2300万首曲目,拥有的版权包括索尼、华纳等全球三大唱片公司的音乐,以及其他众多唱片公司的独家版权。而网易云音乐的曲库在1000万左右,拥有天娱、爱贝克思、丰华、华研国际等版权。

现阶段打开上述APP后,通过Ola Friend的指令,用户只能实现简单的歌曲切换歌曲。 但记者也从业内人士处获悉,目前字节方面正和某第三方音乐平台商谈相关合作。

同时,记者也注意到,在直接语音询问Ola Friend与文字提问豆包AI,有着差异化的回答。

(上为文字版豆包,下为Ola Friend回答)

《科创板日报》记者以相同的问题询问豆包,文字版回答提供的数据和内容更为详实。而Ola Friend提供的语音回答,则更口语化且简洁,并且每次回答提问之后,Ola Friend还会抛出引导性的问题,引导用户继续追问。

按照官方的说法,Ola Friend可以落地多个生活场景,化身“随身百事通”、“英语陪练”甚至导游。

作为英语陪练,Ola Friend的英语识别准确率很高,并且能够及时指出用户表达中语法错误的部分,但目前还不能期待它能给出更准确和地道的表达词汇。

如果用户向Ola Friend发布指令,分析某只股票或者上市公司的业绩,也可以回答出相对专业的解读内容。

整体体验下来,《科创板日报》记者发现豆包AI能力与Ola Friend的配合仍然有提升的空间。

比如当记者提问“与马踏飞燕和长信宫灯同时期的,有什么出名的青铜器吗?“,豆包大模型只能重复介绍上述两件青铜器,而不能举例回答其他青铜器。

有观点认为,字节跳动选择耳机作为AI硬件的切入点,可能是因为耳机是人们生活中常用的设备,且与人的听觉和语言交互密切相关。

对此,中国人工智能学会专家郭涛认为,将AI技术应用于耳机,可以提供更智能、更便捷的语音交互体验,满足用户对于智能化生活的需求。

在郭涛看来,考虑到字节跳动在AI领域的布局和发展,以及其在短视频平台等领域的成功经验,后续可能还会在硬件领域持续投入以寻求长期发展。

AI大模型接入,无线耳机迎来新机遇

根据洛图科技监测数据,2024年8月,国内AI耳机销量及销售额分别同比增长763%和1447%,其中具备“商务办公+日常娱乐”功能的AI耳机销售额同比增长574%。

除了字节跳动的Ola Friend之外,三星早于今年7月10日发布了布两款耳机新品——Galaxy Buds3 Pro 与 Galaxy Buds3。其中Samsung Galaxy Buds 3 Pro耳机主打AI,具备自适应降噪、环境分析等功能,并能够配合 Galaxy 手机完成即时口译。

由科大讯飞孵化的iFlyBuds也推出过支持AI录音降噪会议耳机系列产品,该产品不仅支持全场景录音转写,包括线上会议与沟通、音视频录音、现场录音等,还支持同传翻译等多项功能。

洛图科技预测2024年国内AI耳机电商市场销量或突破20万,同比增速可达489%。

值得注意的是,以字节跳动、三星、科大讯飞为首的企业对AI无线耳机的布局,也给产业链带来了新机遇。

以Oladance前几代的产品为例,有机构拆解过Oladance OWS Pro,发现该产品采用了Cmsemicon中微CMS8S5887单片机、思远半导体SY8809蓝牙耳机充电仓解决方案、BES恒玄BES2600YP蓝牙音频SoC、以及艾为AW86862压力感应IC。

这些供应商中,恒玄科技近期就推出新一代6nm智能可穿戴芯片BES2800,集成Wi-Fi和蓝牙模块,支持本地传感网络算法处理,能够为TWS耳机、智能手表、智能眼镜、智能助听器等产品提供算力支持。

而思远半导体的电源管理类芯片目前已被OPPO、小米、vivo和Oladance等企业应用在其蓝牙耳机充电仓上。

此外,《科创板日报》记者联系了艾为电子和中微半导体方面,其中艾为电子证券部相关人员告诉记者:“与我们合作的客户比较多,也有很多大型芯片经销商代理我们的产品,因此我们无法确认哪些产品会采用我们的芯片。但我们确实有压力感应IC应用在无线蓝牙耳机上面。“

中微半导体方面则对记者表示:“我们有耳机主控芯片相关业务,此前也与Oladance团队有过接触,但出货是ODM厂商,因此出货规模取决于他们耳机的规模。“

截止至发稿前,玄恒科技与思源半导体方面并未回复记者。


一文快速了解国内主流AI大模型

中国主流大模型应用选型。 大模型企业均加大对可持续发展计划的战略和投入。 首先,各企业不断增加研发投入,推进技术创新,确保在技术前沿保持竞争力。 其次,人才是可持续发展的核心,通过与知名高校和科研机构合作,企业不仅培养大量专业人才,还吸引顶尖专家加盟。 最后,各企业制定了详尽的长期战略规划,明确未来的发展方向和目标,以确保企业在激烈的市场竞争中保持持续的创新动力和发展活力。 话不多说,直接上干货。 有帮助麻烦点赞支持~1、文心一言 文心一言是基于网络研发的知识增强大语言模型的AL聊天机器人,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 文心一言基飞奖深度学习平台和文心知识增强大模型、持续从海量数据和大规模知识中融合学习,具务知识增强、检索增强和对话增强的技术特色。 点击跳转 文心一言 2、通义千问2.5正式上线 阿里巴巴推出的类ChatGPT响应人类指令的大模型模型中英文综合能力显著提升,模型推理能力和复杂指令理解能力显著增强,困难任务上的表现更优文本理解能力提升:文本分类、信息抽取、情感分析、润色纠错等文本处理任务更稳健,代码能力整体提升点击跳转 通义千问 3、腾讯混元 由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力点击跳转 腾讯混元 4、字节跳动:豆包 豆包是字节跳动最新推出的免费A对话工具,提供网页端、i0s和Android端应用程序,可使用手机号和抖音账号登录。 据悉,豆包APP也就是此前字节内部代号为Grace的AI对话项目。 点击跳转 豆包 5、科大讯飞:星火大模型 讯飞智作是一款AI赋能音视频生产的内容创造平台,让内容创作更快、更省、更创意,打造成为每个人的AIGC创意基地。 全栈能力服务,让AI像水和电一样触手可及点击跳转 讯飞智能 6、360智脑 360互联网全端应用场景,360智脑基于大规模高质量的语料训练,拥有强大的自然语言处理能力,提供优质输出。 提供多种API能力帮助企业提升客户服务体验、优化业务流程、提高生产效率。 点击跳转 360智脑 7、零一万物 Yi-Large 全球SOTA千亿参数闭源大模型愿景:让通用人工智能普惠各地,人人受益秉持着坚定的技术愿景和人工智能信仰,零一万物致力打造全新的 AI 2.0,我们认为 AI 应当以人为本,Human + AI 将合作创造巨大的经济价值及社会价值。 点击跳转 零一万物 8、华为盘古 盘古大模型3.0是面向行业的大模型,包含L0中5类基础大模型、L1行业大模型及L2场景模型三层架构让AI与行业深度融合。 点击跳转 盘古大模型 9、智谱GLM 让机器像人一样思考打造超越图灵测试的机器认知智能,实现SaaS、PaaS到MaaS的升级,模型化服务时代的引领者专注中文认知大模型,赋能应用自主创新的算法、领先的中文认知大模型企业 点击跳转 智谱AI 10、商汤日日新 2023年7月7日,上海——2023世界人工智能大会(WAIC)战略合作伙伴商汤科技召开“大爱无疆·日日新”人工智能论坛,重磅推出 “商汤日日新SenseNova”大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。 此外,商汤也着重介绍并展示了其大模型技术自正式发布以来与产业各方的应用实践,包括商汤绝影最新打造的智能座舱产品和车路云协同交通体系等,以及在金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。 点击跳转 商汤日日新 11、百川智能 集百川之智,共赴山海,欢迎对AI充满激情与梦想的每一位同仁加入,共创美好未来“生活在二十一世纪初是如此幸运,波澜壮的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。 AI成功将语言转化成了数学模型,语言承载的知识、思考、沟通和文化,也成为了数学问题。 这不仅将重塑现有行业,更将创造前所未有的价值和机遇。 我最动心的是,能和一群有理想的人用极致的技术驱动创造出颠覆性的智能产品,帮助大众轻松、普惠地获取世界知识和专业服务。 我们渴求来自中国的领军人物、行业专家以及远在美国的同仁加入,把自己的智慧注入AI,做新时代的开创者,繁荣和延续人类文明。 ”点击跳转 百川智能 12、海螺AI 与用户共创智能MiniMax 是领先的通用人工智能科技公司,致力于与用户共创智能。 MiniMax 自主研发了不同模态的通用大模型,其中包括万亿参数的 MoE 文本大模型、语音大模型以及图像大模型。 点击跳转 MiniMax

一次曝 9 个大模型,「字节 AI」这一年都在做什么?

字节跳动在大模型领域的布局与应用字节跳动虽入场较晚,但并未影响其在大模型领域的持续投入与探索。 其内部自研的大模型,虽未正式对外宣布,但已通过相关备案及内部应用验证。 2023年8月,字节跳动云雀大模型成功备案,同时,新成立的AI部门——Flow,集结了一批核心人才,积极开发AI应用。 过去大半年,字节跳动在AI应用领域广泛布局,豆包、扣子等产品展现出强劲的发展势头。 在火山引擎原动力大会上,字节跳动首次揭开其自研大模型——豆包大模型家族的神秘面纱,包括豆包App及AI应用产品「扣子」的详细阐述。 火山引擎总裁谭待透露,豆包大模型已成为使用量最大、应用场景最丰富的国内大模型之一,日均处理文本1200亿Tokens,生成图片3000万张。 豆包大模型在模型推理价格方面表现突出,谭待指出,这将助力企业以更低的成本加速业务创新。 当前,豆包大模型的主力模型在企业市场的定价仅为0.0008元/千Tokens,0.8厘即可处理1500多个汉字,相比行业水平便宜99.3%。 除模型产品本身,字节跳动对大模型及AI产品的深入思考同样值得关注。 在火山引擎原动力大会上,字节跳动分享了对大模型家族、火山方舟2.0、AI应用及AI云基础设施的最新布局。 豆包大模型家族涵盖通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型,针对不同市场需求,提供多样化选择。 字节跳动内部50多个业务已大量使用豆包大模型进行AI创新,覆盖抖音、番茄小说、飞书、巨量引擎等。 字节跳动基于豆包大模型打造了AI原生应用,包括AI对话助手「豆包」、AI应用开发平台「扣子」、互动娱乐应用「猫箱」,以及星绘、即梦等AI创作工具。 其中,豆包和「扣子」成为字节跳动发力的主要产品。 字节跳动通过AI原生应用,如豆包App,在AIGC类应用中排名第一,拥有超过800万个智能体,月度活跃用户达到2600万。 字节产品战略负责人朱骏分享了字节对做大模型应用的思考,包括拟人化设计、离用户近、个性化需求等原则。 火山引擎的基础设施也在持续升级,提供联网插件、内容插件、知识库插件等服务,以及底层基础设施的系统承载力、安全防护和专业算法团队支持。 此外,火山引擎还推出了新一代AI应用开发平台——扣子专业版,以满足应用开发的低门槛、个性化、实时性、多模态等需求。

免费AI使用指南:有人已经通过AI月入十万

2024年,AI已全面渗透至工作与生活,成为不可或缺的助手。 早期关注AI工具的先驱,如今在各大论坛担任专家,自媒体领域的人士已开始利用AI为自己创造价值,实现收入增长。 然而,身边仍有不少人尚未掌握AI工具的使用方法。 我将分享几种常用的AI工具,它们由大厂研发,功能强大,且免费或开源。 首先,Kimi是一款由月之暗面提供的AI工具,其创始人杨植麟拥有深厚的学术背景,在AI领域具有广泛影响力。 Kimi界面简洁,交互友好,能提供问答、文档速读、资料整理、灵感激发和内容创作等服务。 在中文领域中,Kimi表现尤为出色,支持约20万汉字的上下文输入。 其次,豆包APP是字节跳动推出的一款AI智能助手,内置多样功能,如学科知识问答、文案创作、高质量图片生成等。 豆包提供编程助手、起名神器、英语学习助手等多种智能体,适用于办公、学习、生活和娱乐场景。 豆包的亮点是其AI语音克隆功能,用户只需录制一段声音样本,AI就能模仿用户的语音特征。 此外,Coze平台允许用户开发智能体,并发布到豆包和飞书。 AI手机成为普及AI体验的重要入口,一加12和一加Ace3V等手机搭载了AI大模型,支持多种功能,如会议记录、语音转文字等,大大提高了使用效率。 一加Ace3V以中端高性能配置和亲民价格,提供了旗舰级体验,实现了AI手机的普及。 剪映专业版集成了AI技术,显著提升了视频体验。 新增功能如智能剪口播、智能抠像、AI语音克隆、AI绘画和图文成片等,使得制作视频变得更加便捷。 AI功能的引入,为内容创提供了前所未有的创造力和便捷性。 国产AI绘画工具6pen提供了更专业和灵活的参数调整,支持自定义分辨率和关键词,满足更专业的需求。 dreamina是字节跳动家的AI绘画工具,支持文生图和文生视频,虽然免费额度有限,但已与剪映深度合作,为AI绘画和设计提供更多可能性。 AI文生视频工具Stable Video是目前生成速度和质量上佳的选择,支持文生视频和图生视频模式,可快速生成高质量视频内容。 Stable Video界面友好,提供免费积分生成视频片段,支持银联信用卡充值点数,深受用户喜爱。 对于AI教程,网上有许多免费资源,包括飞书文档和AI信息站合集。 Sora的展示展示AI文生视频的强大潜力,但目前仍处于demo阶段,因此Stable Video和即将发布的AI文生视频版本成为当前值得关注的选择。 在使用AI工具时,关键词的编写至关重要。 掌握故事叙述、描述性语言、细节、情感和创意表达等元素,能够有效指导AI生成所需的视觉内容。 理解AI工具的艺术家风格、渲染工具、器材和材质描述等细节,将帮助用户更准确地表达意图。 保持对新鲜事物的好奇心,学会使用最新的生产工具,如AI,是应对不确定时代的关键。 AI正成为这个时代的新质生产力,掌握它,将有助于摆脱生存的恐惧,实现个人发展。

天津取消住房限制性措施
全球手机大盘继续回温 vivo增长最快 苹果紧追三星