Phone calls are an API to the world — and AI takes this to the next level!
电话呼叫是通向世界的 API —— 而人工智能将其提升到了一个新的水平。本篇文章深入探讨了 a16z 对 AI 语音助手的洞察,全面剖析了其发展机遇、技术架构、未来趋势,以及在 B2B 和 B2C 领域的应用潜力。 01.AI 语音助手的机遇 现在正是重新定义电话的时代。得益于最新的人工智能技术,人们不再需要亲自打电话了。他们只会在通话真正有价值时才选择通话。 对企业来说,这意味着: 1、节省人工呼叫所需的时间和劳动力成本; 2、有机会重新分配资源以增加收入; 3、通过提供更加合规和一致的客户体验来降低风险。 对消费者而言,语音助手能够提供与人类相媲美的服务,而无需支付额外费用或与真人进行匹配。目前,这包括了治疗师、教练和陪伴服务——未来,这种服务可能会扩展到更广泛的基于语音的体验。正如大多数 toC 软件一样,最终的「赢家」是不可预测的。 在语音助手的各个层面,都隐藏着巨大的发展机遇——无论是构建基础设施、打造消费者界面还是提供企业级代理服务。针对面向消费者(B2C)和企业(B2B)的语音助手,我们归纳总结出以下关键特征: 1、重视构建效率 我们正在寻找那些对语音助手建设有明确见解的创始人,他们专注于优化语音助手的关键性能指标——速度、准确性、语气 / 情感等,以提供无缝的用户体验。 2、垂直专业化 我们认为,表现出色的语音助手很可能专注于特定垂类行业或领域,利用为特定用例定制的模型和紧密集成的工具集。这种方法更易于实施,并且能够更快地在市场上取得成功。 3、实际的业务范围 完全依赖人工智能处理所有重要通话是一项挑战——我们预计短期内,语音助手公司可能会采取一些「不可扩展」的策略。这可能包括对每个客户进行个性化调优,或者在必要时将通话转接给人工代理完成。





- 执行难度
- 法规和许可证
- 集成
- 与其他软件的结合
- 呼叫类型、语调和结构;
- 集成和流程;
- 市场进入策略(GTM)和「杀手级功能」。

- 大型公司已经拥有广泛的消费者基础和一流的模型(在准确性、延迟等方面)。语音服务并不容易大规模交付,尤其是考虑到最近推出的 GPT-4o。
- B2B 语音助手是将 AI「插入」现有流程中,而 B2C 语音助手则要求用户采纳新的行为,这可能比较慢或需要更具吸引力的产品。
- 由于过去使用 Siri 等产品的经验,消费者对语音 AI 的看法一直很负面,因此他们可能不愿意尝试新的应用程序。
- 目前的产品已经能够满足语音 AI 的基本用例——如辅导、陪伴等。B2C 语音初创公司才刚刚开始解决特定的用例或创造 ChatGPT、Pi 等无法处理的体验。
