汽车电子展|元神AI的发布与智能座舱的转型
人工智能技术在飞速的发展,当AI与汽车座舱更紧密的结合的时候,我们可以体验到更自然的人机语音甚至手势互动、更丰富的车载信息娱乐、以及更安全的智能驾驶辅助,还能进行个性化的定制。
斑马智行指出,智能汽车发展10余年,用户尚未获得丝滑的智能座舱产品体验;交互变革是这一过程的起点。
蔡总在交流中提到,苹果iPhone的成功源于它解决了用户的核心痛点,尤其是在触摸屏技术上的应用,使用户在手机上感受到前所未有的便捷与流畅。
但当前的汽车智能座舱还未达到这种程度,传统的车载系统多依赖于简单的触控与语音交互,缺乏多模态的自然交互。汽车电子展了解到,这里的技术难点在于,汽车内的用户交互场景复杂多样,而手眼协调的触摸操作模式在驾驶环境下并不适用。
当前的座舱并没有为用户提供一个与“iPhone时刻”相似的操作体验。比如,如何通过语音控制系统实现无缝交互,在汽车智能化过程中仍然是一个亟待解决的难点。
尽管技术不断进步,但在驾驶场景中,用户的手眼被驾驶行为占用,导致在操作其他设备时感到不便。未来智能座舱的突破点将可能依赖于语音交互的自然性提升,以及更好的交互方式来弥补驾驶过程中手眼不便的问题。
智能座舱的“iPhone时刻”,关键在于如何推动交互变革与APP生态的发展。
iPhone的成功源于其产品化的思维和命令式的设计,智能汽车行业也需借鉴这一点。智能座舱的多模态大模型虽然逐渐应用,但表现仍有待提高。
同时,产业生态的AI化变革也是实现智能座舱“iPhone时刻”的关键,需要更多应用企业的参与,共同推动行业的发展。
今天的自然语言交互还未能充分满足用户的期望,尤其是在不同驾驶场景中的表现。例如,车辆在不同的路况下、窗户的开启状态、车内人数等因素都会影响语音交互的准确性。
不同车型之间的差异也增加了语音交互系统适配的难度,这使得大规模的自然语言模型在汽车中的落地变得格外复杂。
汽车电子展了解到,大模型在车载环境中的部署涉及多条技术链路,包括前端声学、自动语音识别(ASR)、自然语言理解(NLU)和文本转语音(TTS)。
除了前端声学外,其他技术环节都需要大模型的引入进行改造,以提升交互的准确性和自然性,当前的工程实践还远未达到这一目标,因此大模型在车内的应用仍需克服一系列技术和工程挑战。
汽车电子展了解到,各方参与者,包括大模型企业、汽车制造商和传统Tier 1供应商,需协同合作,尤其是需要具有AI技术能力、汽车行业知识和互联网经验的专业玩家来引领变革。
斑马智行在制定AI座舱标准时,明确以特斯拉为对标,提出了相应的北极星指标。斑马网络的技术优势之一在于其多芯片适配能力,即能够支持不同性能的硬件系统。
在大模型的应用场景中,这一点尤为重要,因为不同的汽车制造商可能对某些功能有特定的需求,例如一些车企更加关注本地生活服务的集成,而另一些则侧重于工具控制和百科功能的提升。
而多芯片适配也带来了挑战。不同的芯片性能差异可能会影响大模型的表现,尤其是在语音交互和自然语言处理的复杂性上。因此,如何在多芯片环境中优化大模型的运行,成为斑马网络面临的重要技术难题。
蔡总特别提到,平台型的系统设计需要在满足多家车企需求的同时,保持系统的灵活性和稳定性,这对技术团队提出了很高的要求,同时这也是斑马的技术优势所在。
随着大模型技术的发展,斑马智行还倡导在智能座舱中实现去APP化的服务生态。这一理念的提出,旨在解决当前APP生态中存在的数量不足、使用频率低等问题,真正提升用户体验。
文章来源:芝能汽车--微信公众号