歌曲Jingkuan:授权AI -Vanguardia多模型及其在汽车行
发布时间:2025-07-18 11:57
2025年中国汽车论坛于2025年7月10日至12日在上海齐亚丁举行。该论坛的主题是“提高新事物的质量并明智地获得未来”。它由15次会议和几项支持活动组成,其中包括“封闭的门峰会,会议论坛,技术负责人峰会,多个主题论坛,行业解放,访问该主题”。每个会议都侧重于汽车行业中的热门和重要问题,探索方向并带领未来。其中,“主题论坛8:智能和数字授权的“智能”检查:汽车测试将在7月12日上午加强行业的质量发展。 下一个内容是实时的语音转录。 早上好,我亲爱的领导者和客人!我很荣幸能被邀请参加中国的汽车论坛,与所有人分享和学习Empowerami subforumintelligent数学和“智能”检查。 他们e今天报道的是“汽车行业中大型多模式和应用的边界”。选择此主题有两个原因。首先,它尤其符合当今的亚福勒姆问题,从而明智地改善了汽车测试。同时,第二个原因是大型多模式模型是一个非常受欢迎的研究问题,并且在汽车领域中具有许多应用程序。目前,我们的领导者并说多模型应该是一个重要的发展方向。今天的报告来自两个方面: 首先是引入多模型及其前卫 - garde的进度。 第二个是在每个行业中实施特定的应用程序案例。 首先,什么是伟大的多模式模型?这是一个可以处理多种模态条目的AI模型,每种模态参考特定类型的数据,例如图像,视频,文本,音频等y感情数据。 redal在顶部整合多模式数据,可以实现与人类类似的多模式感知和认知。预计这将促进多个领域的计算机视觉的协调开发,例如语言处理。多模型模型从不可避免的发展趋势转变为现有状态。因此,大型大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型大型模态大型大型大型大型大型大型大型大型大型大型大型模式大型大型大型大型模式大型模式大型大型模式大型大型模式大型模式大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模态大型模式大型模式大型模式大型模式大型模态大型模态大型模态大型模态大型模态大型大型大型大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型大型大型模式大型模式大型模式大型模式大型模式大型模式大型大型大型大型大型模式大型模态大型模态大型模态大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型大型模式大型大型大型大型模式大型大型大型大型大型大型大型大型大型大型大型大型大型大型模式大型大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型模式大型大型大型grande grande-modal grande-grande-modal grande-modal grande-modal大型大型大型大型大型大型大型大型模式大型模式模态大型大型大型 为什么大型的多模式模型可以吸引行业如此广泛的关注?这是因为行业中有许多应用程序方案。以下是几个列表,例如Med-Gemini,可用于改善您的医学诊断。面部模型可以通过数字人类形式改善人类计算机的交互。 Pangu Big Model可以改善工业服务,而Zidong Taichu Big Model可以授权法律,并且可以每天在金融服务方案中使用。因此,可以说,大型多模型模型允许数千个行业的智能授权。 有那么多的模式模型?我们已经列出了多模型模型的完整技术,景观图包含三个部分,最左边是中央技术和正确的应用程序。数据包括几种模式包括数据收集。当然,数据之间的相关性非常重要。也有中央技术层和以下优化算法上方的模态体系结构:因此,模态体系结构是一个很好的模型方面。当前体系结构根据几个剪接剪接相对固化。如何使用数据和体系结构学习参数?优化算法可以应用于多个迭代,例如初始比较学习,从当前的子区域到随后的掩码形式和参数,最终可以应用于各种埃斯卡纳群岛,例如多模态对话,跨模式生成和后面讨论的智能场景。这是一个一般的全景。 为什么研究领域吸引了这么多关注?之所以如此重要的原因之一是,大型多模型模型是实现共同人工智能的唯一方法。众所周知,人工智能通常是计算机纪律的梦想。要执行通用人工智能,必须感知和重新将世界认识为人类,例如听力,触摸和视野。这些数据自然是多模式形式的。要执行通用人工智能,研究大型多模式模型至关重要。它还经历了一系列开发过程。在早期阶段的每种模态的独立发展中,每个人都可能听说过先前的自然语言处理。独立的计算机VisionRolla,自然语言处理仅管理翻译和对话任务。计算机视觉独立地发展了对细分和其他任务的认可。既然已经创建了大型的多模式模型,我们将整合并开发多种方式。现在,新趋势是整合和整合更多的多模式模型,并整合理解和生成任务。因此,将来,如果您想进一步发展,则必须将其与物理世界相结合,探索和研究世界模型,研究化身的智力以及Ultimately,实现通用人工智能的最终目标。 这是大型多模式模型的开发趋势列表。通常,从基于任务的传统方法并在当前任务单元中得到了预先确定的方法,我们提出了三种向EEE转变的趋势,即推理和相互作用的NES的改善。 没有人熟悉这项任务。一个任务有两个定义:第一个是一个非常狭窄的定义。自然语言处理中的翻译是一项任务,并且识别计算机视觉是一项任务。在最初的几天中,不同方式之间的任务被高度分散。在最初的几天中,任务并不统一。在多模型模型之后,它可以集体处理自然语言,文本和图像。这是相对统一的,但是这两个任务之间存在分离。一个是一项全面的任务,另一个是生成的任务。理解是该图像的哪些类别和内容提供图像。这是联合国讨论。几代人会收到一段。图像和视频是通过此段落生成的。直观地认为这两个是非常不同的任务。因此,以前将多模型模型作为两个独立的分支进行了研究,并且结果逐渐整合了这两个任务,以实现更高水平的任务。这是第一个趋势。 其次,推理得到加强。以前的伟大模型通常处于他们提供信息并做出回应的阶段。复杂的场景是复杂方案的非常糟糕的问题,结合了图形和推理,以及插图的几何问题。因此,新的研究不仅可以给出这个答案,还可以在答案中间给出一个推理过程。这就是所谓的推理加强。 DeepSeek取得巨大成功的关键原因是,当今已知的推理是第二个趋势,因为它引入了关键学习过程。 第三趋势是主动相互作用。人工智能阿吉将军说,这是智力的最后梦想。如果您想实现智能加一般的人工,它必须与物理世界互动。因此,大型多模型必须能够在复杂的环境中进行交互,并在人类等现实世界中执行独立的行为和决策能力。这是当前发展的第三个趋势。一个典型的任务是人们现在经常听到的出色智能任务。 我们的团队也是一个庞大的多模式,我们进行了一些与模型指导有关的研究工作。刚刚提出的一件事是理解。第二个是一代,第三是安全性。首先,我们了解该领域,主要关注这些方面。 首先是关注人类的视觉分析。一般模型着重于一般场景,并且更关心诸如原始的任务普罗米斯式,人类位置的估计和人类不同部分的识别。 生成了第二个场景的图表。如果您需要聪明和结构化,那么您必须具有非常重要的技术和媒体方法来生成场景图表。非常复杂的多模式数据必须成为三重Tupla场景图形,其中关键字和名词相互关联并有效地管理和理解。 第三个方向是改善一般的多模式模型。我们不会引入任何特定的算法。 第二个研究地址是生成这项工作。我们团队的工作被要求生成某些可以生成图像,视频和3D的条目。以下是团队所做的工作。所有人都非常了解AIGC。稍后将有一些特定的场景(屏幕)。相关工作已被省略。例如,有一些故事,照片,文字等。第三个方向使AI具有学习和确定的能力。例如,t这是几乎没有持续学习,抽样和安全学习。一项安全而有趣的工作是幻觉。您可能听说过一个没有胡说八道的伟大模型。左侧的图像显示了一条红色的狗,而狗不是红色的。这是一个幻想。我们基于此提供了相应的解决方案。这有效地减少了大型模型中的幻觉。 这些成就包括几种相关的应用程序方案。 1。构建跨域推荐系统时,可以在支撑件方案中使用,并向用户推荐高质量的产品。本质上,它使用多模式数据,例如用户信息和历史导航记录,从而使产品和建议更好地巧合。 2。超过130亿人的米利耶(Mileye)是Gran行业规模的模型。这主要是建立大型行业模型,因为很难与大型制造商竞争建立通用模型。它已用于相关场景,例如检查Of电力,工业检查和其他相关方案,在12台参考测试机中实现了主要大型模型的最大可靠性。 3。当前有许多大型模型的本地化实现。在应用智能法律平台时,要求是建立六个方案:文件助理,法律助理和关键决策支持。启动后,我们的商业处理效率得到了显着提高,也被选为监督法律法规和国家资产管理委员会的第一个大型模型的参考点。这是Rea Scenariol。 接下来,我们提出了汽车行业的多模式模型,这是人工智能的更广泛的应用程序。 福特CIO说:“人工智能不仅对于智能驾驶非常重要,而且在改变员工体验中起着越来越重要的作用。”也有应用程序识别风险链和对车辆的预测维护的ONS,这当然只是众多应用程序之一。沃尔沃的CIO建议“人工智能不仅可用于人工传导,而且还用于其他各个方面,例如制造和销售汽车,创造新客户和体验。”这表明人工智能在汽车行业中引起了人们的关注。 在这里,我们简要描述了汽车行业人工智能的应用程序方案,尤其是在汽车测试行业。我是一个陌生人。总结一下,我不是非常不可或缺的。批评并纠正包含以下四种情况的不准确区域: 1。智能方案和安全测试的生成。以下报告还包括与此相关的生成人工智能: 2。预测维护和健康管理。 3。选择的交付汽车互联网。最终报告是关于车辆和智能驾驶的驾驶。 4。虚拟测试和数字双胞胎。让我们以下面的顺序为顺序。 首先,由AI促进的自主自主安全测试系统。汽车汽车安全测试并自动使用自动学习和仿真技术自动执行车辆的安全性。从本质上讲,我在AIGC一代中消除了更多的测试用例,从而提高了测试的效率。与传统的测试覆盖率相比,这是一种有利可图,危险且不足的测试覆盖率。通过AIGC,它可以提高效率,降低成本,增加测试案例的覆盖范围,并且没有物理风险。一个典型的例子是D2RL使用智能增强学习测试。现有数据是非关键数据,非关键数据是正常的。没有重要的事件导致事故。这个问题的核心思想是识别和消除很多否n-临界数据,以便模型可以从关键的安全事件中学习。这是对重要事件定义一组危险场景的重要事件的如此称呼的定义。例如,可以通过强化学习自动识别和定义多个代理维度方案,ithus将模型学习的效率铺平,并最终改善模型的性能。这是对人工智能促进的场景案例的自动认可。 第二个AIGC用于检测到这一点。维护模式从被动维修到主动的早期警报,预测性分析和通过AI驱动。当风险发生时,传统方法可以进行测试。这有一系列问题,包括高成本,缺乏预测,并且取决于经验。 AI的首次警告通过精确的预测提高了可靠性。这是一个具体示例。主动的早期警告最终通过多变量传感器数据进行。它的先前输入和文本主要是汽车行业的相关数据,例如曲轴的速度,速率的振动和早期警报是通过大型多模式模型(例如故障,组件寿命预测)进行的。 第三种情况是边界的情报。一个非常典型的应用程序是智能驾驶。人工智能和物联网的结合允许人工智能执行边缘处理。五种连接的事物可以提高您的数据收集功能。通过组合这两个,消除了网络的依赖性并允许在边缘处理,从而允许响应越来越快。与传统云相比,存在诸如治疗后稳定性较低的问题。使用边缘添加物联网时,请避免一组问题。现在提到的典型应用程序是智能驾驶。智能边缘Pro车辆的限制能力和互联网使车辆具有低潜伏期的决策能力。车辆互联网可以提供更广泛的自行车认可领域。两者的组合为安全有效的自动传导创造了技术基础。 第四个正在加强虚拟世界。模拟和数字双胞胎用于汽车。借助数字双技术,您可以创建高忠诚度虚拟模型的车辆,并可以快速重复。传统方法有一系列问题,包括高成本,有限的测试场景和随后的风险组件。模拟和数字双胞胎可以解决相应的问题。 典型的情况是基于数字双胞胎的智能电池管理系统。通过数字双胞胎创建虚拟电池模型,并使用与大型模型相关的Multim Technologiesdales来确切监控电池生命周期,健康预测和智能骗局trol,从而提高电动汽车的安全性和阻力。 以上是今天报告的主要内容,非常感谢! 官方NINA Finance帐户 24-最新信息和财务视频的流离失所,以及扫描QR码以关注更多粉丝(Sinafinance)