
[CNMO科技音信]5月26日,小米汽车认真发布XiaomiAutoWorldModel全新框架,为业界扶持驾驶天下模子提供了新的框架旅途,鼓动行业从“场景感知”向“领路推演、场景进化”的高阶方法跃迁。

小米汽车
该框架是小米初度将三维重建与视频生成深度耦合的一体化架构,以“重建锚定几何、生成填补思象”的新范式,冲破行业遥远袭取的重建与生因素离的本领略线。在Waymo、nuScenes等主流基准测试中全面赢得SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大中枢场景完成业务落地。

CNMO科技堤防到,该框架将重建模块(WorldRec)与生成模块(WorldGen)深度耦合。WorldRec通过寥落三维锚点表征,高效构建精准的3D场景几何;WorldGen则在重建箝制下补全未不雅测区域和昔时帧,相沿最长1分钟的视频生成。两者彼此增益,杀青了高意见性、高一致性、高真正性的协同恶果。
在重建边界,WorldRec在公开的Waymo数据集上全面首先此前SOTA要道DGGT,PSNR达到28.48,超出约1个点;在nuScenes零样本泛化测试中已经保抓首先,B体育世界杯中国官网首页对新场景适合智商强。在生成边界,WorldGen在H20GPU上单视角生成速率达0.19秒/帧,三视角为0.46秒/帧,比同为自转头要道的Epona(1.06秒/帧)快5.6倍。相沿高达81帧衔接生成(10Hz/30Hz,最长1分钟),而大多量公开基线仅能生成8-16帧。在nuScenes数据集上,WorldGen赢得FVD64.97和FID7.04的获利,FVD目标卓绝了总共对比的同类模子。


值得一提的是,XiaomiAutoWorldModel已在小米汽车三大本体场景中落地:
沙巴体育app中国官网下载合成数据生成:已寄托朝上10万clips高质料合成数据,胜利用于感知模子锻真金不怕火,擢升车辆在危境场景下的识别智商。
仿真测试:构建闭环仿真环境,优化测试遵循,可在仿真中复现真正事故进行定向优化。
扶持驾驶学堂:应用天下模子动态生成第一东说念主称驾驶陶冶视频B体育世界杯中国官网首页,当今已上线小米全车型的扶持驾驶学堂-实景模拟场景。