小米創(chuàng)辦人、董事長兼CEO雷軍宣布,小米團隊的多篇最新研究成果成功入選國際人工智能頂級會議ICLR 2026。ICLR由圖靈獎得主Yoshua Bengio和Yann LeCun于2013年創(chuàng)立,是深度學習領域最具權威性的學術會議之一。

本次入選的研究成果涵蓋多模態(tài)推理、強化學習、GUI Agent、端到端自動駕駛及音頻生成等前沿方向,共計11篇論文。在多模態(tài)推理領域,Shuffle-R1框架通過數(shù)據(jù)層面的動態(tài)重組顯著提升強化學習訓練效率,解決優(yōu)勢坍縮和軌跡沉默等長期難題;ThinkOmni框架則實現(xiàn)將文本推理能力零成本遷移至全模態(tài)場景。在GUI Agent方向,MobileIPL框架通過迭代偏好學習增強移動智能體的思考過程,在多個主流基準上取得SOTA成績;SMAN-Bench構建了跨系統(tǒng)、多維度的移動Agent評估基準,解決在線環(huán)境不穩(wěn)定與離線軌跡單一的評測難題。
自動駕駛相關研究占據(jù)重要比重。ReCogDrive提出融合視覺語言模型、擴散式軌跡規(guī)劃與強化學習的端到端自動駕駛框架;WorldSplat實現(xiàn)前向4D駕駛場景生成,解決3D一致性與新視角合成難題;Dream4Drive框架重新審視世界模型在感知任務中的應用價值,證明高質量合成數(shù)據(jù)而非數(shù)據(jù)規(guī)模是提升感知性能的關鍵。此外,F(xiàn)utureMind為小語言模型注入戰(zhàn)略性思維先驗,F(xiàn)low2GAN提出混合流匹配與GAN的音頻生成框架,DIPOLE算法實現(xiàn)穩(wěn)定可控的擴散策略優(yōu)化。

CONTACT US
ICC APP