一级AV黄色片|好看的国产免费观看网站|国产毛片在线看|国产欧美日产久久|久碰

您的位置:裝備>新產(chǎn)品
新產(chǎn)品

入選ICCV2023 單目3D檢測(cè)論文成果應(yīng)用于無(wú)人駕駛水平運(yùn)輸

2023-08-29 14:34  來(lái)源:飛步科技


近日,飛步科技與浙江大學(xué)等合作的論文《MonoNeRD: NeRF-like Representations for Monocular 3D Object Detection》被ICCV接收。ICCV全稱為計(jì)算機(jī)視覺國(guó)際大會(huì)(International Conference on Computer Vision),由IEEE舉辦,是全球范圍內(nèi)計(jì)算機(jī)視覺領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議。ICCV2023共收到全球范圍內(nèi)8068篇投稿,最終收錄2160篇,接受率為26.8%。

單目3D檢測(cè)指的是通過單個(gè)攝像頭來(lái)實(shí)現(xiàn)3D目標(biāo)檢測(cè)的辦法。作為計(jì)算機(jī)視覺領(lǐng)域內(nèi)的熱門任務(wù),單目3D檢測(cè)已被廣泛應(yīng)用于自動(dòng)駕駛、機(jī)器人等方向。單目3D檢測(cè)的核心在于建立二維圖像和三維空間之間合理的對(duì)應(yīng)關(guān)系,因此利用場(chǎng)景幾何線索來(lái)提高單目檢測(cè)器的性能是十分常見的做法。然而,許多現(xiàn)有方法顯式地利用了這些線索,例如通過估計(jì)深度圖并將其反投影到三維空間中——由于從二維到三維的維度增加,這類顯式的方法會(huì)導(dǎo)致三維表示的稀疏性,從而引發(fā)大量的信息丟失,尤其是對(duì)于遠(yuǎn)處及遮擋物體等。

為了解決這個(gè)問題,論文提出了一種新穎的單目3D檢測(cè)框架:MonoNeRD,僅需輸入單張圖片,就可以通過稠密的三維幾何信息與占用(Occupancy)情況來(lái)推斷目標(biāo)在三維空間中的位置,從而極大地提高單目3D檢測(cè)的精度。

具體來(lái)說,MonoNeRD使用有符號(hào)距離函數(shù)(SDF)來(lái)對(duì)場(chǎng)景進(jìn)行建模,以便產(chǎn)生稠密的三維表示,并將這些三維表示視為神經(jīng)輻射場(chǎng)(NeRF),利用體渲染從中恢復(fù)出RGB圖像和像素級(jí)別的深度圖。論文提出了基于空間位置信息的position-aware frustum construction來(lái)實(shí)現(xiàn)三維空間和二維圖像信息的交互。在此基礎(chǔ)上,基于NeRF中渲染重建的特點(diǎn)提出了SDF loss,通過LiDAR信號(hào)來(lái)控制三維幾何表面滿足有符號(hào)距離函數(shù)的零水平集(zero-level set)約束。

除了開展單目3D檢測(cè)并大幅提升效率外,論文提出的方法還可以作為一個(gè)高效三維占用(3D occupancy)推斷器。相較于以往的三維占用預(yù)測(cè)方法,MonoNeRD無(wú)需使用特別標(biāo)注的三維占用數(shù)據(jù)集進(jìn)行訓(xùn)練。在KITTI 3D、Waymo Open Dataset等具有代表性的三維目標(biāo)檢測(cè)公開數(shù)據(jù)集上的實(shí)驗(yàn)表明,與現(xiàn)有的基于顯示幾何線索的單目3D檢測(cè)算法相比,MonoNeRD的表現(xiàn)更加優(yōu)越,在Waymo Open Dataset上的總體3D平均精度/朝向加權(quán)平均精度(3D mAP/mAPH)提升5-10個(gè)點(diǎn)。

MonoNeRD等成果已應(yīng)用于飛步科技自主研發(fā)的無(wú)人駕駛水平運(yùn)輸系統(tǒng)(FabuDrive)中,融入深度學(xué)習(xí)模型的日常訓(xùn)練,大幅提升了單目3D檢測(cè)效率,對(duì)于倒地水馬等不規(guī)則物體的識(shí)別也表現(xiàn)優(yōu)異,為全天候開展全無(wú)人集卡常態(tài)化運(yùn)營(yíng)奠定了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。

[上一篇]    [下一篇]
    暫無(wú)記錄