上海2022年12月21日 /美通社/ -- 在人工智能領(lǐng)域,數(shù)據(jù)的重要程度正在迅速提升。
根據(jù)ML大牛吳恩達(dá)提出的著名二八定律:80%數(shù)據(jù)+20%模型=更好的AI。他認(rèn)為,一個(gè)機(jī)器學(xué)習(xí)團(tuán)隊(duì)80%的工作應(yīng)該放在數(shù)據(jù)準(zhǔn)備上,確保數(shù)據(jù)質(zhì)量是最重要的工作。如果更多地強(qiáng)調(diào)以數(shù)據(jù)為中心而不是以模型為中心,那么機(jī)器學(xué)習(xí)的發(fā)展會(huì)更快。
而隨著中國自動(dòng)駕駛產(chǎn)業(yè)商業(yè)化落地的高速推進(jìn),市場(chǎng)對(duì)于數(shù)據(jù)的需求也正在呈現(xiàn)急速上升的趨勢(shì)。根據(jù)公開數(shù)據(jù),預(yù)計(jì)至2030年,中國運(yùn)營的自動(dòng)駕駛車輛將達(dá)3000萬輛,或?qū)⒊蔀槿蜃畲蟮淖詣?dòng)駕駛市場(chǎng)。
總體來看,整個(gè)自動(dòng)駕駛正處于L2級(jí)自動(dòng)駕駛向L3級(jí)發(fā)展的階段,場(chǎng)景越來越復(fù)雜的同時(shí),也帶來了對(duì)于3D等更高維度、更高質(zhì)量數(shù)據(jù)的巨大需求。而另一方面,自動(dòng)駕駛?cè)a(chǎn)業(yè)鏈的企業(yè)數(shù)量正在飛速擴(kuò)展,包括傳統(tǒng)車企、車企相關(guān)互聯(lián)網(wǎng)公司、跨界互聯(lián)網(wǎng)公司、新型自動(dòng)駕駛相關(guān)公司等在內(nèi)的企業(yè),也讓我們看到了更大的數(shù)據(jù)需求。
自動(dòng)駕駛數(shù)據(jù)的重要程度正在持續(xù)上升
如果說智能化1.0階段,車企拼的是技術(shù)的快速落地和高階能力的標(biāo)桿效應(yīng),那么2.0階段就是拼規(guī)?;钶d。
根據(jù)高工智能汽車研究院發(fā)布的《2023-2025年智能網(wǎng)聯(lián)產(chǎn)業(yè)趨勢(shì)報(bào)告》顯示,今年1-10月,前向ADAS(L2含NOA)同比上年增長67.11%。NOA(導(dǎo)航輔助駕駛)同比上年增長116.25%。
當(dāng)前,軟件和數(shù)據(jù)已成為智能汽車的核心增量。在很多業(yè)內(nèi)人士看來,打造一套可用的智能駕駛系統(tǒng)并不難,但開發(fā)和維護(hù)可擴(kuò)展和可靠的完整數(shù)據(jù)驅(qū)動(dòng)解決方案才是真正面臨的挑戰(zhàn)。這意味著,智能駕駛系統(tǒng)真正實(shí)現(xiàn)基于數(shù)據(jù)+軟件定義的全新模式。
眾所周知,數(shù)據(jù)貫穿了整個(gè)AI的生命周期,從數(shù)據(jù)獲取,數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和部署、再到人工模型評(píng)估??梢钥吹剑谥袊袌?chǎng),數(shù)據(jù)服務(wù)的價(jià)值也已然明朗。
高工智能汽車研究院預(yù)計(jì),接下來兩三年仍是攝像頭上車的市場(chǎng)紅利期,預(yù)計(jì)到2025年中國市場(chǎng)單車搭載攝像頭將提升至7-8顆。同時(shí)前向雙目、三目,周視等更多攝像頭配置成為主流,基于數(shù)據(jù)認(rèn)知的訓(xùn)練也成為剛需。
另一方面,4D毫米波雷達(dá)以及激光雷達(dá)的搭載也正處于最關(guān)鍵的導(dǎo)入期,這帶來了一個(gè)全新的市場(chǎng):多傳感器感知的數(shù)據(jù)融合。此外,艙內(nèi)人機(jī)交互的體驗(yàn)升級(jí),也同樣需要數(shù)據(jù)迭代支持。這也再次表明,無論是在自動(dòng)駕駛還是輔助駕駛領(lǐng)域,數(shù)據(jù)標(biāo)注的需求量都將迎來增長的高峰期。
自動(dòng)駕駛數(shù)據(jù)標(biāo)注當(dāng)前面臨的難點(diǎn)
作為產(chǎn)業(yè)鏈的重要一環(huán),澳鵬Appen同樣深刻感受到自動(dòng)駕駛市場(chǎng)需求的火熱:尤其在今年,自動(dòng)駕駛的數(shù)據(jù)標(biāo)注需求更是呈現(xiàn)爆發(fā)式增長。
2020年澳鵬Appen(中國)做到4.7m美金的營收,2021年是24.7m美金,實(shí)現(xiàn)了421%的增長;2021年上半年141%增長大部分是來自自動(dòng)駕駛,目前自動(dòng)駕駛占總業(yè)務(wù)量60%以上,澳鵬Appen(中國)一半以上的客戶來自自動(dòng)駕駛。
然而,隨著業(yè)界對(duì)于數(shù)據(jù)標(biāo)注需求量的爆發(fā),過去簡(jiǎn)單粗暴的“人力堆疊”已無法滿足當(dāng)前對(duì)于“高質(zhì)高量”數(shù)據(jù)供不應(yīng)求的行業(yè)痛點(diǎn)。
要知道,在自動(dòng)駕駛領(lǐng)域,數(shù)據(jù)標(biāo)注幾乎沒有出錯(cuò)的余地,也不容缺少關(guān)鍵用例。這就導(dǎo)致自動(dòng)駕駛汽車的數(shù)據(jù)采集和標(biāo)注是非常耗時(shí)的資源密集型過程。同時(shí)這也是為什么一直以來自動(dòng)駕駛企業(yè)會(huì)面臨上市時(shí)間延遲、產(chǎn)品性能堪憂以及推廣困難等問題。
澳鵬Appen(中國)產(chǎn)品及研發(fā)總監(jiān)錢程表示,伴隨L3級(jí)自動(dòng)駕駛的進(jìn)階升級(jí),自動(dòng)駕駛廠商對(duì)艙外數(shù)據(jù)服務(wù)的需求與日俱增,其中既包括數(shù)據(jù)需求量的增長,也有更復(fù)雜的數(shù)據(jù)類型的變化。行業(yè)對(duì)于激光雷達(dá)3D點(diǎn)云數(shù)據(jù)的大量需求,也讓數(shù)據(jù)標(biāo)注的工作變得更為復(fù)雜,數(shù)據(jù)成本急劇上升。
而對(duì)于下游企業(yè)而言,如何低成本獲取高質(zhì)量數(shù)據(jù)就成了他們?cè)谶@個(gè)時(shí)代的剛需。
澳鵬Appen(中國)產(chǎn)品及研發(fā)總監(jiān)錢程認(rèn)為,自動(dòng)駕駛數(shù)據(jù)標(biāo)注當(dāng)前的技術(shù)主要面臨以下難點(diǎn):
1:隨著自動(dòng)駕駛市場(chǎng)的爆發(fā)式增長,總體數(shù)據(jù)量增大使得平臺(tái)業(yè)務(wù)吞吐量增大,這對(duì)于工作流的數(shù)據(jù)流轉(zhuǎn)效率、穩(wěn)定性提出了更高要求;
2:采集到的數(shù)據(jù)精度提高、數(shù)據(jù)稠密度的提升,導(dǎo)致需要處理的單條數(shù)據(jù)變大,標(biāo)注員設(shè)備可能比較低端,需要加大力度在研發(fā)上支持工具在各種高低端設(shè)備上的正常使用;
3:采集設(shè)備越來越多樣化和復(fù)雜,使得數(shù)據(jù)類型增多,產(chǎn)生包括4D傳感器數(shù)據(jù)等多傳感器數(shù)據(jù)融合標(biāo)注的需求;
4:數(shù)據(jù)成本和企業(yè)降本增效的需求,對(duì)標(biāo)注效率和管理能力的要求越來越高,需要不斷打磨和優(yōu)化工具功能以及項(xiàng)目管理功能;
5:隨著自動(dòng)駕駛商業(yè)化落地進(jìn)程的加快,客戶需求也越來越細(xì)化和多變,需要加大投入模型輔助標(biāo)注的研發(fā)并針對(duì)不同項(xiàng)目進(jìn)行定制化的模型開發(fā)。
可以看到,為了解決以上難點(diǎn),數(shù)據(jù)服務(wù)企業(yè)采用的數(shù)據(jù)標(biāo)注技術(shù)已然從最早的單機(jī)標(biāo)注工具演進(jìn)為數(shù)據(jù)標(biāo)注平臺(tái),繼而升級(jí)為現(xiàn)階段的智能數(shù)據(jù)標(biāo)注平臺(tái)/企業(yè)級(jí)AI數(shù)據(jù)標(biāo)注平臺(tái)。
目前,行業(yè)已涌現(xiàn)出多家較為優(yōu)質(zhì)的“平臺(tái)”。然而如果論經(jīng)驗(yàn)與深厚積淀的話,澳鵬Appen則當(dāng)屬其中的第一梯隊(duì)。
澳鵬Appen(中國)三年的飛速增長
作為一家成立于1996年的元老級(jí)AI訓(xùn)練數(shù)據(jù)服務(wù)企業(yè),澳鵬Appen早已在智能駕駛的春風(fēng)吹拂過神州大地之前,就將服務(wù)遍布于170個(gè)國家和70,000個(gè)地區(qū)中。
2019年,中國的智能駕駛行業(yè)進(jìn)入了如火如荼的發(fā)展階段。而彼時(shí)的澳鵬Appen早已擁有了全球AI數(shù)據(jù)服務(wù)細(xì)分領(lǐng)域行業(yè)第一的光環(huán)。同年10月,澳鵬Appen帶著不足10人的原始團(tuán)隊(duì)來到中國市場(chǎng)。憑借20余年的深厚技術(shù)積淀,這支白手起家的團(tuán)隊(duì)僅歷經(jīng)短短3年時(shí)間,便完成了從“0”到“行業(yè)TOP1”的閃電般飛躍。
據(jù)2022年公開數(shù)據(jù)顯示,澳鵬中國在專注于人工智能數(shù)據(jù)服務(wù)商中營收排名第一。在疫情肆虐的2021年依然實(shí)現(xiàn)了財(cái)年?duì)I收421%的爆炸性增長。
三年以來,澳鵬中國通過高質(zhì)量、高效率的數(shù)據(jù)服務(wù)在自動(dòng)駕駛領(lǐng)域積累了具有相當(dāng)規(guī)模的客戶群體,其中包括知名互聯(lián)網(wǎng)企業(yè)、新勢(shì)力造車、整車廠的創(chuàng)新研發(fā)部門等。究其緣由,技術(shù)、服務(wù)、資質(zhì)、經(jīng)驗(yàn)缺一不可。
澳鵬Appen深諳,企業(yè)需要一套成熟的技術(shù)體系,如無縫的接口開發(fā)/API對(duì)接等。由此,澳鵬中國借鑒全球經(jīng)驗(yàn)自主研發(fā)的MatrixGo高精度AI數(shù)據(jù)標(biāo)注平臺(tái),專門面向企業(yè)本地部署環(huán)境,幫助CIO們以高度自動(dòng)化、標(biāo)準(zhǔn)化和規(guī)?;绞浇I標(biāo)注數(shù)據(jù)供應(yīng)鏈。
該平臺(tái)可支持像素級(jí)語義分割、2D圖像復(fù)合標(biāo)注、3D點(diǎn)云拉框及語義分割等功能;同時(shí)采標(biāo)一體的任務(wù)能夠?qū)崿F(xiàn)采集-質(zhì)檢-標(biāo)注-質(zhì)檢-客戶驗(yàn)收的雙向協(xié)同流程,讓整個(gè)數(shù)據(jù)生產(chǎn)線上的各個(gè)環(huán)節(jié)實(shí)現(xiàn)無縫銜接;內(nèi)置的多輪質(zhì)檢模塊可以按需配置,滿足不同復(fù)雜度項(xiàng)目的需求;2D圖像復(fù)合標(biāo)注是全結(jié)構(gòu)化的模型訓(xùn)練利器,支持點(diǎn)、線、框、多邊型融合標(biāo)注(常見工具是單模式的,點(diǎn)、線or折線,多邊形)與連續(xù)幀;
總體上,其標(biāo)注工具可實(shí)現(xiàn)99.9%的準(zhǔn)確率,并達(dá)到5分鐘一張、1秒一幀極速質(zhì)檢,在交互、超大數(shù)據(jù)加載、實(shí)時(shí)切幀進(jìn)行渲染等方面都達(dá)到了行業(yè)第一。根據(jù)案例顯示,可助力客戶提升3倍效率的成功部署速度。
值得一提的是,在今年,其在自動(dòng)駕駛領(lǐng)域的模型輔助標(biāo)注(自動(dòng)化標(biāo)注)進(jìn)一步取得了技術(shù)進(jìn)展,如交互式語義分割、信號(hào)燈預(yù)標(biāo)注、停車位自動(dòng)識(shí)別等,經(jīng)過不斷迭代優(yōu)化,大部分工具可使標(biāo)注效率提升30%-50%。
目前,點(diǎn)云檢測(cè)、2D障礙物檢測(cè)等工具也在計(jì)劃上線中,且平臺(tái)版本平均每兩周就會(huì)做一次迭代更新。
在服務(wù)方面,公司擁有專業(yè)的評(píng)估和項(xiàng)目團(tuán)隊(duì)全程跟進(jìn)試標(biāo)、采集、標(biāo)注、質(zhì)檢、驗(yàn)收和交付流程。在自動(dòng)駕駛領(lǐng)域,澳鵬中國單月的巔峰產(chǎn)值可達(dá)600萬人民幣以上,資源數(shù)目可達(dá)2000人以上。
同時(shí),公司具備快速、低成本召集資源并靈活交付的能力:其在全球擁有超過100萬名技能嫻熟的眾包資源,支持235+種語言和方言,遍布170+個(gè)國家和70,000個(gè)地區(qū)。澳鵬(中國)總部位于上海,在無錫、大連、重慶均設(shè)有大型交付中心。
目前,澳鵬(中國)擁有超過千余名全職員工、1000+BPO資源、數(shù)萬名高質(zhì)量的本土眾包人員并持續(xù)擴(kuò)張中。澳鵬Appen可以提供一套專業(yè)的項(xiàng)目管理方法論,尤其是在自動(dòng)駕駛領(lǐng)域積累的大量實(shí)戰(zhàn)經(jīng)驗(yàn),幫助企業(yè)在項(xiàng)目部署中快速應(yīng)對(duì)如數(shù)據(jù)規(guī)則的對(duì)齊、數(shù)據(jù)波動(dòng)、人員穩(wěn)定性等問題。
在數(shù)據(jù)安全方面,澳鵬Appen始終助力智能時(shí)代安全保障體系的構(gòu)建,始終致力于為客戶提供最高級(jí)別的管理標(biāo)準(zhǔn):
目前,澳鵬中國已獲ISO 27001, ISO 9001和ISO 27701認(rèn)證,在信息安全管理、質(zhì)量管控和數(shù)據(jù)隱私保護(hù)方面達(dá)到受國際認(rèn)可的“黃金標(biāo)準(zhǔn)”。全球范圍內(nèi),澳鵬Appen亦通過GDPR,SOC 2 Type II,HIPAA等全球不同國家和地區(qū)的數(shù)據(jù)安全合規(guī)認(rèn)證,確保數(shù)據(jù)來源和渠道正規(guī)、安全、合法。
此外,其自主研發(fā)的人工智能輔助數(shù)據(jù)標(biāo)注平臺(tái)MatrixGo也具有權(quán)限管控、數(shù)據(jù)加密傳輸、PII信息加密存儲(chǔ)等嚴(yán)格的數(shù)據(jù)安全管控策略,并專門設(shè)有DPO進(jìn)行數(shù)據(jù)安全管理,最大限度地保證客戶的數(shù)據(jù)資產(chǎn)安全。澳鵬Appen高水平的數(shù)據(jù)管理平臺(tái),數(shù)據(jù)通過阿里云存儲(chǔ),也可以做到在客戶的平臺(tái)上進(jìn)行私有化部署。
在經(jīng)驗(yàn)方面,針對(duì)自動(dòng)駕駛諸多特有的數(shù)據(jù)類型和難點(diǎn),澳鵬Appen配備了具備相關(guān)經(jīng)驗(yàn)和知識(shí)的專業(yè)人才。例如,澳鵬中國產(chǎn)研團(tuán)隊(duì)配備專門的算法人員負(fù)責(zé)自動(dòng)駕駛等領(lǐng)域的算法研發(fā),能夠更好地理解自動(dòng)駕駛客戶的技術(shù)需求。
作為自動(dòng)駕駛汽車的“燃料”,一個(gè)合格的數(shù)據(jù)合作伙伴提供的高質(zhì)量數(shù)據(jù)能夠幫助企業(yè)在自動(dòng)駕駛領(lǐng)域乃至整個(gè)汽車行業(yè)占得先機(jī)?!拔覀冎铝τ趲椭髽I(yè)完成全球最具創(chuàng)新性的自動(dòng)駕駛汽車項(xiàng)目?!?澳鵬Appen(中國)產(chǎn)品及研發(fā)總監(jiān)錢程表示。