omniture

澳鵬Appen:自動(dòng)駕駛浪潮下,如何給技術(shù)迭代插上數(shù)據(jù)的“翅膀”?

上海2021年12月22日 /美通社/ -- 微信公眾號(hào)“高工智能汽車”最近對(duì)澳鵬Appen進(jìn)行了報(bào)道,下面是報(bào)道原文:

在自動(dòng)駕駛時(shí)代,無論是對(duì)于汽車制造商、零部件廠商還是自動(dòng)駕駛服務(wù)提供商來說,數(shù)據(jù)都相當(dāng)于金錢,身處其中的企業(yè)都非常清楚這個(gè)公式。

去年,滴滴出行與比亞迪合作,推出全球首款定制網(wǎng)約車。該公司CEO程維表示,滴滴計(jì)劃于2025年推出D3,普及100萬輛搭載自動(dòng)駕駛功能網(wǎng)約車;2030年希望去掉駕駛艙,計(jì)劃實(shí)現(xiàn)完全自動(dòng)駕駛。

今年初,百度和吉利宣布合資成立一家全新的聯(lián)網(wǎng)智能汽車公司,基于后者的開放動(dòng)力底盤平臺(tái),結(jié)合百度的人工智能、Apollo自動(dòng)駕駛、小度車載、百度地圖等軟件,目標(biāo)是讓所有人都能使用自動(dòng)駕駛汽車。

按照這家合資公司(集度汽車)首席執(zhí)行官夏一平的話說,公司打算以合理的成本向千家萬戶提供4級(jí)自動(dòng)駕駛技術(shù),“就像別人希望普及電動(dòng)汽車一樣,我們也希望普及自動(dòng)駕駛技術(shù)?!?/p>

而這些企業(yè),不管以何種方式入局“造車”,目的只有一個(gè),希望打造自己的大規(guī)模數(shù)據(jù)訓(xùn)練、功能迭代閉環(huán)。

正如行業(yè)領(lǐng)頭羊特斯拉的玩法一樣,在量產(chǎn)中結(jié)合車端的智能處理能力識(shí)別出不智能的場景,將數(shù)據(jù)回傳,以此迭代算法,不斷提高自動(dòng)駕駛的能力,逐步構(gòu)建自己的車輛規(guī)模和技術(shù)壁壘。

另一方面,對(duì)于確保自動(dòng)駕駛行車安全運(yùn)行方面,高質(zhì)量的訓(xùn)練數(shù)據(jù)極其關(guān)鍵。這就要求行業(yè)加強(qiáng)審核,避免“garbage in, garbage out”的情況發(fā)生。

這就要求,負(fù)責(zé)訓(xùn)練模型的團(tuán)隊(duì)不僅要面對(duì)自身專業(yè)度的挑戰(zhàn),而且要面對(duì)確保數(shù)據(jù)標(biāo)注過程質(zhì)量的巨大挑戰(zhàn)。

在這方面,澳鵬可以說是當(dāng)之無愧的模范生。

破解市場困局

相關(guān)研究發(fā)現(xiàn),在AI行業(yè)中,有兩個(gè)層面符合二八法則。

首先,同一個(gè)算法的應(yīng)用中,同樣類型技術(shù)方案的公司差異會(huì)很大。其中的關(guān)鍵就在于數(shù)據(jù)量。同一個(gè)算法對(duì)于最后結(jié)果的影響,80%來源于數(shù)據(jù),20%來源于技術(shù)。

簡單來說,算法模型本身的優(yōu)化對(duì)于提升AI應(yīng)用輸出的準(zhǔn)確率十分有限,而不同AI應(yīng)用準(zhǔn)確率的關(guān)鍵差別在于其中是否有大量的、高質(zhì)量的訓(xùn)練數(shù)據(jù)。

其次,很多AI或算法公司在做研發(fā)時(shí),80%的時(shí)間或人力需要用于處理數(shù)據(jù),只有20%用于處理算法與代碼。而實(shí)際上,這種做法并不合理。要想精進(jìn)整體系統(tǒng)的魯棒性,工程師應(yīng)該將更多的精力集中于算法或應(yīng)用層面,而針對(duì)數(shù)據(jù)層面,則可以讓更專業(yè)的供應(yīng)商幫助他們提升質(zhì)量和效率。

另一方面,目前人工智能研究應(yīng)用的算法,基本基于機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法,實(shí)戰(zhàn)中對(duì)訓(xùn)練數(shù)據(jù)的準(zhǔn)確率要求起碼要到達(dá)90%以上,甚至有的項(xiàng)目要求能夠做到99.9%準(zhǔn)確率。而更難的地方在于,這不僅是對(duì)某一批數(shù)據(jù)的要求,而是要持續(xù)達(dá)到這個(gè)要求。

有行業(yè)人員表示,自動(dòng)駕駛領(lǐng)域的AI部署需要大量的高質(zhì)量訓(xùn)練數(shù)據(jù),需求增長極快,且需求和場景越來越多樣、難度越來越大。隨業(yè)內(nèi)需求從2D平面圖像轉(zhuǎn)向3D LiDAR數(shù)據(jù)為主,行業(yè)對(duì)于標(biāo)注人員專業(yè)度的要求也隨之水漲船高。

而標(biāo)注人員在完成這些數(shù)據(jù)任務(wù)時(shí),可能面臨諸多挑戰(zhàn),其中包括:內(nèi)部標(biāo)注人員不足和引入的偏差問題、時(shí)間限制下難以達(dá)到所需的數(shù)量規(guī)模及準(zhǔn)確率。

此外,當(dāng)前數(shù)據(jù)行業(yè)各個(gè)服務(wù)商的水平參差不齊,優(yōu)質(zhì)頭部數(shù)據(jù)服務(wù)商的服務(wù)資源稀缺,CR5的集中只有20~30%。業(yè)內(nèi)也普遍缺乏進(jìn)行復(fù)雜標(biāo)注項(xiàng)目所需的專業(yè)工具。這無疑為數(shù)據(jù)質(zhì)量帶來了更多挑戰(zhàn)。

“這也是澳鵬本身創(chuàng)立的初衷?!卑涅iAppen中國區(qū)市場拓展高級(jí)總監(jiān) 董成表示。

作為澳大利亞的一家上市公司,澳鵬自1996年創(chuàng)建至今,始終專注于人工智能訓(xùn)練數(shù)據(jù)的領(lǐng)域,目前在語音、文字、圖像和視頻等標(biāo)注領(lǐng)域已積累了25+年的經(jīng)驗(yàn)。服務(wù)范圍覆蓋170多個(gè)國家,235+種語言。全球正式員工 1100+,擁有100萬+全球眾包資源。截至2020年,公司營收已達(dá)4.1億的美金。

其中國分公司成立于2019年,總部位于上海,在無錫、大連、北京設(shè)有交付中心和分公司,業(yè)務(wù)廣泛覆蓋全中國及亞太地區(qū),擁有1000+名交付人員。目前,澳鵬合作客戶已遍及國內(nèi)領(lǐng)先大型互聯(lián)網(wǎng)公司與高科技企業(yè)。

作為數(shù)據(jù)行業(yè)的優(yōu)質(zhì)典范,澳鵬擁有強(qiáng)大的交付產(chǎn)能及資源管理優(yōu)勢,服務(wù)的客戶和項(xiàng)目數(shù)以百計(jì)。澳鵬無錫、大連交付中心經(jīng)驗(yàn)豐富的交付團(tuán)隊(duì),處理過2D、3DLiDAR等各種數(shù)據(jù)和不同客戶的業(yè)務(wù)需求,汽車2D和3D點(diǎn)云的周交付能力超過百萬幀;卓越運(yùn)營中心的管理模式可保證持續(xù)的高質(zhì)量交付。

在自動(dòng)駕駛領(lǐng)域,澳鵬高精度高性能的自動(dòng)駕駛工具套裝也是其為客戶構(gòu)筑海量數(shù)據(jù)資產(chǎn)的利器,這也是澳鵬的核心優(yōu)勢之一。

全面保障數(shù)據(jù)質(zhì)量

為了適應(yīng)高速變化的市場形式,澳鵬構(gòu)建了完整的數(shù)據(jù)質(zhì)量全生命周期管理體系,可以從數(shù)據(jù)的采集、標(biāo)注、模型訓(xùn)練、數(shù)據(jù)可視化、模型的部署及再訓(xùn)練等全過程,實(shí)現(xiàn)實(shí)時(shí)自動(dòng)的模型再訓(xùn)練和改裝。

其自主研發(fā)的人工智能輔助數(shù)據(jù)標(biāo)注平臺(tái)可支持像素級(jí)語義分割、2D圖像復(fù)合標(biāo)注、3D點(diǎn)云拉框及語義分割等功能。采標(biāo)一體的任務(wù)能夠?qū)崿F(xiàn)采集-質(zhì)檢-標(biāo)注-質(zhì)檢-客戶驗(yàn)收的雙向協(xié)同流程,讓整個(gè)數(shù)據(jù)生產(chǎn)線上的各個(gè)環(huán)節(jié)實(shí)現(xiàn)無縫銜接。內(nèi)置的多輪質(zhì)檢模塊可以按需配置,滿足不同復(fù)雜度項(xiàng)目的需求。

2D圖像復(fù)合標(biāo)注是全結(jié)構(gòu)化的模型訓(xùn)練利器,支持點(diǎn)、線、框、多邊型融合標(biāo)注(常見工具是單模式的,點(diǎn)、線or折線,多邊形)與連續(xù)幀;另外,此工具還支持像素級(jí)語義分割,可將圖片中目標(biāo)對(duì)象實(shí)例標(biāo)記出來,并保證像素級(jí)的質(zhì)量。其中豐富的可配置選項(xiàng)可靈活進(jìn)行id處理,實(shí)戰(zhàn)中可以做到10分鐘/張圖。

澳鵬Appen中國區(qū)市場拓展高級(jí)總監(jiān) 董成介紹,澳鵬利用ML輔助標(biāo)注等技術(shù)手段提高數(shù)據(jù)質(zhì)量,通過預(yù)識(shí)別系統(tǒng),讓算法先進(jìn)行預(yù)識(shí)別,再根據(jù)結(jié)果進(jìn)行人為調(diào)整,最終在成本控制和質(zhì)量上實(shí)現(xiàn)顯著提升。

比如在3D點(diǎn)云數(shù)據(jù)中,由于車道線本身的多樣性(環(huán)島、交叉線)以及外界光照、車輛遮擋等影響,3D點(diǎn)云數(shù)據(jù)中的車道線標(biāo)注一直是一個(gè)困難且耗時(shí)的課題。澳鵬3D點(diǎn)云車道線自動(dòng)識(shí)別的研發(fā)是解決這一難題的重大突破。

澳鵬Appen 3D點(diǎn)云車道線自動(dòng)識(shí)別 模型效果展示
澳鵬Appen 3D點(diǎn)云車道線自動(dòng)識(shí)別 模型效果展示

“我們3D點(diǎn)云拉框可支持自動(dòng)貼合、連續(xù)幀映射,及3D/2D的融合標(biāo)注,具備目標(biāo)預(yù)識(shí)別功能,能靈活配置數(shù)據(jù)有效性驗(yàn)證規(guī)則,可直接在線上讓客戶做最低交付粒度的驗(yàn)收且可無縫打回。實(shí)戰(zhàn)中能夠做到99.9%準(zhǔn)確率, 1秒/幀的極速質(zhì)檢?!卑涅iAppen中國區(qū)市場拓展高級(jí)總監(jiān) 董成表示。

此外,澳鵬的每個(gè)項(xiàng)目中除了配備專職的項(xiàng)目經(jīng)理,還有專門的QA/質(zhì)檢人員,Team Leader、等層層把關(guān)質(zhì)量控制;大多數(shù)項(xiàng)目都采用多輪質(zhì)檢的方案,保障數(shù)據(jù)質(zhì)量無限接近完美。

值得一提的是,澳鵬內(nèi)部對(duì)于安全合規(guī)的要求非常高,除了有健全的數(shù)據(jù)安全管理流程外,澳鵬還為了保障數(shù)據(jù)安全專門設(shè)置了DPO(Data Privacy Officer,數(shù)據(jù)合規(guī)官)。

所有的項(xiàng)目在簽單、立項(xiàng)前都需要通過數(shù)據(jù)合規(guī)官的審核、批準(zhǔn),并根據(jù)數(shù)據(jù)合規(guī)的要求在項(xiàng)目執(zhí)行中采取相應(yīng)的數(shù)據(jù)保障措施。

“我們對(duì)人工智能模型所使用的數(shù)據(jù)給予最大限度的關(guān)注和保護(hù),致力于為客戶提供最高級(jí)別的數(shù)據(jù)安全標(biāo)準(zhǔn),符合全球多項(xiàng)嚴(yán)格的數(shù)據(jù)安全資質(zhì)認(rèn)證。同時(shí),我們的平臺(tái)每天都會(huì)進(jìn)行漏洞掃描,最大限度的保證客戶數(shù)據(jù)資產(chǎn)安全。”澳鵬Appen中國區(qū)市場拓展高級(jí)總監(jiān) 董成表示。

平臺(tái)中設(shè)有權(quán)限管控、數(shù)據(jù)加密傳輸、PII信息加密存儲(chǔ)等嚴(yán)格的數(shù)據(jù)安全管控策略,交付管理具體包括:平臺(tái)進(jìn)行周期性系統(tǒng)漏洞掃描以免受惡意代碼/病毒攻擊; 24x7的全球IT支持團(tuán)隊(duì)和緊急響應(yīng)小組確保對(duì)IT事件及時(shí)響應(yīng)等等。

目前,澳鵬已在全球獲得ISO 27001安全認(rèn)證,包括位于上海的商務(wù)和研發(fā)總部、以及無錫和大連的數(shù)據(jù)服務(wù)交付中心。全球范圍內(nèi),澳鵬亦通過了GDPR,SOC 2 Type II,HIPAA等全球不同國家和地區(qū)的數(shù)據(jù)安全合規(guī)認(rèn)證。

某位與澳鵬合作的客戶負(fù)責(zé)人表示:“澳鵬與我們團(tuán)隊(duì)的合作非常順利,其平臺(tái)有助于我們確保流程根據(jù)項(xiàng)目需求不斷被優(yōu)化。我們也期待這一試點(diǎn)項(xiàng)目能盡快投入生產(chǎn)?!?/p>

原文鏈接:https://mp.weixin.qq.com/s/xquKbVJUPUZfHEIZqj3VTA

消息來源:澳鵬數(shù)據(jù)科技(上海)有限公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection