上海2024年9月3日 /美通社/ -- 過去5年,整個社會對于數(shù)據(jù)的觀念和認(rèn)知,發(fā)生了天翻地覆的改變。這要?dú)w功于OpenAI與預(yù)訓(xùn)練大語言模型(以下簡稱大模型)的問世以及橫掃全球的ChatGPT。從2020年1月OpenAI發(fā)表《自然語言模型的"摩爾定律"(Scaling Law for Neural Language Models)》論文到2023年的"百模"大戰(zhàn),數(shù)據(jù)成為了與算力和模型參數(shù)并駕齊驅(qū)的三駕馬車之一。
在AI與大模型數(shù)據(jù)服務(wù)這條賽道上,澳鵬Appen位于Everest Group 2024 AI/ML數(shù)據(jù)標(biāo)注解決方案Peak Matrix領(lǐng)導(dǎo)者象限第一。2019年,澳鵬(中國)正式成立了,作為獨(dú)立于澳鵬Appen全球而在中國市場"白手起家"的澳鵬(中國),5年來闖過了中國AI數(shù)據(jù)"江湖",實(shí)現(xiàn)了在中國市場遙遙領(lǐng)先——從 2020 年到 2023 年,5年來澳鵬的復(fù)合營收增長率是 90+%以上,2023年澳鵬(中國)實(shí)現(xiàn)了近2.5億人民幣營收,剛剛發(fā)布的2024年上半年實(shí)現(xiàn)了1.83億人民幣(2540萬美元)營收,遠(yuǎn)超業(yè)界頭部友商。預(yù)計2024年將實(shí)現(xiàn)3.5~4億人民幣營收,YOY 的收入增長率 50%~60%以上,2029年將跨入年營收10億人民幣大關(guān)。澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示:“過去5年澳鵬(中國)的成功,可以總結(jié)為五大因素:順勢而為、創(chuàng)新為要、資源多樣化、洞察客戶需求、員工滿意與數(shù)據(jù)合規(guī)。
AI數(shù)據(jù)三維度爆發(fā)式裂變
所謂AI數(shù)據(jù),即經(jīng)過人工或機(jī)器方式標(biāo)注過的數(shù)據(jù)。澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,澳鵬(中國)在近五年經(jīng)歷了三大AI浪潮,同時收獲了AI數(shù)據(jù)在三個維度的爆發(fā)式裂變增長紅利:即從深度學(xué)習(xí)和機(jī)器學(xué)習(xí)浪潮、到自動駕駛浪潮、再到大模型的"滔天巨浪";相應(yīng)帶來AI數(shù)據(jù)在數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量和數(shù)據(jù)復(fù)雜度等三個維度的裂變增長。
在數(shù)據(jù)規(guī)模方面,傳統(tǒng)深度學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)規(guī)模在GB級到TB級,自動駕駛模型和大模型訓(xùn)練數(shù)據(jù)進(jìn)一步上升至PB級。一輛智能汽車真實(shí)路況采集視頻數(shù)據(jù)可達(dá)PB到數(shù)十PB,而通用大模型訓(xùn)練甚至已經(jīng)耗盡了互聯(lián)網(wǎng)數(shù)據(jù),并向更廣闊的私域數(shù)據(jù)高速拓展。
在數(shù)據(jù)質(zhì)量方面,由于自動駕駛模型對于真實(shí)路況安全的重要性等,要求數(shù)據(jù)標(biāo)注的準(zhǔn)確性從之前的95%或96%進(jìn)一步提升到99.5%甚至100%,這就意味著極大提高了數(shù)據(jù)標(biāo)注的要求。而對于大模型訓(xùn)練來說,高質(zhì)量數(shù)據(jù)則意味著更高水平的人工標(biāo)注,例如需要量子力學(xué)等小眾專業(yè)知識以及醫(yī)療、音樂、科技、金融、制造等垂直行業(yè)知識。
數(shù)據(jù)復(fù)雜度更在近年來急劇上升。在自動駕駛、VR/MR、機(jī)器人等領(lǐng)域,此前主要為2D、3D和 2D&3D融合標(biāo)注,這兩年進(jìn)一步發(fā)展到4D標(biāo)注,也就是將時間作為新增維度,而4D標(biāo)注對技術(shù)和復(fù)雜度要求非常高。此外,由于大量AI模型訓(xùn)練和多頻次模型迭代的需求,數(shù)據(jù)流轉(zhuǎn)越來越復(fù)雜,數(shù)據(jù)處理的專業(yè)性要求越來越高,既有短周期甚至臨時性項目、高頻次數(shù)據(jù)標(biāo)注需求,也有臨時數(shù)據(jù)耗盡而項目掛起的需求,還有要求安全可控數(shù)據(jù)標(biāo)注環(huán)境、專業(yè)數(shù)據(jù)人才能力等等。
整體而言,經(jīng)過了2019年到2024年的飛速發(fā)展,從深度學(xué)習(xí)/機(jī)器學(xué)習(xí)的精品式小模型訓(xùn)練,到自動駕駛的規(guī)?;P陀?xùn)練和高頻次迭代,再到"百大"大模型和生成式 AI的規(guī)模化生產(chǎn),引發(fā)了AI數(shù)據(jù)在規(guī)模、質(zhì)量和復(fù)雜度三個維度的同時爆發(fā)式裂變,這對于AI數(shù)據(jù)服務(wù)商來說,既是機(jī)遇更是挑戰(zhàn)。
"押注"技術(shù)平臺產(chǎn)品,打造核心競爭力
技術(shù)能力是傳統(tǒng)數(shù)據(jù)標(biāo)注服務(wù)商長期缺失的核心能力。隨著AI數(shù)據(jù)在三個維度的爆發(fā)式裂變,單純依靠手工方式進(jìn)行數(shù)據(jù)標(biāo)注已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足需求,更無法持續(xù)降低數(shù)據(jù)標(biāo)注項目的成本、提高數(shù)據(jù)標(biāo)注的質(zhì)量、加快數(shù)據(jù)的有效流轉(zhuǎn)。
在數(shù)據(jù)標(biāo)注技術(shù)工程平臺方面,特斯拉為整個行業(yè)立了一面旗幟。從2018到2021年,特斯拉的數(shù)據(jù)工程平臺經(jīng)歷了3次迭代,通過自動標(biāo)注與多種技術(shù)手段配合,一個clip(即最小標(biāo)注單位,通常特斯拉的一個clip包括45秒到1分鐘的路段數(shù)據(jù))的標(biāo)注僅需0.5小時算力+0.1小時人工,效率較2018年提升了800倍之多。
在全球市場,2019年的時候也僅有包括澳鵬Appen在內(nèi)的少數(shù)頂級AI數(shù)據(jù)標(biāo)注服務(wù)商投資了自有的數(shù)據(jù)標(biāo)注工程平臺。在2019年澳鵬(中國)成立的時候,當(dāng)時除了從IBM等世界一流IT公司出來的幾位核心主創(chuàng)人員以及澳鵬Appen全球?qū)χ袊鴪F(tuán)隊的初始投資外,可以說"一窮二白"。
與其它全球公司的中國分公司不同,由于數(shù)據(jù)行業(yè)的高度安全合規(guī)要求,澳鵬(中國)必須要獨(dú)立自主地在中國市場重建所有的資源、系統(tǒng)和流程。擯棄了"拿來主義",擺在澳鵬(中國)創(chuàng)始團(tuán)隊面前的就是一張白紙,而團(tuán)隊決定對技術(shù)進(jìn)行"押注"式投入:目前公司有60余名全職資深研發(fā)技術(shù)工程師,其中一半專門聚焦于公司的技術(shù)平臺產(chǎn)品研發(fā);另一半專門聚焦于和客戶在平臺數(shù)據(jù)接收和驗收的無縫對接。2023年,澳鵬(中國)投資近5000萬元用于技術(shù)和系統(tǒng)建設(shè),包括對澳鵬MatrixGo企業(yè)級高精度數(shù)據(jù)標(biāo)注平臺和大模型智能開發(fā)平臺的開發(fā)和增強(qiáng)。
今天的澳鵬(中國)有兩大拳頭產(chǎn)品:MatrixGo企業(yè)級高精度數(shù)據(jù)標(biāo)注平臺和大模型智能開發(fā)平臺,并用這兩大平臺扛住了AI數(shù)據(jù)三維度裂變的"滾滾洪流"。澳鵬MatrixGo平臺和大模型智能開發(fā)平臺完全由澳鵬(中國)團(tuán)隊在本地研發(fā),擁有全部的知識產(chǎn)權(quán)和產(chǎn)品主導(dǎo)能力。
目前,澳鵬(中國)對MatrixGo平臺和大模型智能開發(fā)平臺每年迭代近百次,相當(dāng)于每周都有產(chǎn)品更新,國內(nèi)本地客戶的 AI 數(shù)據(jù)需求能夠快速反應(yīng)到產(chǎn)品設(shè)計和開發(fā)中。同時澳鵬自主研發(fā)的預(yù)標(biāo)注通用模型和交互式算法在數(shù)據(jù)標(biāo)注任務(wù)中能產(chǎn)生25%至10倍以上的效率提升。
具體來看,澳鵬MatrixGo平臺主要針對深度學(xué)習(xí)和機(jī)器學(xué)習(xí)小模型的數(shù)據(jù)采集與標(biāo)注需求,也服務(wù)于自動駕駛場景,覆蓋文本、語音、圖像、視頻、多模態(tài)等各種數(shù)據(jù)類型。目前澳鵬MatrixGo平臺已經(jīng)演進(jìn)到2.0版本,并不斷增強(qiáng)AI輔助智能標(biāo)注引擎,持續(xù)提升人工標(biāo)注的效率和質(zhì)量,降低數(shù)據(jù)標(biāo)注成本。
例如,澳鵬MatrixGo平臺在2D圖像類項目上可達(dá)到5倍以上的效率提升;3D語義分割數(shù)據(jù)標(biāo)注效率提升可達(dá)到35%以上;2/3D物體檢測預(yù)標(biāo)注模型效率提升15%-30%;數(shù)據(jù)交付準(zhǔn)確率平均達(dá)到99%以上。在自動駕駛場景方面,澳鵬MatrixGo平臺支持單幀100億以上點(diǎn)云的加載、提供了多種4D數(shù)據(jù)標(biāo)注工具,能夠為客戶增效30%以上。
澳鵬MatrixGo平臺針對各種中國客戶的不同信息安全性需求,還提供了客戶On-Premise、專屬安全屋On-premise、SaaS等多種不同的部署形式, 如On-premise的部署在48小時內(nèi)可以完成,不僅極大地滿足了針對客戶的安全性需求適配,更解決客戶快速交付的緊急訴求,已在中國成功地提供幾十家客戶的On-Premise部署。
澳鵬大模型智能開發(fā)平臺是澳鵬(中國)在2023年全新開發(fā)的一個新技術(shù)工程平臺。針對大模型場景,澳鵬(中國)研發(fā)了專業(yè)的多模態(tài)數(shù)據(jù)標(biāo)注工具、多輪對話數(shù)據(jù)標(biāo)注工具、思維鏈數(shù)據(jù)標(biāo)注工具、工具調(diào)用數(shù)據(jù)標(biāo)注工具、知識庫數(shù)據(jù)標(biāo)注工具等多種專業(yè)標(biāo)注工具,支持RLHF、RLAIF、SFT等多種高質(zhì)量數(shù)據(jù)的生產(chǎn);該平臺對數(shù)據(jù)集管理、模型評估進(jìn)行了針對性設(shè)計,通過A/B測試、紅藍(lán)對抗、排序打分等對大模型質(zhì)量進(jìn)行評估和分析;該平臺還集成了算力資源的調(diào)度和對接,可以進(jìn)行算法的微調(diào)和部署,一站式完成大模型數(shù)據(jù)開發(fā)。
大模型智能開發(fā)平臺的快速上線讓澳鵬(中國)迅速抓住了大模型商機(jī)。2023年,澳鵬(中國)在中國、日本和韓國共拓展了82家新客戶,其中8家客戶帶來了20個大模型項目。2023年全年,澳鵬(中國)大模型業(yè)務(wù)營收接近3300萬,2024上半年更直逼5000萬,呈爆發(fā)式增長態(tài)勢。
澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,正是依托澳鵬MatrixGO平臺和大模型智能開發(fā)平臺兩大平臺的技術(shù)能力,讓澳鵬(中國)在眾多數(shù)據(jù)項目中脫穎而出,也是獲得頭部客戶青睞的重要原因。
在自主創(chuàng)新方面,澳鵬(中國)目前累計申請的專利數(shù)達(dá)到24項(其中20個專利申請?zhí)幱谝堰f交狀態(tài));軟著登記共計62項,其中56項已獲證。澳鵬(中國)與很多高校和科研院所在計算機(jī)視覺、多模態(tài)算法、大模型等領(lǐng)域進(jìn)行了項目合作,也與許多院校在人工智能訓(xùn)練師、人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)培養(yǎng)等方面深入合作。
正是因為堅持對核心技術(shù)進(jìn)行布局,澳鵬(中國)成功入選艾瑞咨詢的《2024年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)研究報告》,并作為行業(yè)標(biāo)桿之一被列入AI基礎(chǔ)數(shù)據(jù)服務(wù)廠商案例。而在2024世界人工智能大會(WAIC2024)期間,澳鵬(中國)入選了億歐的2024 AI產(chǎn)業(yè)鏈圖譜,并被評選為2024中國AI企業(yè)商業(yè)落地基礎(chǔ)設(shè)施服務(wù)商Top20等。
躬身入局AI數(shù)據(jù)"江湖",闖出新天地
整個AI數(shù)據(jù)標(biāo)注行業(yè)在過去5年經(jīng)歷了全面重塑。2019年的數(shù)據(jù)標(biāo)注市場,仍處于野蠻生長狀態(tài),主要以勞動力密集型企業(yè)為主,其競爭優(yōu)勢主要體現(xiàn)在低價格和傳統(tǒng)渠道,不少企業(yè)在四五線城市建立了低成本的數(shù)據(jù)標(biāo)注基地。當(dāng)時的數(shù)據(jù)標(biāo)注員幾乎零門檻,整個行業(yè)良莠不齊,惡意競爭、低價競爭等種種亂象叢生,可以用"江湖"一詞來形容當(dāng)時的市場狀態(tài)。
2019年澳鵬(中國)成立的時候,當(dāng)時已經(jīng)成立23年、上市4年的澳鵬Appen全球擁有百萬眾包資源,支持235+種語言和方言,具備成熟的眾包人力資源體系和項目管理能力。但對于2019年僅有不到10個人的澳鵬(中國)初創(chuàng)團(tuán)隊來說,這些來自頂級IT公司的專業(yè)精英人才,卻要面對當(dāng)時AI數(shù)據(jù)標(biāo)注服務(wù)市場的各種亂象。
針對處于初級階段的中國AI數(shù)據(jù)標(biāo)注市場,澳鵬(中國)投入了大量時間和精力進(jìn)行眾包資源的招募、培訓(xùn)、流程建設(shè)和管理,特別是在二線城市創(chuàng)造性地建立了自營數(shù)據(jù)服務(wù)交付基地,通過自有專職人員+眾包資源的方式,適配了中國數(shù)據(jù)標(biāo)注行業(yè)的初級階段。
所謂自營數(shù)據(jù)服務(wù)交付基地,即在無錫、大連、重慶等地租用辦公樓,招聘專職數(shù)據(jù)標(biāo)注服務(wù)員工入駐辦公,同時為項目提供安全封閉的項目辦公空間,供團(tuán)隊與客戶共同完成高保密性的項目。而在項目管理方面,面對數(shù)據(jù)標(biāo)注項目節(jié)奏快、數(shù)據(jù)需求量不穩(wěn)定、數(shù)據(jù)規(guī)則不斷變化等挑戰(zhàn),澳鵬(中國)從多個維度提升項目管理能力,保障對客戶項目交付的穩(wěn)定性。
澳鵬(中國)非常重視AI數(shù)據(jù)服務(wù)項目的安全和隱私保護(hù),不僅在中國的各個自營基地均已獲得ISO 27001、27701、9001、14001、45001、ISO 37301等安全及管理領(lǐng)域國際認(rèn)證,還與客戶、眾包資源等100%簽訂NDA協(xié)議。此外,根據(jù)項目對數(shù)據(jù)的安全級別、隱私安全等要求,澳鵬(中國)為客戶定制專屬項目室,包括安全屋、網(wǎng)絡(luò)專線、信息安全管控等,特殊項目要求員工在進(jìn)入項目前還需要上交手機(jī)。正是因為澳鵬(中國)不遺余力地建設(shè)數(shù)據(jù)安全與隱私保護(hù),才在市場競爭中獲得了頭部客戶的青睞。
為什么要建自營服務(wù)交付基地?澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士介紹,盡管澳鵬自身非常重視數(shù)據(jù)安全與隱私保護(hù),但很多BPO服務(wù)商特別是中小BPO服務(wù)其實(shí)在這方面并不重視,也很難具備高等級數(shù)據(jù)安保設(shè)施,相比之下只有自營服務(wù)交付基地才能滿足客戶高安全、高保密等高等級要求。澳鵬(中國)的自營服務(wù)交付基地也為中國AI數(shù)據(jù)標(biāo)注行業(yè)建立了一個新規(guī)范、新標(biāo)桿。有客戶表示在國內(nèi)所有大型數(shù)據(jù)標(biāo)注服務(wù)商中,只有澳鵬(中國)是真正將數(shù)據(jù)安保真正落地的服務(wù)商,也是少有的全員交社保的數(shù)據(jù)標(biāo)注服務(wù)商。
選擇在二線城市建設(shè)自營數(shù)據(jù)服務(wù)交付基地,還有一個出發(fā)點(diǎn)就是為了滿足AI數(shù)據(jù)對于高知識專業(yè)人才的需求。田小鵬表示,團(tuán)隊在成立之初就前瞻到了AI模型將越來越向垂直領(lǐng)域和專業(yè)化方向發(fā)展,對于知識的需求將越來越高。相比于四五線城市,二線城市有大量高水平的高校以及具備高知識的專業(yè)化人才,選擇在二線城市建設(shè)自營數(shù)據(jù)服務(wù)交付基地可就近招募高知識專業(yè)化人才,滿足AI模型的長期演進(jìn)需求。
在澳鵬(中國)創(chuàng)業(yè)的5年中,經(jīng)歷了中國AI數(shù)據(jù)標(biāo)注行業(yè)從初期亂象走向規(guī)范化發(fā)展之路,在這期間還經(jīng)歷了三年疫情這樣百年未遇的公共事件,這些都是澳鵬(中國)創(chuàng)業(yè)團(tuán)隊在創(chuàng)業(yè)之初都始料未及的挑戰(zhàn)。
例如,有的客戶在項目進(jìn)行過程中或項目結(jié)束就破產(chǎn)了,或因各種原因出現(xiàn)賴賬,導(dǎo)致無法收回上百萬的項目款或者打折結(jié)算,而與此同時很多眾包人員的工作已經(jīng)在進(jìn)行中或完成了,澳鵬(中國)團(tuán)隊經(jīng)過慎重考慮選擇自行墊款結(jié)算所有眾包人員和BPO商的項目款,因為對于很多地方上的眾包和 BPO人員來說,項目款是維持生計的重要來源,特別在疫情期間甚至是唯一生計來源。
從"科技向善"的公司理念出發(fā),澳鵬(中國)并沒有因為AI數(shù)據(jù)"江湖"的亂象而放棄原則,而是知行合一地實(shí)踐了這一理念,杜絕各種"踩紅線"行為,為整個行業(yè)樹立科技向善的標(biāo)桿,引領(lǐng)AI數(shù)據(jù)標(biāo)注行業(yè)走出無序和不良競爭亂象,走向更加光明的未來。
下一個5年,勇攀高峰
在過去5年中,出現(xiàn)了大量不確定性的事件,包括全球疫情和中美科技競爭,但也幸運(yùn)地趕上了自動駕駛和大模型浪潮以及由此引發(fā)的AI數(shù)據(jù)三維度爆發(fā)式裂變。由于澳鵬(中國)堅持以科技創(chuàng)新立身,堅定投入自有技術(shù)平臺,依靠更高效率、更高質(zhì)量、更高安全性的技術(shù)平臺和人力資源優(yōu)勢,在市場中站穩(wěn)了腳跟。
過去5年澳鵬(中國)的成功,可以總結(jié)為五大因素:順勢而為、創(chuàng)新為要、資源多樣化、洞察客戶需求、員工滿意與數(shù)據(jù)合規(guī)。
順勢而為。澳鵬(中國)非常幸運(yùn)地抓住了ChatGPT、LLM等AI科技突破性技術(shù)創(chuàng)新和成就所產(chǎn)生的商機(jī),特別是敏銳察覺和把握了AI數(shù)據(jù)三維度爆發(fā)式裂變,堅定了對AI數(shù)據(jù)標(biāo)注服務(wù)、AI和未來科技演進(jìn)的信心與信念,在前瞻性戰(zhàn)略思考基礎(chǔ)上,謀定而后動。
創(chuàng)新為要。澳鵬(中國)將創(chuàng)新視為公司和行業(yè)發(fā)展的動力,以創(chuàng)新謀新局、開新篇:創(chuàng)造性地建立在中國自營 AI 數(shù)據(jù)服務(wù)交付基地模式;大膽投資開發(fā)了澳鵬MatrixGo平臺和大模型智能開發(fā)平臺并建立了技術(shù)護(hù)城河;率先嘗試各種AI數(shù)據(jù)服務(wù),包括3D數(shù)據(jù)標(biāo)注、4D數(shù)據(jù)標(biāo)注、大模型數(shù)據(jù)服務(wù)、多模態(tài)數(shù)據(jù)服務(wù)、海外路采等等。
資源多樣化。通過眾包、BPO和專職數(shù)據(jù)標(biāo)注與服務(wù)人員等多種資源布局與協(xié)同,解決了客戶在AI數(shù)據(jù)規(guī)模、質(zhì)量與復(fù)雜性方面的挑戰(zhàn),同時也解決了部分大眾就業(yè)、中小企業(yè)生存發(fā)展等民生問題,將創(chuàng)業(yè)與企業(yè)責(zé)任結(jié)合起來,用實(shí)踐向業(yè)界展現(xiàn)了AI向善的商業(yè)與社會價值,引領(lǐng)整個行業(yè)走上可持續(xù)發(fā)展之路。
洞察客戶需求。在AI數(shù)據(jù)服務(wù)行業(yè),客戶真正關(guān)心的是優(yōu)異的品質(zhì)和合理的價格。澳鵬(中國)一直秉承"季布一諾千金"的優(yōu)良文化,全心全意服務(wù)好客戶,不斷打磨精細(xì)化管理,以優(yōu)異的數(shù)據(jù)質(zhì)量品質(zhì),在業(yè)界形成了良好的口碑。
員工滿意和數(shù)據(jù)合規(guī)。澳鵬(中國)非常重視員工的滿意度,授予員工充分的自主權(quán),讓員工全方位參與公司管理,獲得員工的高認(rèn)可度。數(shù)據(jù)合規(guī)紅線是企業(yè)運(yùn)營的根本,公司通過各種獨(dú)立項目交付合規(guī)室的建設(shè)和管控措施以及ISO信息安全認(rèn)證等多種舉措建立了安全合規(guī)的企業(yè)文化。
目前,澳鵬(中國)客戶主要分布在互聯(lián)網(wǎng)/電商企業(yè)、算法科技公司、自動駕駛等行業(yè),客戶包括國內(nèi)前十大汽車公司、前十大互聯(lián)網(wǎng)公司和前四大移動互聯(lián)網(wǎng)公司等。鑒于AI數(shù)據(jù)與AI模型越來越密不可分,澳鵬(中國)為頭部客戶配置了專屬的客戶經(jīng)理,從而深入理解客戶業(yè)務(wù),并根據(jù)客戶業(yè)務(wù)發(fā)展,提前準(zhǔn)備相應(yīng)的資源和能力,靈活及時滿足客戶需求。
例如,在服務(wù)某中國頭部社交媒體海外實(shí)體公司的過程中,雙方在大模型文本生成和多模態(tài)數(shù)據(jù)處理等領(lǐng)域展開了深入合作。澳鵬(中國)在東南亞地區(qū)建立了多個大模型標(biāo)注的基地,招募了當(dāng)?shù)貎?yōu)秀的本科、碩士畢業(yè)生以及部分垂直領(lǐng)域的專家。借助海外專業(yè)且穩(wěn)定的人力資源以及澳鵬豐富的管理經(jīng)驗,為該客戶實(shí)現(xiàn)了大模型高精度+高一致率的標(biāo)注結(jié)果。目前該客戶大模型的業(yè)務(wù)量已經(jīng)躋身澳鵬(中國)前三,成為重要的業(yè)務(wù)支柱。
在下一個5年到來之際,澳鵬(中國)又站在了一個新的起點(diǎn)。未來5年,在大模型的持續(xù)影響和應(yīng)用需求激增下,全社會全面進(jìn)入AI規(guī)?;瘧?yīng)用階段,相關(guān)數(shù)據(jù)標(biāo)注的需求也呈現(xiàn)爆發(fā)式增長。面對下一波AI浪潮,澳鵬(中國)已經(jīng)做好了充分的準(zhǔn)備。
首先,澳鵬(中國)將持續(xù)投入兩大平臺的研發(fā),不斷提高產(chǎn)品力,從而提升產(chǎn)品在整個營收中的占比。在數(shù)據(jù)標(biāo)注服務(wù)外,客戶對于數(shù)據(jù)處理平臺、數(shù)據(jù)處理工具和數(shù)據(jù)處理算法有大量需求。為此,澳鵬(中國)投入產(chǎn)品研發(fā),打造可商業(yè)化的數(shù)據(jù)標(biāo)注平臺、多模態(tài)數(shù)據(jù)標(biāo)注工具、成品數(shù)據(jù)庫產(chǎn)品以及覆蓋數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)脫敏、數(shù)據(jù)挖掘等不同階段的自動化算法產(chǎn)品,為客戶提供全面的產(chǎn)品矩陣。
澳鵬(中國)的團(tuán)隊與客戶團(tuán)隊一起,共同探討算法研發(fā)的思路和數(shù)據(jù)標(biāo)注工具的產(chǎn)品設(shè)計。澳鵬(中國)團(tuán)隊每天都在為客戶定制化需求而研發(fā),這些需求可能是為了客戶算法工程師的一個新思路而實(shí)現(xiàn)一個特殊的數(shù)據(jù)標(biāo)注功能以標(biāo)注特定的數(shù)據(jù)特征,也可能是為了讓客戶更好更快地驗收數(shù)據(jù)標(biāo)注結(jié)果而開發(fā)更便捷、可視化功能和數(shù)據(jù)準(zhǔn)確率看板。所有這些新算法、新功能、新工具都匯入澳鵬(中國)的兩大平臺,惠及更多客戶。
其次,澳鵬(中國)將繼續(xù)開拓大模型和中國企業(yè)出海兩大市場。在大模型市場,科技企業(yè)對于AI/LLM的研發(fā)投入巨大,迫切需要具有的高質(zhì)量訓(xùn)練數(shù)據(jù)交付能力的公司,幫助更好、更快地處理模型訓(xùn)練數(shù)據(jù),而澳鵬(中國)已經(jīng)構(gòu)建了強(qiáng)大的競爭力。
在中國企業(yè)出海市場,企業(yè)出海首先面對的就是語言和全球資源的挑戰(zhàn),澳鵬在全球170多個國家擁有290多種語言的資源,同時在菲律賓、越南、美國等地區(qū)擁有大型交付中心,這是澳鵬在行業(yè)內(nèi)獨(dú)一無二的優(yōu)勢,可以很好地支持國內(nèi)企業(yè)出海拓展海外市場業(yè)務(wù)。
第三,針對AI技術(shù)深入行業(yè)應(yīng)用帶來的長期需求,包括代碼、醫(yī)療、教育、金融、工業(yè)、汽車等行業(yè),澳鵬(中國)已經(jīng)儲備了超過1500人的高學(xué)歷專業(yè)人士,而且還在無錫、大連、重慶等多地的交付基地同時招聘招募專業(yè)人員,從而打造全國性的專業(yè)資源能力池。
艾瑞咨詢預(yù)計到2028年,中國AI基礎(chǔ)數(shù)據(jù)服務(wù)市場規(guī)模將達(dá)170億元,未來五年的復(fù)合增長率為30.4%。澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,有信心在5年后實(shí)現(xiàn)12億人民幣的年營收,以至少27.8%+的高速復(fù)合增長率,成為中國及亞洲區(qū)AI數(shù)據(jù)專業(yè)服務(wù)行業(yè)的領(lǐng)軍服務(wù)商。
其中,產(chǎn)品和服務(wù)兩條線更均衡發(fā)展,產(chǎn)品項目的占比將從2024年的4%至少提升到2029年的12%;進(jìn)一步加速開拓亞洲市場,占比將從 2024年10%至少提升到2029年15%,澳鵬中國5 年后將完成亞洲、歐洲、非洲、中東、南美、北美等地所有AI數(shù)據(jù)服務(wù)的全覆蓋。
展望5年后乃至更長遠(yuǎn)的未來,田小鵬認(rèn)為廣闊天地在于突破AI數(shù)據(jù)標(biāo)注服務(wù)窄領(lǐng)域,進(jìn)入AI數(shù)據(jù)服務(wù)寬領(lǐng)域,即:AI數(shù)據(jù)服務(wù)將會有更廣泛行業(yè)的覆蓋拓展;AI 數(shù)據(jù)類型將向多模態(tài)、垂類細(xì)分顆粒度等演變;AI 數(shù)據(jù)產(chǎn)品將更國際化、全球化、多語言覆蓋。例如:大模型就將AI數(shù)據(jù)服務(wù)推進(jìn)到了人工反饋算法迭代服務(wù)和模型評估服務(wù),今后隨著AI技術(shù)的持續(xù)發(fā)展或?qū)⒊霈F(xiàn)新的AI模型,相應(yīng)帶來新的AI數(shù)據(jù)服務(wù)需求,這為澳鵬(中國)基業(yè)長青奠定了信心。
回顧過去5年走過的路,田小鵬笑說如果再來一遍,肯定不會選擇創(chuàng)業(yè)這條道路。因為在一個市場的初級階段搏殺,再疊加全球三年疫情這樣極具挑戰(zhàn)的公共事件,即便是老兵創(chuàng)業(yè)也是每日如履薄冰。
5年前創(chuàng)業(yè)之初,澳鵬(中國)從零起步,沒有客戶、沒有產(chǎn)品、沒有流程、沒有團(tuán)隊、只有投資和勇氣;5年后,澳鵬(中國)已經(jīng)有兩大產(chǎn)品平臺、3000+員工、3000+BPO合作伙伴、近百萬眾包資源、6大服務(wù)交付基地、完整的組織、流程與管理以及350+家優(yōu)質(zhì)客戶……
闖過了前面的險灘,后面就是奔騰不息的大江大河。面向下一個5年,田小鵬說"澳鵬(中國)并不完美,但一直在追求完美的道路上。在 AI 的未來浪潮中,在AI數(shù)據(jù)主航道上我們將勇往直前。澳鵬(中國)愿做客戶在 AI成功的幕后英雄和鋪路石,成就客戶是我們永遠(yuǎn)不變的初心!"