上海2025年4月10日 /美通社/ -- 4月1日-2日,2025中國生成式AI大會在北京圓滿舉行,匯聚超過50位產(chǎn)學(xué)研界重量級嘉賓,深度解構(gòu)DeepSeek引發(fā)的變革狂潮,全面展示深度推理模型、多模態(tài)模型、智能體及具身智能等前沿領(lǐng)域的最新進(jìn)展。大會以"大拐點(diǎn) 新征程"為主題,吸引了1500余名現(xiàn)場觀眾,線上觀看人次更是突破百萬,成為國內(nèi)AI領(lǐng)域最具影響力的產(chǎn)業(yè)峰會之一。澳鵬Appen作為AI數(shù)據(jù)服務(wù)行業(yè)的領(lǐng)軍企業(yè)重磅亮相,分享了大模型時代數(shù)據(jù)服務(wù)的前沿洞察與實踐經(jīng)驗。
澳鵬重磅亮相 展示數(shù)據(jù)硬實力
2025中國生成式AI大會由智猩猩、智東西共同發(fā)起。澳鵬Appen攜全面的大模型數(shù)據(jù)解決方案亮相大會,展示了如何以專業(yè)、精準(zhǔn)、安全的高質(zhì)量訓(xùn)練數(shù)據(jù)賦能大模型開發(fā),特別是在垂直領(lǐng)域的深度應(yīng)用。澳鵬展位吸引了眾多參會者駐足交流,尤其是來自金融、醫(yī)療、法律等垂直行業(yè)的專業(yè)人士。
澳鵬Appen 2024年年報顯示:中國業(yè)務(wù)營收突破4.2億,年增長達(dá)到71%,其中大模型/AIGC業(yè)務(wù)增長了526%,幾乎所有行業(yè)龍頭,特別是大模型AI企業(yè)都成為了澳鵬的客戶。展會期間,澳鵬團(tuán)隊與與會者共同探討高質(zhì)量訓(xùn)練數(shù)據(jù)如何賦能大模型在垂直領(lǐng)域的精準(zhǔn)應(yīng)用,為金融風(fēng)控、醫(yī)療診斷、法律檢索等專業(yè)場景提供更智能、更可靠的解決方案。
澳鵬副總裁董成發(fā)表精彩演講
在大模型峰會上,澳鵬Appen中國及韓國區(qū)副總裁董成發(fā)表了題為《大模型時代的AI數(shù)據(jù)服務(wù)》的主題演講,通過澳鵬在各領(lǐng)域大模型部署中的數(shù)據(jù)訓(xùn)練最佳實踐,分享了對大模型應(yīng)用趨勢的深刻觀察。
董成指出,以AI Agent為代表,未來大模型必定會深度應(yīng)用到金融、醫(yī)療、代碼、音樂、文學(xué)等具體垂直領(lǐng)域中。這一趨勢對數(shù)據(jù)的高質(zhì)量、專業(yè)度和多垂類覆蓋提出了越來越高的要求。面對這一挑戰(zhàn),澳鵬提供了多種AI輔助的前沿數(shù)據(jù)采標(biāo)工具和方案,包括文本對話、多模態(tài)交互、思維鏈推理工具等,以滿足不同垂直領(lǐng)域的專業(yè)化需求。
"大模型愈往垂類應(yīng)用端發(fā)力,對數(shù)據(jù)質(zhì)量要求愈高,"董成強(qiáng)調(diào),"在通用語言任務(wù)上,第一梯隊模型的性能已經(jīng)趨于一致,開源模型如Llama和DeepSeek的性能已經(jīng)趕上甚至超過部分閉源模型。但在更復(fù)雜的垂直領(lǐng)域任務(wù)中,高質(zhì)量的專業(yè)數(shù)據(jù)將成為決定模型性能的關(guān)鍵因素。"
澳鵬全面大模型數(shù)據(jù)解決方案
在演講中,董成系統(tǒng)介紹了澳鵬全面的大模型數(shù)據(jù)解決方案,覆蓋從通用能力到垂直領(lǐng)域的全鏈條數(shù)據(jù)需求,包括:
全面的大模型數(shù)據(jù)生產(chǎn)工具鏈:澳鵬開發(fā)了覆蓋文本對話、圖像/視頻描述、多模態(tài)融合、思維鏈和工具調(diào)用等場景的專業(yè)數(shù)據(jù)生產(chǎn)工具,滿足大模型訓(xùn)練對多樣化數(shù)據(jù)類型的需求。
智能體訓(xùn)練數(shù)據(jù)生產(chǎn):針對快速發(fā)展的AI智能體領(lǐng)域,澳鵬專門開發(fā)了針對GUI Agent的數(shù)據(jù)解決方案,支持智能體在多步驟任務(wù)中的數(shù)據(jù)訓(xùn)練需求。
自動化數(shù)據(jù)標(biāo)注回環(huán):澳鵬采用"以AI賦能AI"的開發(fā)策略,通過自研的預(yù)標(biāo)注大模型與不同領(lǐng)域項目實踐相結(jié)合,構(gòu)建了自動化數(shù)據(jù)標(biāo)注回環(huán)系統(tǒng),大幅提升數(shù)據(jù)生產(chǎn)效率。
高質(zhì)量成品數(shù)據(jù)集:澳鵬提供大規(guī)模、高質(zhì)量、多模態(tài)的成品數(shù)據(jù)集,包括多模態(tài)多步驟思維鏈數(shù)據(jù)集、千萬級多語種平行語料數(shù)據(jù)集、千萬級知識百科和垂類問答數(shù)據(jù)集、千萬級代碼數(shù)據(jù)集、億級高質(zhì)量學(xué)科題目數(shù)據(jù)集以及百萬級圖像文本多模態(tài)數(shù)據(jù)集等。這些數(shù)據(jù)集為大模型的快速迭代提供了豐富的數(shù)據(jù)養(yǎng)料。
澳鵬Appen中國及韓國區(qū)副總裁董成表示:"澳鵬已在金融、醫(yī)療、法律、代碼、音樂等9大垂直領(lǐng)域建立了專業(yè)團(tuán)隊,確保我們能夠為各垂直領(lǐng)域的大模型訓(xùn)練提供高度專業(yè)化的數(shù)據(jù)支持,幫助客戶在特定領(lǐng)域?qū)崿F(xiàn)模型性能的突破。"
2025中國生成式AI大會的成功舉辦,彰顯了高質(zhì)量數(shù)據(jù)作為大模型發(fā)展核心引擎的重要價值。作為AI數(shù)據(jù)服務(wù)領(lǐng)域的領(lǐng)軍者,澳鵬Appen始終以專業(yè)、精準(zhǔn)、安全的高質(zhì)量訓(xùn)練數(shù)據(jù)為全球AI部署提供強(qiáng)勁動力。站在大模型技術(shù)爆發(fā)與垂類應(yīng)用落地的關(guān)鍵節(jié)點(diǎn),澳鵬Appen將持續(xù)致力于為AI應(yīng)用開發(fā)和落地打造堅實的數(shù)據(jù)基石,助力中國大模型產(chǎn)業(yè)在通用與垂直領(lǐng)域?qū)崿F(xiàn)協(xié)同突破。