近日,捷通華聲宣布靈云智能開(kāi)放平臺(tái)(hcicloud.ocm)多語(yǔ)種OCR識(shí)別能力服務(wù)進(jìn)入試運(yùn)營(yíng)階段,開(kāi)始提供包括中文、英文、德文、法文、俄文、西班牙文、意大利文等十幾個(gè)國(guó)家語(yǔ)言文字的自動(dòng)識(shí)別服務(wù)。此次靈云多語(yǔ)種OCR能力的發(fā)布,也是繼靈云平臺(tái)推出13種語(yǔ)言的靈云語(yǔ)音合成、93種語(yǔ)言的靈云手寫(xiě)識(shí)別技術(shù)能力之后,靈云平臺(tái)服務(wù)多國(guó)語(yǔ)言方面所取得的最新進(jìn)展。
作為中國(guó)人工智能領(lǐng)域的領(lǐng)軍企業(yè),捷通華聲自2000年開(kāi)始堅(jiān)持自主研究智能語(yǔ)音、圖像等人工智能技術(shù),并不斷在OCR、手寫(xiě)識(shí)別等智能圖像技術(shù)領(lǐng)域取得突破。近年來(lái),靈云OCR在掃描識(shí)別領(lǐng)域異軍突起,以接近100%的中英文識(shí)別率和優(yōu)質(zhì)的版面分析能力獲得了產(chǎn)業(yè)內(nèi)廣大用戶的認(rèn)可,為企業(yè)大幅減少了人工文字錄入工作量、提高了文檔編輯和搜索的效率。伴隨經(jīng)濟(jì)全球化的進(jìn)展,人工智能技術(shù)在多語(yǔ)言環(huán)境中的應(yīng)用需求越來(lái)越迫切。捷通華聲順應(yīng)產(chǎn)業(yè)發(fā)展趨勢(shì),在加大多語(yǔ)言人工智能技術(shù)研究的基礎(chǔ)上,依托靈云智能開(kāi)放平臺(tái)以開(kāi)放、合作、共贏的戰(zhàn)略發(fā)展思路,與國(guó)內(nèi)外頂尖人工智能研究機(jī)構(gòu)、企業(yè)開(kāi)展廣泛合作,全面為中國(guó)企業(yè)提供多語(yǔ)言人工智能技術(shù)能力服務(wù)。此次上線的多語(yǔ)種OCR,可以幫助企業(yè)與廣大用戶將德文、法文、俄文、西班牙文、意大利文等不同國(guó)家語(yǔ)言的文件、書(shū)籍、報(bào)紙、雜志等檔案數(shù)字化,生成便于傳輸和管理的PDF文件,將有力促進(jìn)國(guó)內(nèi)企業(yè)參與國(guó)際交流。
自靈云智能開(kāi)放平臺(tái)(hcicloud.ocm)2011年推出靈云OCR以來(lái),不僅面向廣大用戶提供直接文字識(shí)別服務(wù),同時(shí)針對(duì)金融,能源,交通,政府,企業(yè)等領(lǐng)域企業(yè)戶提供定制化服務(wù)。靈云OCR通過(guò)匹配圖像中的關(guān)鍵信息來(lái)自動(dòng)確認(rèn)圖像種類(lèi),獲得更加準(zhǔn)確的識(shí)別結(jié)果。目前靈云OCR已實(shí)現(xiàn)對(duì)身份證,駕駛證、行駛證、增值稅發(fā)票,銀行卡號(hào)、名片等各類(lèi)證照、票據(jù)、表單的識(shí)別。針對(duì)特殊需求,靈云OCR還可以提供特殊定制功能,針對(duì)用戶的圖像種類(lèi)進(jìn)行模板定制,實(shí)現(xiàn)“一種核心,多類(lèi)圖像”的應(yīng)用效果,尤其是在各大銀行,證劵、保險(xiǎn)公司,能源、電信、醫(yī)療、政府等辦公營(yíng)業(yè)廳的應(yīng)用中,已成功實(shí)現(xiàn)人證統(tǒng)一、票據(jù)電子化、無(wú)紙化辦公等功能,極大節(jié)省了大眾用戶辦理業(yè)務(wù)的等待時(shí)間,也極大節(jié)省了企業(yè)業(yè)務(wù)成本,提高了辦公效率,并通過(guò)減少大量復(fù)印以符合綠色環(huán)保辦公的新趨勢(shì)。
靈云OCR支持掃描儀、手機(jī)、照相機(jī)、攝像機(jī)、高拍儀等各種圖像掃描、拍照設(shè)備,并兼容市場(chǎng)的主流業(yè)務(wù)系統(tǒng)。在各種系統(tǒng)應(yīng)用中,靈云OCR在確保原業(yè)務(wù)系統(tǒng)穩(wěn)定性和安全性的同時(shí),也可借助自學(xué)習(xí)功能不斷豐富字符/圖像特征庫(kù),從而提高自身在識(shí)別時(shí)對(duì)圖像的適應(yīng)能力。除了企事業(yè)辦公以外,人們生活的方方面面也因靈云OCR技術(shù)的廣泛應(yīng)用而更加的生動(dòng)有趣。目前,用戶已經(jīng)可以用手機(jī)、數(shù)碼相機(jī)或DV拍照名片等紙質(zhì)資料,并利用靈云OCR軟件識(shí)別轉(zhuǎn)換成可編輯的電子資料。可以想象,日后靈云OCR的應(yīng)用場(chǎng)景將會(huì)越來(lái)越廣泛,使用也將會(huì)越來(lái)越便捷。
靈云平臺(tái)此次推出多語(yǔ)種OCR也標(biāo)示著靈云平臺(tái)在實(shí)施面向國(guó)際、全面提供人工智能服務(wù)戰(zhàn)略規(guī)劃中,完成了第三步重要舉措。作為國(guó)內(nèi)唯一全方位人工智能云服務(wù)開(kāi)放平臺(tái),靈云平臺(tái)囊括了語(yǔ)音合成(TTS)、語(yǔ)音識(shí)別(ASR)、手寫(xiě)識(shí)別(HWR)、光學(xué)字符識(shí)別(OCR)、自然語(yǔ)言理解(NLU)以及機(jī)器翻譯(MT)等多項(xiàng)人工智能能力,全方位賦予計(jì)算機(jī)思維和感官能力,使人與機(jī)器的溝通更加簡(jiǎn)單自然。2012年,靈云平臺(tái)在手寫(xiě)識(shí)別領(lǐng)域邁出了國(guó)際化道路上第一步:推出覆蓋全球92種語(yǔ)言的靈云手寫(xiě)識(shí)別技術(shù),此舉標(biāo)志著我國(guó)手寫(xiě)識(shí)別技術(shù)已經(jīng)達(dá)到國(guó)際領(lǐng)先水平!2013年,靈云平臺(tái)繼提供中文普通話、粵語(yǔ)、維吾爾語(yǔ)、英語(yǔ)服務(wù)之后,開(kāi)始提供德語(yǔ)、法語(yǔ)、日語(yǔ)、韓語(yǔ)等13種語(yǔ)言的靈云語(yǔ)音合成技術(shù),為需要多國(guó)語(yǔ)言服務(wù)的中國(guó)企業(yè)提供了最豐富、最有力的智能語(yǔ)音能力支撐,邁出了靈云智能開(kāi)放平臺(tái)助力中國(guó)企業(yè)開(kāi)拓國(guó)際市場(chǎng)、支持參與國(guó)際競(jìng)爭(zhēng)的跨越之步。
捷通華聲在全面推動(dòng)中國(guó)人工智能產(chǎn)業(yè)發(fā)展的進(jìn)程中,靈云平臺(tái)得到了清華大學(xué)的鼎力支持。捷通華聲與清華大學(xué)人工智能重點(diǎn)實(shí)驗(yàn)室在圖像識(shí)別、語(yǔ)音交互、語(yǔ)義理解等人工智能技術(shù)領(lǐng)域全面展開(kāi)合作,在不斷完善OCR多樣化應(yīng)用的同時(shí),也在為研發(fā)更豐富的圖像識(shí)別技術(shù)而努力,并將很快推出人臉識(shí)別等更多元化的圖像識(shí)別技術(shù),保證靈云平臺(tái)擁有更加全面的“視覺(jué)與感觀”能力。
靈云智能開(kāi)放平臺(tái)(hcicloud.ocm)自2011年推出以來(lái),已經(jīng)為金融、電信、醫(yī)療、交通、能源、教育、醫(yī)療、政府等各個(gè)領(lǐng)域的用戶提供人工智能技術(shù)服務(wù),并以“云+端”的服務(wù)方式為百度導(dǎo)航、搜狗地圖、京東商城、網(wǎng)易有道、滴滴打車(chē)、天行聽(tīng)書(shū)、天行輸入法等數(shù)千款移動(dòng)應(yīng)用提供支持,為超過(guò)3億社會(huì)大眾提供服務(wù)。此次靈云多語(yǔ)種OCR的推出將進(jìn)一步加強(qiáng)靈云與企業(yè)間的合作,為中國(guó)企業(yè)向國(guó)際化拓展提供更為有力的支持。未來(lái)發(fā)展,捷通華聲靈云平臺(tái)將在發(fā)揮靈云OCR等智能技術(shù)優(yōu)勢(shì)的基礎(chǔ)上加強(qiáng)與清華大學(xué)深度合作,不斷推出識(shí)別率更高、更寬廣的智能圖像識(shí)別技術(shù)與解決方案,為廣大企業(yè)與用戶提供人工智能技術(shù)服務(wù),共同實(shí)現(xiàn)“靈云科技 源自清華 服務(wù)全球”的戰(zhàn)略發(fā)展規(guī)劃!