omniture

Parascript智能文檔處理功能又進(jìn)一步

Parascript FormXtra.AI 8.3使用Smart Learning技術(shù),將高級(jí)捕獲所常見的復(fù)雜、耗時(shí)、昂貴和容易出錯(cuò)的活動(dòng)轉(zhuǎn)化為簡(jiǎn)單計(jì)算。
Parascript, LLC
2022-02-16 19:40 3224

科羅拉多州朗蒙特2022年2月16日 /美通社/ -- 提供高性能自動(dòng)化已超過25年、每年處理超過1000億份文件的Parascript今天發(fā)布了新版本的FormXtra.AI,再次擴(kuò)展了對(duì)高性能IDP需求的支持,此次是面向合同等真正非結(jié)構(gòu)性數(shù)據(jù)和其他缺乏統(tǒng)一性的文本密集型文件。

Parascript營(yíng)銷和產(chǎn)品管理副總裁Greg Council表示:“我們不斷聽到合作伙伴和客戶的這樣一種需求:能夠?qū)崿F(xiàn)非結(jié)構(gòu)化文件中數(shù)據(jù)的分析和提取自動(dòng)化,例如貸款文件和健康記錄中的常見數(shù)據(jù)。”

隨著8.3版本的FormXtra.AI發(fā)布,Parascript增加了可訓(xùn)練的、基于語法的文本解析,采用自然語言處理(NLP)技術(shù)來查找通常隱藏在文本段落中的所需信息。由于該功能是Smart Learning的一部分,配置、優(yōu)化和部署同樣可實(shí)現(xiàn)大幅簡(jiǎn)化,從而令客戶受益。以下是部分要點(diǎn):

FormXtra.AI 8.3經(jīng)過增強(qiáng),可處理非結(jié)構(gòu)化文本和手寫內(nèi)容。
什么是非結(jié)構(gòu)性文本? 如果你曾見過保險(xiǎn)單或信用卡協(xié)議的細(xì)則,那些就是非結(jié)構(gòu)化信息。這些重要信息類型不適合采用傳統(tǒng)的數(shù)據(jù)捕獲技術(shù),無法使用位置或關(guān)鍵字來指定它們?cè)陧?yè)面或文檔中的位置。使用新的深度機(jī)器學(xué)習(xí)和NLP技術(shù)作為基礎(chǔ),客戶只需在樣本上標(biāo)記目標(biāo)數(shù)據(jù),系統(tǒng)即可完成其余工作。NLP算法可自動(dòng)分析所提供的示例,解釋目標(biāo)數(shù)據(jù)的類型和背景,根據(jù)目標(biāo)字段的位置類型、價(jià)值格式和其他特性選擇最佳訓(xùn)練方案,并學(xué)習(xí)如何可靠地定位文檔上的類似數(shù)據(jù)。對(duì)于用戶來說,這意味著Parascript可極大地?cái)U(kuò)展能夠使用FormXtra.AI處理的應(yīng)用程序類型和文檔范圍。

SignatureXpert.AI可與FormXtra.AI 8.3全面集成。
SignatureXpert.AI 是基于圖像分析和模式識(shí)別中最具創(chuàng)新性的人工智能(AI)方法和途徑的下一代產(chǎn)品,在超過15年的簽名定位和驗(yàn)證經(jīng)驗(yàn)基礎(chǔ)上發(fā)展而成。這為多種簽名驗(yàn)證任務(wù)帶來了真正徹底轉(zhuǎn)型、優(yōu)于人類的精密自動(dòng)化。SignatureXpert.AI的適用文件分辨率范圍十分廣泛(96dpi–300dpi),并可成功地在任何類型的文檔中定位目標(biāo)簽名,包括那些除了實(shí)際簽名之外還有手寫數(shù)據(jù)的文檔。

其他提升和改進(jìn)包括:

  • 針對(duì)包含手寫字段的文檔增加了自動(dòng)頁(yè)面生成。FormXtra.AI的一些功能可以把配置數(shù)據(jù)提取相關(guān)的艱巨任務(wù)變得非常簡(jiǎn)單,只需按下一個(gè)按鈕即可完成。自動(dòng)頁(yè)面生成功能現(xiàn)已擴(kuò)展,可運(yùn)用于手寫文檔。用戶只需導(dǎo)入頁(yè)面圖像樣本,以及其中目標(biāo)字段的相關(guān)正確值,其余的工作將由軟件完成。
  • 為即用型定義集合添加加拿大發(fā)票等預(yù)定義文檔。這提高了產(chǎn)品的可用性和用戶友好性,因?yàn)樗鼮閺V泛使用的通用文檔類型提供了一個(gè)經(jīng)過調(diào)整的即用型解決方案。
  • 針對(duì)多種字段類型數(shù)量、首字母縮寫、日期、信用卡號(hào)碼、VIN號(hào)碼等)改進(jìn)并增強(qiáng)了定位和識(shí)別功能,從而提高了處理這些字段的工作效率和靈活性。由于格式多樣、背景廣泛、解釋含混等原因,這些字段不容易定位和讀取。處理包含這些字段的文檔可能非常具有挑戰(zhàn)性,因?yàn)檫@些文檔具有布局多樣、質(zhì)量欠佳、背景復(fù)雜等特點(diǎn)。
消息來源:Parascript, LLC
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
關(guān)鍵詞: 電腦/電子
collection