在數(shù)字經(jīng)濟(jì)浪潮中,數(shù)據(jù)就像“工業(yè)血液”的石油一樣,其記錄、存儲(chǔ)、分析和應(yīng)用的范圍及規(guī)模前所未有,成為企業(yè)生存發(fā)展的核心驅(qū)動(dòng)力。作為 “五大生產(chǎn)要素”之一,數(shù)據(jù)不僅是推動(dòng)經(jīng)濟(jì)增長(zhǎng)的新引擎,更是促進(jìn)企業(yè)提升競(jìng)爭(zhēng)力的關(guān)鍵資源。然而隨著企業(yè)數(shù)據(jù)量的爆發(fā)式增長(zhǎng),尤其是非結(jié)構(gòu)化數(shù)據(jù)的激增,如何高效訪(fǎng)問(wèn)、精準(zhǔn)查詢(xún)、智能管理這些數(shù)據(jù),成為釋放數(shù)據(jù)價(jià)值、加速數(shù)據(jù)要素化、市場(chǎng)化進(jìn)程的重大挑戰(zhàn)。
遠(yuǎn)光軟件憑借其在光學(xué)字符識(shí)別(OCR)與深度學(xué)習(xí)算法領(lǐng)域的深厚積累,自主研發(fā)了融合NLP和大模型技術(shù)的圖文識(shí)別智能底座。這一智能底座具有自學(xué)習(xí)、精準(zhǔn)識(shí)別、智能數(shù)據(jù)提取的能力,能以標(biāo)準(zhǔn)類(lèi)及定制類(lèi)服務(wù)全方位滿(mǎn)足各類(lèi)業(yè)務(wù)場(chǎng)景下的文件處理、分類(lèi)與信息提取等需求,顯著提升業(yè)務(wù)處理的自動(dòng)化、智能化水平。
通用場(chǎng)景:豐富的專(zhuān)有模型,更全面的通用票卡證識(shí)別
遠(yuǎn)光軟件在長(zhǎng)期服務(wù)央國(guó)企的過(guò)程中,沉淀了豐富的票據(jù)、卡證、表格等識(shí)別模型,如數(shù)電票、增值稅發(fā)票、定額發(fā)票、機(jī)打發(fā)票、財(cái)政票據(jù)、營(yíng)業(yè)執(zhí)照、完稅證明等超過(guò)36種。這些識(shí)別模型支持多種文件格式(JPG、PNG、PDF、OFD等)的識(shí)別、分類(lèi)、關(guān)鍵字抽取等場(chǎng)景??稍跇I(yè)務(wù)現(xiàn)場(chǎng)通過(guò)公有云、私有云、一體機(jī)、邊緣設(shè)備等快速部署,開(kāi)箱即用,快速滿(mǎn)足財(cái)務(wù)、營(yíng)銷(xiāo)、物資、設(shè)備、運(yùn)行等多個(gè)領(lǐng)域業(yè)務(wù)場(chǎng)景對(duì)通用票證結(jié)構(gòu)化數(shù)據(jù)提取需求。
定制場(chǎng)景:內(nèi)置自研識(shí)別模型,識(shí)別更高效
遠(yuǎn)光圖文識(shí)別智能底座集數(shù)據(jù)管理、流程化標(biāo)注、自動(dòng)模型訓(xùn)練、模型評(píng)估、應(yīng)用發(fā)布為一體,內(nèi)置自主研發(fā)的表格、圖像等識(shí)別模型,融入先進(jìn)的模板學(xué)習(xí)和文本分析提取技術(shù),支持版式文件類(lèi)、文檔流類(lèi)、界面截圖類(lèi)文件的分析和識(shí)別,提供非固定版式票據(jù)信息提取、表格信息識(shí)別檢索、附件快速分類(lèi)分揀、附件材料完整性檢查、文檔信息定位抽取、文檔內(nèi)容基礎(chǔ)推理計(jì)算、簽字蓋章快速檢測(cè)定位等能力,打造從附件分類(lèi)、材料完整性檢查到文檔內(nèi)容推理計(jì)算的一站式解決方案。同時(shí),通過(guò)服務(wù)接口方式,輕松賦能其他應(yīng)用,加速業(yè)務(wù)創(chuàng)新。
大模型加持:泛化及擴(kuò)展能力更強(qiáng)勁
區(qū)別于傳統(tǒng)OCR的“硬編碼”方式,遠(yuǎn)光圖文識(shí)別智能底座創(chuàng)新性地融入大語(yǔ)言模型?;诙嗄瓿恋淼脑獢?shù)據(jù)集對(duì)大語(yǔ)言模型進(jìn)行微調(diào),增強(qiáng)大語(yǔ)言模型對(duì)單據(jù)、卡證、表單等業(yè)務(wù)理解和推理能力,并通過(guò)合理設(shè)計(jì)提示詞工程優(yōu)化識(shí)別提取結(jié)果,實(shí)現(xiàn)信息提取的高效與精準(zhǔn),從而有效克服傳統(tǒng)OCR泛化能力差、實(shí)現(xiàn)成本高的問(wèn)題,提升系統(tǒng)的靈活性與擴(kuò)展性。
延伸場(chǎng)景:軟硬一體,信息采集更智能
遠(yuǎn)光軟件圖文識(shí)別智能底座將訓(xùn)練達(dá)標(biāo)后的識(shí)別模型以服務(wù)包的方式封裝于遠(yuǎn)光靈識(shí)設(shè)備,通過(guò)即插即用模式為業(yè)務(wù)前端智能設(shè)備提供通用票據(jù)、定制表單、合同、卡證等電子文件的結(jié)構(gòu)化信息提取,實(shí)現(xiàn)信息智能化采集,支撐業(yè)務(wù)處理和決策,充分發(fā)揮數(shù)據(jù)價(jià)值。
遠(yuǎn)光圖文識(shí)別智能底座與智能票據(jù)協(xié)同終端協(xié)同,構(gòu)建軟硬一體智能化識(shí)別、查驗(yàn)、審核解決方案。在智能票據(jù)協(xié)同終端批量掃描紙質(zhì)文件后,由圖文識(shí)別智能底座進(jìn)行結(jié)構(gòu)化數(shù)據(jù)提取,通過(guò)RPA或API方式將提取的結(jié)構(gòu)化數(shù)據(jù)與線(xiàn)上系統(tǒng)或電子表格已有數(shù)據(jù)進(jìn)行核對(duì),實(shí)時(shí)展示差異數(shù)據(jù),實(shí)現(xiàn)線(xiàn)下與線(xiàn)上數(shù)據(jù)智能核驗(yàn)。該方案已廣泛應(yīng)用于營(yíng)銷(xiāo)銷(xiāo)戶(hù)退費(fèi)檢驗(yàn)、青苗補(bǔ)償審核、勞務(wù)費(fèi)發(fā)放核驗(yàn)、增值稅專(zhuān)用發(fā)票抵扣聯(lián)核驗(yàn)、項(xiàng)目決策清單核驗(yàn)等業(yè)財(cái)融合場(chǎng)景,有效減輕重復(fù)工作負(fù)擔(dān),規(guī)避人工誤核、漏核造成的財(cái)務(wù)風(fēng)險(xiǎn),提升審核質(zhì)量與效率。
相關(guān)稿件