九九九中文无码A∨|亚洲国产成人最新精品|国产AV无码精品色午夜|国产精品久久久久三级无码|日韩欧美一区国产二区在线|欧美另类精品一区二区三区|精品一区二区三区毛片视频网|中文字幕日韩精品一区二区三区

中國企業(yè)報(bào)集團(tuán)主管主辦

中國企業(yè)信息交流平臺

微博 微信

合合信息亮相CCIG2023:多位大咖共話智能文檔未來,文檔圖像內(nèi)容安全還面臨哪些技術(shù)難題?

2023-05-17 14:46 來源:中國企業(yè)網(wǎng) 次閱讀
 
合合信息亮相CCIG2023:多位大咖共話智能文檔未來,文檔圖像內(nèi)容安全還面臨哪些技術(shù)難題?

  近日,中國圖象圖形大會(CCIG2023)(簡稱“大會”)在蘇州圓滿落幕。本屆大會以“圖象圖形·向未來”為主題,由中國科學(xué)技術(shù)協(xié)會指導(dǎo),中國圖象圖形學(xué)學(xué)會主辦,蘇州科技大學(xué)承辦,特邀譚鐵牛院士、趙沁平院士、吳一戎院士等百余位國內(nèi)外知名學(xué)者,來自代表企業(yè)的技術(shù)專家,共話圖像圖形學(xué)術(shù)研究與技術(shù)創(chuàng)新趨勢,共謀行業(yè)新發(fā)展。

金連文主持《文檔圖像智能分析與處理》論壇


  技術(shù)論壇《文檔圖像智能分析與處理》是本次大會的亮點(diǎn)之一,由華南理工大學(xué)二級教授、中國圖象圖形學(xué)學(xué)會常務(wù)理事金連文擔(dān)任主持,合合信息智能技術(shù)平臺事業(yè)部副總經(jīng)理、高級工程師丁凱博士出席該論壇,并與來自中科院自動化所、北大、中科大的學(xué)術(shù)專家,華為等知名企業(yè)的研究者們,圍繞文檔圖像處理的前沿技術(shù)展開“頭腦風(fēng)暴”,尋找文檔圖像處理領(lǐng)域的未來進(jìn)階方向。

  大模型技術(shù)提升文字識別效率,智能文檔處理難題被突破

  近期,ChatGPT的爆火讓“大模型”技術(shù)進(jìn)入了公眾的視野。隨著人工智能技術(shù)的飛速發(fā)展,作為圖像圖形技術(shù)的重要應(yīng)用場景之一,文檔圖像智能處理逐步應(yīng)用到醫(yī)療、教育等諸多領(lǐng)域,為各行各業(yè)提供更加高效、智能的文檔管理和數(shù)據(jù)分析解決方案,大模型技術(shù)的崛起也為文檔處理帶來了新的機(jī)遇。

  中國科學(xué)院自動化研究所副所長劉成林認(rèn)為,大模型與光學(xué)字符識別(OCR)技術(shù)的結(jié)合,能夠?qū)A繑?shù)據(jù)進(jìn)行理解、處理。具體到實(shí)踐層面,大模型技術(shù)還有可觀的提升空間。從識別性能來說,大模型技術(shù)在場景文本、邏輯版面、文檔問答等方面還有很多工作可以做;此外,大模型的可解釋性、安全度十分重要,還需要研究者們進(jìn)行更為深入的探討。

劉成林就《人工智能大模型時(shí)代的文檔識別與理解》研究課題進(jìn)行分享


  北京大學(xué)鄒月嫻教授認(rèn)為,在與文檔圖像處理技術(shù)密切相關(guān)的OCR領(lǐng)域中,專業(yè)化大規(guī)模的預(yù)訓(xùn)練模型是可行的?!按竽P褪且粋€(gè)大的趨勢,對于小團(tuán)隊(duì)來說做工具是一個(gè)非常好的方法,做工具對大家都是有好處的?!编u月嫻說。

鄒月嫻就《視覺-語言預(yù)訓(xùn)練模型及遷移學(xué)習(xí)方法》研究課題進(jìn)行分享


  華為AI研究員廖明輝提到,企業(yè)作為文檔圖像處理的應(yīng)用方,普遍面臨一個(gè)挑戰(zhàn):當(dāng)有眾多API時(shí),維護(hù)難度較高,急需一個(gè)垂直領(lǐng)域的通用的OCR大模型,能夠覆蓋所有的使用場景。廖明輝認(rèn)為,OCR垂直領(lǐng)域的大模型在數(shù)據(jù)量方面,數(shù)據(jù)的數(shù)量不是最關(guān)鍵的,最關(guān)鍵的是數(shù)據(jù)的多樣性。

  除了引入大模型等新技術(shù)外,如何實(shí)現(xiàn)文檔圖像的智能分析與處理還面臨著諸多來自現(xiàn)實(shí)的挑戰(zhàn)。丁凱博士認(rèn)為,文檔的多樣性和復(fù)雜性是文檔圖像處理中的難點(diǎn):文檔類型和格式繁多,包括報(bào)告、合同、發(fā)票、證明、證件等。不同類型的文檔有不同的格式和布局,例如文檔中常常包含圖片、表格、圖形等各種圖像,難以用統(tǒng)一的方法處理。

丁凱就《智能文檔處理技術(shù)在工業(yè)界的應(yīng)用與挑戰(zhàn)》研究課題進(jìn)行分享


  丁凱提到,文檔圖像中的彎曲、陰影、摩爾紋,字跡不清晰等問題對文檔圖像的識別與處理產(chǎn)生了影響,劉成林也表示,“過去我們只關(guān)注文字,現(xiàn)在文檔中的圖像也十分重要。但是,現(xiàn)有文檔圖像識別技術(shù)在識別精度和可靠性、可解釋性、自適應(yīng)性等方面還有明顯不足,還有很多技術(shù)問題有待解決。”

  值得關(guān)注的是,人工智能大模型的快速發(fā)展為文檔分析與識別帶來了一些機(jī)遇,除了解決識別層次的遺留問題,在性能提升、應(yīng)用拓展上大有可為。合合信息通過ROI提取、干擾去除、形變矯正、圖像恢復(fù)以及圖像增強(qiáng)這一整體架構(gòu)對文檔進(jìn)行智能掃描與識別分析,將文檔圖像的彎曲矯正、摩爾紋去除,圖像質(zhì)量大幅提升。



  除文檔圖像的通用場景外,合合信息對特定垂直場景下的圖像也能進(jìn)行預(yù)處理,針對手寫板圖片中出現(xiàn)的反光問題,通過算法模型對反光進(jìn)行“擦除”。



  由于版面復(fù)雜多變、文本內(nèi)容多樣化等原因,文檔被拍照、掃描成電子文檔過程中時(shí)常出現(xiàn)漏字、錯(cuò)位,合合信息持續(xù)突破版面分析技術(shù)在版面分割、區(qū)域間的邏輯關(guān)系處理等方面的難題,通過智能文字識別、智能圖像處理等核心技術(shù),確定文檔中的文字位置、字體、大小和排版方式等信息,實(shí)現(xiàn)版面的分析和還原。



  文檔篡改檢測技術(shù)為視覺內(nèi)容安全提供保障

  目前,人工智能的合成技術(shù)導(dǎo)致偽造的多媒體信息在網(wǎng)絡(luò)上泛濫成災(zāi),文本圖像顯然是重災(zāi)區(qū)之一。針對資質(zhì)證書、文案、聊天截圖等文本圖像的偽造被用于散播謠言、經(jīng)濟(jì)詐騙、編造虛假新聞,給個(gè)人、社會造成惡劣的負(fù)面影響。圖像內(nèi)容安全是AI安全的重點(diǎn)領(lǐng)域,如可對文本篡改痕跡進(jìn)行精準(zhǔn)檢測,將為圖像內(nèi)容安全提供保障。

  中科大教授謝洪濤指出,隨著基于深度學(xué)習(xí)的偽造與取證技術(shù)的出現(xiàn),目前文本圖像的真?zhèn)舞b定問題進(jìn)入了攻防博弈階段?!拔谋緢D像的篡改生成視覺質(zhì)量高、字體風(fēng)格統(tǒng)一、背景紋理協(xié)調(diào)、篡改字跡清晰,文本圖像的篡改檢測可以說是‘道高一尺、魔高一丈’,適應(yīng)多種篡改方法、多域空間感知、區(qū)域文理區(qū)分、時(shí)間復(fù)雜度適中?!敝x洪濤表示。

謝洪濤就《篡改文本圖像的生成與檢測》研究課題進(jìn)行分享


  謝洪濤所在的課題組正在探索基于文本筆跡的文本圖像生成,以及基于頻域關(guān)系的局部紋理差異性建模,最終實(shí)現(xiàn)高質(zhì)量的場景文本圖像篡改生成、準(zhǔn)確的場景文本圖像篡改檢測。相關(guān)研究可應(yīng)用于文本圖像的多個(gè)領(lǐng)域,例如文檔圖像、自然場景圖像、票據(jù)圖像等。

  合合信息在文檔圖像內(nèi)容安全領(lǐng)域也進(jìn)行了深入的部署。據(jù)丁凱介紹,合合信息研發(fā)了基于深度學(xué)習(xí)的圖像篡改檢測技術(shù)及相關(guān)系統(tǒng),通過學(xué)習(xí)圖像被篡改后統(tǒng)計(jì)特征的變化,該系統(tǒng)智能捕捉圖像在篡改過程中留下的細(xì)微痕跡,可檢測出復(fù)制粘貼、拼接、擦除等多種篡改形式,讓人工智能準(zhǔn)確識別出圖片篡改的不同類型,并進(jìn)行針對性的處理,提升識別精度和場景通用性。據(jù)悉,合合信息圖像篡改檢測技術(shù)已被銀行、保險(xiǎn)、制造業(yè)等多個(gè)行業(yè)引入。

  作為一家人工智能企業(yè),合合信息依托智能文檔處理技術(shù),對復(fù)雜場景下的多版式、多語種文字內(nèi)容進(jìn)行精準(zhǔn)提取,打造的合同機(jī)器人、財(cái)報(bào)機(jī)器人及行業(yè)解決方案,已在金融、政務(wù)、制造、物流等30個(gè)行業(yè)落地,服務(wù)的世界500強(qiáng)公司超過80家。未來,合合信息將持續(xù)為全球C端用戶和多元行業(yè)B端客戶提供數(shù)字化、智能化的產(chǎn)品及服務(wù),促進(jìn)AI技術(shù)在文檔處理領(lǐng)域的應(yīng)用落地與信息安全保障。

點(diǎn)贊()
上一條:升級“四化一體”,海信生物樣本庫智慧安全存儲方案首秀CMEF2023-05-17
下一條:浦東張江依托上海數(shù)據(jù)交易所打造千億級數(shù)據(jù)要素核心產(chǎn)業(yè)2023-05-17

相關(guān)稿件

亮相CCIG2022,合合信息以智能文字識別技術(shù)挑戰(zhàn)傳統(tǒng)OCR應(yīng)用難題 2022-08-24
如何提升智能文檔處理識別精度?合合信息“版面分析”實(shí)現(xiàn)新突破 2023-04-13
清華“博士團(tuán)”齊聚合合信息,共話人工智能技術(shù)應(yīng)用未來 2023-04-04
大咖云集 共話未來!神州新希望受邀2023南陽生殖免疫高峰論壇 2023-04-12
中國圖象圖形學(xué)學(xué)會牽手合合信息舉辦“CSIG企業(yè)行”活動,共探圖文智能處理技術(shù)與多場景應(yīng)用發(fā)展 2023-03-22
國務(wù)院國有資產(chǎn)管理委員會 中國企業(yè)聯(lián)合會 中國企業(yè)報(bào) 中國社會經(jīng)濟(jì)網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財(cái)經(jīng) 鳳凰財(cái)經(jīng) 中國報(bào)告基地 企業(yè)社會責(zé)任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機(jī)網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟(jì)新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟(jì)網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟(jì)網(wǎng) 華訊財(cái)經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志 借貸撮合網(wǎng) 大公財(cái)經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報(bào)道 金融界 中國農(nóng)業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟(jì)網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報(bào)道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團(tuán) 中國保利集團(tuán)公司 東風(fēng)汽車公司 中國化工集團(tuán)公司 中國電信集團(tuán)公司 華為技術(shù)有限公司 廈門銀鷺食品有限公司 中國恒天集團(tuán)有限公司 濱州東方地毯集團(tuán)有限公司 大唐電信科技股份有限公司 中國誠通控股集團(tuán)有限公司 喜來健醫(yī)療器械有限公司 中國能源建設(shè)股份有限公司 內(nèi)蒙古伊利實(shí)業(yè)集團(tuán)股份有限公司 中國移動通信集團(tuán)公司 中國化工集團(tuán)公司 貴州茅臺酒股份有限公司