韩国电影午夜理伦三级,日韩国产网曝欧美第一页,新加坡乱伦一级片

我國傳統(tǒng)蒙古文印刷體文字識別軟件研究取得重大進展

發(fā)布日期：2016-11-30??來源：互聯(lián)網(wǎng)??作者：紙引未來??瀏覽次數(shù)：522

核心提示：

我國傳統(tǒng)蒙古文印刷體文字識別軟件(OCR)研究取得重大進展。據(jù)其研發(fā)者烏日力嘎博士向新華網(wǎng)內(nèi)蒙古頻道獨家披露，目前OCR軟件對蒙古文白體的識別率已達到99%以上，對鉛印版的識別率也達到95%以上。

隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們共享信息的一個大平臺。“在信息共享的大平臺之中，蒙古文信息的傳播因為數(shù)字化處理的識別限制，變得極為繁瑣和無奈。”畢業(yè)于內(nèi)蒙古大學(xué)的烏日力嘎博士直言不諱。

“傳統(tǒng)蒙古文有大量的圖書、報刊，但其中很多都沒有實現(xiàn)數(shù)字化，”烏日力嘎博士介紹說，高效數(shù)字化需要OCR(Optical Character Recognition)軟件自動識別掃描或拍照的圖片，將圖片中的文字轉(zhuǎn)換成文本。

據(jù)了解，本世紀初伊始，就陸續(xù)有科研機構(gòu)、相關(guān)公司嘗試開發(fā)傳統(tǒng)蒙古文自動識別軟件，但因為識別準確率不高、操作繁瑣等諸多原因，使用者至今未能等到可廣泛使用和可信賴的產(chǎn)品。烏日力嘎博士卻憑借自己的執(zhí)著追求和一己之力，用不到兩年時間完成了這一傳統(tǒng)蒙古文印刷體OCR。

“讀博士期間研究機器翻譯，機器翻譯需要大量的語言資源，但是蒙古文的資源特別少，我們在建立語言數(shù)據(jù)庫時需要大量的人力、時間和經(jīng)費，”烏日力嘎博士說：“從那個時候起，我就萌發(fā)一個念頭，自己是否也試著研發(fā)一款高精度的蒙古文自動識別系統(tǒng)。”

2015年夏天博士畢業(yè)之后，烏日力嘎開始全身心地投入到傳統(tǒng)蒙古文OCR軟件的開發(fā)之中，她參考了國內(nèi)外大量學(xué)術(shù)文獻，并使用深度學(xué)習(xí)和語言模型等高新技術(shù)，在短時間內(nèi)成功研發(fā)出了蒙古文高精度自動識別軟件。據(jù)介紹，這一軟件的優(yōu)勢是既能識別掃描圖片，又能識別拍照的圖片，并且將打字和校對的功能融為一體。

“上世紀90年代以前的書本都是鉛印版本，但目前還沒有其他可以把鉛印版轉(zhuǎn)換成文本的軟件，而烏日力嘎博士研究的軟件優(yōu)勢是能識別鉛印版，并且有承前啟后的作用，”內(nèi)蒙古大學(xué)教授那順烏日圖認為，烏日力嘎研究的軟件理論上有創(chuàng)新，這一軟件結(jié)合語言規(guī)則和統(tǒng)計方法，再利用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等新技術(shù)來完成的。因為以前的OCR軟件是基于規(guī)則或者是基于統(tǒng)計的方法來實現(xiàn)的，他們最終效果都不理想。

烏日力嘎最后表示，希望她所開發(fā)的這款軟件能為廣大的蒙古語言文字工作者帶來更多的工作上的便利。

• 什么是電容器紙？哪里有電容器紙批發(fā)？電容器紙	• 什么是浸漬紙？浸漬紙的用途是什么？浸漬紙的
• 什么是復(fù)合紙？復(fù)合紙的價格復(fù)合紙批發(fā)	• 什么是絕緣紙？絕緣紙有什么用途？
• 什么是試紙？試紙的用途是什么？	• 什么是試紙？試紙的用途是什么？
• 什么是純質(zhì)紙？純質(zhì)紙和膠版紙的區(qū)別是什么	• 什么是白底白紙？白底白紙和灰底白紙的區(qū)別
• 因為兩件事沒做好，一家印刷廠將被罰款40萬	• 哪里有新聞紙批發(fā)？新聞紙行情如何？

推薦商家

推薦商家

推薦商家

推薦商家

我國傳統(tǒng)蒙古文印刷體文字識別軟件研究取得重大進展