首页 | 注册 | 登陆 | 网站繁體 | 手机版 | 设为首页 娴犲﹤銇夐弰锟�2025楠烇拷4閺堬拷30閺冿拷 閺勭喐婀�绔 閻滄澘婀弮鍫曟?閺勶拷17:43:34    閻熺偟鎲哄鎻掑毉閻拷5530婢讹拷8鐏忓繑妞�18閸掞拷34缁夛拷  缁佹繃鍔规禒鏍т淮鎼村嘲鎻╂稊鎰灇闂€鍖$磼

您的位置:长沙社区通 > 新闻 > 国内 > 科技 > 内蒙古大学博士毕业生研发出一款传统蒙古文印刷体文字识别软件
内蒙古大学博士毕业生研发出一款传统蒙古文印刷体文字识别软件
网址:www.cssqt.com 编辑:长沙社区通 时间:2016-12-05 253

  日前,内蒙古大学2015届博士乌日力嘎完成了一款传统蒙古文印刷体文字识别系统软件的研发。 

  据其研发者乌日力嘎博士披露,目前她研发的这款软件对蒙古文白体的识别率已达到99%以上,对铅印版的识别率也达到95%以上。“传统蒙古文有大量的图书、报刊,但其中很多都没有实现数字化,”乌日力嘎博士介绍说,高效数字化需要OCR(Optical Character Recognition)软件自动识别扫描或拍照的图片,将图片中的文字转换成文本。 

  乌日力嘎在内蒙古大学读博士期间研究机器翻译,机器翻译需要大量的语言资源,但是蒙古文的资源特别少,我们在建立语言数据库时需要大量的人力、时间和经费。于是,她萌发一个念头——“自己是否也试着研发一款高精度的蒙古文自动识别系统。”2015年夏天博士毕业后,乌日力嘎开始全身心地投入到传统蒙古文OCR软件的开发之中,她参考了国内外大量学术文献,并使用深度学习和语言模型等高新技术,在短时间内成功研发出了蒙古文高精度自动识别软件。据介绍,这一软件的优势是既能识别扫描图片,又能识别拍照的图片,并且将打字和校对的功能融为一体。 

  “上世纪90年代以前的书本都是铅印版本,但目前还没有其他可以把铅印版转换成文本的软件,而乌日力嘎博士研究的软件优势是能识别铅印版,并且有承前启后的作用,”内蒙古大学教授那顺乌日图认为,乌日力嘎研究的软件理论上有创新,这一软件结合语言规则和统计方法,再利用深度学习和神经网络等新技术来完成的。因为以前的OCR软件是基于规则或者是基于统计的方法来实现的,他们最终效果都不理想。 

  乌日力嘎表示,希望她所开发的这款软件能为广大的蒙古语言文字工作者带来更多的工作上的便利。

TAGS:科技 | 新闻转载:长沙社区通
顶一下
(0)
踩一下
(0)
最新评论     查看全部评论     发表评论
闁烩晝枪閸櫻呮嫚閸曨噮鍟堥柣銏犲綁缁剟鎯勭粙鍨綘闁告ḿ鍠庡ú婊堝汲閸屾稒顦ч柛蹇斿▕濡拷
发表评论
·网友评论仅供网友表达个人看法,并不表明网站同意其观点或证实其描述。
·请注意语言文明,尊重网络道德,并承担一切因您的行为而直接或间接引起的法律责任。
·长沙社区通管理员有权保留或删除其管辖留言中的任意非法内容。

更多>>长沙常用电话

閻愮懓鍤崗鎶芥4
闂傤噣顣介崣宥夘洯
閻愮懓鍤潻鏂挎礀妞ゅ爼鍎�
瀵懓鍤粣妤€褰涢弽鍥暯