分享到:
发表于 2016-08-05 13:19:53 楼主 | |
现如今网络化时代,图书馆、报社及出版社都加快了纸质文档资源的数字化、网络化的发展,产生了大量的电子文档、音频及视频等数字信息,从形式到内容上都极大的丰富了图书馆或报社、出版社的资源。面对这些海量的资源,如何更好的利用,发掘出这些资源的价值,成为这些单位面临的一个重要问题。本文将介绍文通的一种利用OCR技术进行文档、书籍资源开发、利用的方式。 1、OCR技术文献数字化: 基于OCR技术的文字识别软件,可以将通过摄像机、扫描仪等光学输入方式得到的报刊、书籍、文稿、表格等印刷品的图像信息转化为可供计算机识别和处理的文本信息。与传统录入方式相比,OCR技术极大的提高了资料存储、检索、加工的效率。 2、OCR技术的特点: 与传统的手工资料录入方式相比,文通文字识别软件有以下优势: (1)效率高,其速度是人工录入的上百倍甚至上千倍; (2)经济性好,大大节约了录入人员的开销; (3)准确性更高,根据数据统计显示,OCR录入方式的准确率远高于人工录入。 3、OCR的技术支持,文字识别软件 以清华光学字符识别TH-OCR为核心开发的文字识别软件--TH-OCR数据录入工厂,同时还提供文档影像技术和应用解决方案,为文档影像技术的发展做出了很大的贡献。 集字校对 TH-OCR文字识别软件采用UNICODE国际编码标准,内置最新研发的高性能文字识别引擎,中文识别率达99.8%以上。英文、日文、韩文的识别率居世界领先水平。 同时还具有版面还原、集字校对、自学习特殊文字、双层PDF批量制作等实用功能,是目前市场上最好用的文字识别、处理软件,广泛应用于图书馆、电力行业、出版社、报社、政府机关,为用户带来极大的便利,并大大提升了他们的工作效率。 |
|
楼主热贴
个性签名:无
|
针对ZOL星空(中国)您有任何使用问题和建议 您可以 联系星空(中国)管理员 、 查看帮助 或 给我提意见