在推进电子政务的过程中,最让政府信息管理部门领导头痛的问题就是,之前存储的海量资料很多是以PDF为格式的。PDF固然具有许多其他电子文档格式无法相比的优点,但从本质上讲,作为一种“图像”格式,它的“只读”特性导致了文件只能“看”,却无法进行文本编辑和拷贝,PDF文档之间也无法相互检索。如何将这诸多PD
利用现代信息技术来进行行政管理成为必然趋势,其中办公自动化(OA)、办公“无纸化”则是电子政务的主要目标之一,实现文档电子化和处理自动化将是政府办公领域的一个巨大进步。针对政府面临的大量PDF文档转换为文本文档的困境,汉王科技近日推出了“汉王PDF图像OCR识别系统”,该系统是为政府办公信息化建设量身打造,无缝整合了PDF文档录入、图像处理、版面分析识别和文本转换的全过程,可以整合不同机构、部门的分类信息,打破传统行政机关时间、空间和部门分隔的制约,使各级政府的各项监管工作更加严密,服务更加便捷,为海量信息的交叉检索、深度内容的进一步发掘和开拓打开了更为广阔的天地。
汉王科技副总裁李志峰认为,该系统的推出使得政府机构中大量PDF格式文档无法编辑、拷贝和检索的问题迎刃而解,必将被广泛应用于我国的各级政府机构。