浙江省工商管理局OA系统实施方案

2007-01-01     推荐:8733620    收藏:5651152    评论:0     来源:e800企业软件频道
  一、项目背景

  浙江省工商管理局OA系统是基于Lotus Notes开发的,于2000年开始正式运行。在全省范围内共有103个下属机关使用这套系统。

  系统中的公文录入、流转、显示部分一直不能很好的满足用户的需求,本项目的目标就是对这一功能模块进行修改和补充,使系统在这一部分的不足得到改变,从而更好地为用户服务。

  二、用户需求

  现有的系统对公文录入方面有两种方式。第一种方式是将公文中的文字输入到系统中,系统对文字的格式有一定的控制,基本上可以按照公文的原样进行显示。但是文字本身的可信度得不到保证;第二种方式是对公文进行扫描,并将所得的JPG格式的彩色图像文件加入到系统中,用户在查看时看到的是公文的图像。由于JPG格式本身的局限所致,图像显示时有不够清晰、不能同时显示所有页,查看不方便等弊端。而关于公文本身的一些关键字段信息,如发文单位、公文字号、标题等信息均要靠手工录入。

  事实上,用户对公文浏览方面的需求是两方面的。一方面希望能得到公文的文字,便于进行对正文的全文检索,以及对这些文字的便捷的引用;另一方面希望能看到公文的原始图像,这样可以提高系统中对于公文描述的可信度,同时图像中保留了公文中的红头和红章,因此更加符合用户的日常对公文的使用习惯,但是图像还要有足够好的显示效果。

  因此,用户希望能有一个好的解决方案来解决上述的问题。具体的说有如下的几点:

  1. 支持高速扫描仪,进行公文图像的快速扫描。

  2. 可以对公文进行全文识别,并提供正文文字。

  3. 自动提取公文中的关键字段信息。

  4. 提供公文的原图像,并要求对图像进行适当的处理,提高其显示效果,并支持多页显示。

  5. 提供文字和图像的对应关系,便于用户进行对照浏览。

  6. 可对系统中已有的公文图像进行加工,使之能够满足用户新的需求。

  7. 系统需要的改动尽量要少。

  三、解决方案

  鉴于上述的系统现状和用户需求,本项目拟采用《公文高速录》软件作为公文录入的工具,对公文进行扫描、识别、校对等处理后,将关键字段信息保存为XML文件,将正文文字和图像保存为双层PDF文件。然后由一个应用程序(公文代理,Archive Agent)将XML中的信息和PDF文件导入到系统中的正确位置,供用户进行检索和浏览。

  3.1 本方案的特点

  1 《公文高速录》软件自身的特点,可满足用户的需求。

  1.1 对兼容TWAIN接口的扫描仪有很好的支持。

  1.2 可对公文图像进行全文识别,饼子动提取关键字段信息。

  1.3 可对识别结果进行校对,提高识别结果的准确性。(虽然在使用角度,本系统中的正文不需要太高的准确率,但是依赖用户的需要,识别结果的准确率可以尽可能的高)。

  1.4 对公文图像进行处理,在保留红头、红章等信息的前提下,提高其显示质量,使其在显示时更加清晰。

  1.5 图像保存为双层PDF文件,这种格式的优点有:在浏览时可以方便的进行翻页浏览;用户看到的是公文的图像,但是可以方便的提取位于图像下层的文字。文字的位置与其在图像上的位置相同;所有图像页保存在一个文件中,便于浏览时进行翻页。

  1.6 识别的结果保存在XML文件中,可方便的提取并汇入到系统中。

  1.7 提供图像的导入功能,可对旧的公文图像进行加工。

  2 本方案对于系统结构的修改很小。由于PDF文件可存放在系统中原来存放JPG文件的位置,而系统库结构不需要做任何改变。所做的只是添加一个程序进行将公文信息和图像汇入到系统中(Archives Agent)。

  3 本方案在技术上已经成熟,与系统以及用户需求耦合度也较高,因此不需要进行太大规模的开发即可实现,从而使项目周期大大缩短。

  本方案由《公文高速录》、扫描仪、生成的XML文件和PDF文件共同组成公文的录入环节。并配合OA系统中新增加的《公文汇入代理》将公文信息汇入系统,供用户检索和浏览。

  在本录入方案进行部署时,需要在每一个下属单位的收发室(进行公文录入的部门)安装《公文高速录》软件和扫描仪,进行公文的扫描和加工,并将结果汇入OA系统。

  3.2 待解决问题

  3.2.1 Lotus Notes系统中显示PDF的问题

  在Lotus Notes系统中不能直接支持PDF文件的识别和显示,拟采用借助OLE控件对PDF进行显示。目前杭州颐和正在致力于解决这个问题。

  3.2.2 《公文高速录》生成双层PDF

  目前《公文高速录》只能生成只包含图像的单层PDF。需要在此基础上开发能够生成双层PDF的版本。由于此技术我们已经在TH-OCR2000中实现,所需要的就是将它移植到本软件中。但是其间尚有一些问题较不明朗,预计这是此方案中最关键的部分,也是最难解决的部分。

  3.2.3 公文汇入代理的开发

  这个软件的开发需要对客户的OA系统有相当的了解,因此需要杭州颐和方面协调此系统的开发人员进行实现。

  三、项目周期预估

  本项目的难度全部在于《公文高速录》生成双层PDF这一技术点。由于没有进行细致的分析,因此具体的工作量尚不清晰,但是预计在4周至六周之间。


欲了解详情请直接与厂商联系或联系硅谷动力:

  电子邮件:zdsun@enet.com.cn 或者xfhuang@enet.com.cn

  应用与方案频道:http://cio.enet.com.cn

  政府行业采购频道:http://gov.enet.com.cn

  信息化热线电话;86-10-65245588转3446 或86-10-65245588转3137

  传真:86-10-65243096
  

您可以针对本文进行:[评论]  [收藏]  [推荐]   [查看原文链接]  
  • 共有0条评论  点击查看更多评论
  • 网友评论仅供网友表达个人看法,并不表明e800同意其观点或证实其描述
我想发表评论:
用户名密码
  • 匿名发表
    验证码: