《尚书7号完全版》7号

《尚书7号完全版》7号
  • 片  名  《尚书7号完全版》7号
  • 简  介  发行时间: 2002年04月
  • 类  别  软件
  • 小  类  多媒体类


  • 详细介绍中文名: 尚书7号完全版版本: 7号发行时间: 2002年04月地区: 大陆简介:

    本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
    目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
    ●识别字符
    简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
    纯英文字符集。
    简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
    ●识别字体种类
    能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
    ● 识别字号
    初号 小六号字体。
    ●表格识别
    可以自动判断、拆分、识别和还原各种通用型印刷体表格。
    ●可支持繁体WINDOWS系统
    首先,尚书七号开始将整个OCR的过程,明确化了,通过程序的菜单,我们就能够知道整个OCR的过程,主要分为:“文件”、“编辑”、“识别”、“输出”等步骤。
    在文件菜单中,您可以调用扫描仪,或者选择将已经扫描好的图像文件打开。得到图像文件后,用户开始的工作,就是“编辑“菜单里面所提示的:图像页面的处理,其中包括图像页的倾斜校正(提供自动和手动实现方法),旋转等功能。
    处理完毕后,就可以进入“识别过程”,该过程关键的是“版面分析”,现在尚书七号的自动版面分析功能很强,面对报纸杂志等复杂情况的版面,也是分析的正确率很高。不再需要我们在尚书六号里面那样的建议手工划识别范围。也正是这点,大大降低了使用者的工作量。为了方便,“识别”菜单下,也提供了用户自己在自动版面分析后,通过修改识别范围框的属性,来决定需要识别否的功能(默认的情况下,图象属性的栏目是不用识别的。当然,如果用户还是习惯原来尚书六号那样,自己来设定识别区域,只要直接用鼠标划框就可以了。接下来,用户就可以直接选择“开始识别”的按钮了,等待识别的结果。
    屏幕接下来会出现识别结果的“文本窗口”,这个窗口能够提供识别结果的校对,为了校对的方便,尚书七号增加了光标跟随显示原图像行的校对方法(如下图出现的黄色提示行的出现)。
    这样提供校对的方法,一眼就能够看到图像原文和识别出文本的差别,实在是大大方便了用户,降低了用户校对的工作疲劳感,不用再眼睛不断的上下观看了。校对过程完毕后,用户就可以选择识别结果的“输出”了,指定的文件格式有那么几种:RTF、HTML、XLS、TXT,用户这里可以根据自己的需要选择对应的格式。我这里的使用经验是,如果是用户想得到类似原文的识别结果,请选择RTF格式。现在提供的RTF格式的输出,用WORD打开后,会发现几乎保留了原文的所有特点,原稿如下:识别结束后,存为RTF格式保存,WORD打开后的情况:从上面的种种介绍来看,尚书七号确实大大的方便了用户使用OCR的识别工作。
    其次,在尚书七号中,提供了多图像页面的处理功能。这样的话,用户就可以放心的将好几页的文章,通过分别扫描后,统一进行版
  • 《尚书7号完全版》7号_large

精选评论

真的很好用,简直帮了我大忙了,谢谢!
我也下来试用一下看看,我手头也是文字的东西太多了。
速度好像不是太快啊!
下了,用后觉得还不错,不过看不出跟尚书6的区别
但是在VISTA下不能用,有没有什么补丁?
找的就是这个
这个软件很好用啊
下来试试,谢谢分享

不能用么?
很不错,谢谢了。
在VISTA下是不能用。可以安装,但是在读出时即退出。

什么叫读出时即退出?
即退出程序之意。“有问题需要关闭”
好东西 正在下载中。