当前位置:主页->计算机应用
 
 
 
从图片中提取文字

  现在许多网站都有EXE、CHM、PDF等格式的电子书下载。很多时候这些电子书可以看,但是其中的内容却不能复制。如果我们需要这些电子书中的文本内容,是不是就非得要重新输入一遍呢?当然不用这么麻烦。下面我就告诉大家如何将这些内容从资料中提取出来。

Snaglt文字提取

  Sn.agIt是一款功能强大的图片捕 捉工具,但是很多朋友可能不知道,它 还有文字捕捉的功能,能将文字从图片中提取出来。目前它的最新版本为7.O。启动SnagIt 7.O,在左侧选中“窗口文字”(如图),在左侧选择输入位置(比如屏幕、区域、窗口等),输出位置(比如打印机、剪贴板、文件等)。设置完成后,.回到要捕捉文字的文件窗口,按下“捕获”快捷键,即可将文字提取出来。
  此时我们会发现提取的文字中有很多空格或出现段落错乱等情况,这时我们可以用文字编辑工具进行重新编排。这里以WPS Offi.ce 2003为例:将提取文字复制粘贴至新文档中,依次选择菜单“工具”→“文字”下的 “段落重排”→“删除段首空格”→“删除空段”命令,这时文章已经变得很整齐了。



文字识别工具


  文字识别工具简称OCR工具。这里我们以清华紫光OCR文字识别工具为例。打开带有文字的图片(如果是电子书籍,可按下“Print Screerl”屏幕捕获键将其保存为图片),根据所要提取的文字进行裁剪。启动OCR,打开已裁减的图片,用鼠标在图片中绘制出待识别的文字区域,按下工具栏“识别"按钮即可。文字识别结束后,会自动在一个文本编辑器中打开已提取文字,将结果复制粘贴至其他文档中即可。 (耿方圆)