office教程_善用office组件提取图片中的文字

曾巧文 发布于:2012-5-9 17:17 分类:软件应用 标签: Office教程

导语:

     这节课在实验课做sql的查询,很无语的是很多都是要从书本copy的,不想一句一句敲代码,所以便找了下实验室的机子的软件。实验室只有office2003够坑的了,但是有这个已经足够了。用手机从书上拍下照片。运用office2003中的Microsoft Office Document Imaging工具(注:其实office2007或者2010中有更加简单的工具,叫做onenote,自己可以去找找),下面教程开始。

微软在Microsoft Office 2003中的工具组件中有一个“Microsoft Office Document Imaging”的组件包,它可以直接执行光学字符识别(OCR),下面笔者就为大家介绍利用Office 2003新增的OCR功能从图片中提取文字的方法。

   第一步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行(如图1所示)。



图1 安装组件

 
   第二步 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。

   第三步 打开Microsoft Office Word 2003 ,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。如图2所示,在“打印机”下拉列表框中选择“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。



图2 选择打印机


  打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。



图3 将文本发送到Word


  提示:如果你不想将转换的内容输入到一个新的Word 文档中,而是希望粘贴到一个已经打开的Word 文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执行粘贴即可。()

 

效果:

点击查看原图

提取结果

use XSBOOK
go
if exists(select name from sysobjects where name = 'book_info' and type = 'if')
	drop function book_info
go
create function book_info(@book_name char(26))
returns table
as
	return(select ISBN,书名,作者,出版社,价格,复本量,库存量
	       from dbo.BOOK
	       where 书名 = @book_name)
go

select * from XSBOOK.dbo.book_info('Web站点安全')

版权所有:《曾巧文博客-关注互联网IT技术,记录生活点滴》 => 《office教程_善用office组件提取图片中的文字
本文地址://qiaowen.net/post-1214.html
除非注明,文章均为 《曾巧文博客-关注互联网IT技术,记录生活点滴》 原创,欢迎转载!转载请注明本文地址,谢谢。

有 5005 人浏览,获得评论 2 条

评论:

李卿
2012-05-09 19:20
直接用onenote就可以了。。
曾巧文
2012-05-09 22:38
@李卿:实验室的Office没有onenote,没有认真看哦,呵呵(注:其实office2007或者2010中有更加简单的工具,叫做onenote,自己可以去找找),下面教程开始。)

发表评论:

Powered by emlog 粤ICP备12040901号

>>本作品采用-知识共享署名-非商业-禁止演绎-协议-进行许可 |站点地图 | | | | 开放分类目录 |