作为一个经常参加会议的媒体人,总会碰到一个麻烦事:拍下了一页页的PPT,如果要引用PPT中的内容,却无法直接复制提取,必须手动打出来;或者拿到了一沓厚厚的纸质材料,要大段引用,如果没有电子版的话,也得手动打出来,费时费力,还容易出错。如何使用最便捷的方式来完成文字信息的提取?OCR文字识别工具能节省大量手动打字的时间,现在OCR文字识别应用类别也出现了几款优秀的小程序应用,不用下载App,就能解决图片文档电子化、可编辑的需求问题。IT时报记者■潘少颖
传图识字:拍张照片提取文字
客户通过微信发过来的照片、参加会议时收到的纸质材料或者是自己随手拍下的一张照片,如果要把通过这些渠道而来的照片上的文字提取出来,小程序“传图识字”值得推荐。
从名字上来讲,“传图识字”主要是识别照片上的文字,在其首页上,可以选择照片的三个来源:微信聊天、相册以及即时拍的照片,如果想复制电脑上的图片文字,可以直接截图。
以即时拍摄的照片为例,记者拍了一张写满字的A4纸,识别加载后,“传图识字”会用长方形框选出所有可以识别的文字部分,点击选择要识别的部分后,应用会在预览框显示识别结果。由于A4纸上都是打印出的字,“传图识字”的识别准确率还不错,但有些复杂的字识别不出来,比如“饕餮”。随后,记者又拍摄了一些不算很潦草的手写字,此次结果不尽如人意,除了可识别的部分不多,即使在可以识别的字中,准确率也不高,低于50%。“传图识字”也很有自知之明,它把觉得可能出错的字都用红色进行了标注。
识别之后,这些文字可以通过复制、发送、导出、转发等方式提取出来。在识别界面的底部有复制文字、全选、涂抹选词、扩展/翻译、导出/转发5个功能。其中,扩展/翻译是“传图识字”的特色功能,在弹出的词块文字处理窗口中,用户可以选择部分文字进行翻译、分词、词块分行、查看原图、编辑文字、图文校对,将一段话打散呈词语、单字的元素,可自由选择要复制的部分。
百度OCR文字识别:除了文字还可识别菜品
虽然是一款小程序,但“百度OCR文字识别”的功能相当丰富,除了常规的文字识别,还有银行卡识别、车牌识别、营业执照等识别功能。
先来看看它的文字识别能力强不强?其选择照片的渠道是相册中的照片或者即时拍照片,记者依然拍摄了一张有满满一页字的A4纸,识别速度很快,大概5秒左右就把这一千多个字都识别了出来,准确率也很高,几乎毫无差错,也不存在复杂的字识别不出的情况。
在“百度OCR文字识别”里,有一个小小的、但很用心的功能,就是“手写识别”,作为一个单独的功能,其表现可圈可点。记者用手写字进行了测试,字数大约30个,可以说,其准确率在80%左右,从这点上,胜过“传图识字”。
但是,识别之后的提取并不是很方便,它不能像“传图识字”一样导出或转发,也不能变成文档,只能直接复制识别结果,如果需要提取的字不是连续的,比如只需要第一段和第三段,那就得复制两次。此外,“百度OCR文字识别”也不支持识字前选择需要识别的内容。“百度OCR文字识别”的功能很丰富,每个功能都有可以使用的场景,比如营业执照识别可以用于商户入驻、企业银行开户、企业贷款等,火车票识别可用于报销、账单记录等,甚至其还可以植物识别、菜品识别、动物识别,感觉不管要识别什么,用“百度OCR文字识别”就可以了。