文字识别(OCR)软件评测星期五, 三月 25. 2005
回复
回复显示方式
(直线程 | 分线程)
是的。FineReader支持中文已经有好一些日子了,不过我对识别中文的需求几乎没有,因此也就没有做这方面的测试。后面一段时间也不一定能有机会做这个。
谢谢关注
做了下实验
对比产品 汉王文本王7600 清华紫光thocr 7.0 FineReader 最新的10版 其他的什么尚书7号之类或者office2003自带的都是汉王或者紫光的OEM,不用测试 实验结果是FineReader 远远超越前面两者 理由1,汉王和紫光还是老习惯,很多格式不支持,pdf格式不支持,jpg还是gif的某一种提示什么颜色数过多还是什么来着,感觉莫名其妙 理由2.随便搞了个pdf的书,转换成图片,三者对比,FineReader 完全正确,汉王的有10%的错字,紫光的识别乱七八糟没法看 理由3,偶拿破手机随便拍了个墙壁上的排行榜,颜色和光源都不怎么样,测试。汉王虽然有照片模式,但是识别出一堆乱码。没法用,紫光也是乱码一堆,FineReader 选择用表格模式,重新划分下识别区域以后,正确识别70%以上的内容 至于OmniPage和Readiris就没仔细测试,因为FineReader 虽然识别比较慢,但是结果很好,偶是个测试最看重结果的,结果ok,过程慢点什么的无所谓,识别的再快,乱码错误一大堆,干脆不用。。 支持格式太少始终是国产软件的困难
实话实说,国产OCR一直不怎么样的
多少年了还是固守着那几种可识别格式 似乎丝毫不想支持目前已经很流行的pdf格式 对了,国产OCR还有一个巨大的bug 我识别测试的是本高等数学教材 FineReader 能够自动把里面的图片和文字分开,虽然数学公式识别怎么样,但是能够让他自己以图片模式处理 识别完以后发送到word,几乎一模一样。。。 其他两款产品OmniPage和Readiris没仔细测试了, |
Google the Site最新评论最新文章
网志文字类别近日个人动态最近在忙些什么: 最近在听些什么: 最近在研究什么: 最近在看些什么: |
有两大突破传统键盘输入技术的信息输入技术:一是语音,二是手写和OCR(意译为“文字识别”)。本文主要讨论OCR,但也适用于手写,因为两者使用的技术是一致的。国际上第一流的OCR软件是ABBYY FineReader和ScanSoft OmniPage(ScanSoft公司前2个月更名为Nuance),其它OCR软件都明显不如这两款软件1。ABBYY FineReader是俄国人开发的。俄国人开发的著名软件不多,但却有2个是世界第一流的,一个是OCR软件ABBYY FineReader,还有一个就是Kasp
引用: 1月 22, 15:14
类别软件热爱指数评价本站相关信息 电子邮件 Google Gmail***** 最接近完美1, 2 网页浏览FireFox*****超强1, 2 文档压缩WinRAR****简洁、稳定 文档格式PDF****便捷1, 2 PDF阅读Adobe Acrobat****舒心Acrobat 6->Acrobat 7">1 mp3播放WinAMP****稳定、多功能 &nb
引用: 11月 16, 18:49