- 主题:福昕PDF ocr识别也太好笑了
福昕2023, 做双层PDF, 生僻字和稍微复杂图形里的字就不用提了。
非常清楚的扫描件,尼罗河给识别成了尼萝河, 有些地方干脆整段都识别不出来。 识别出来的文件还特别大。
这好像是国内大公司,水平也太差了,也就比白描免费网页版强一些
随便搜了一个网站,比它们强太多,可惜免费只能限制10页,收费的价格极高
--
修改:factory FROM 223.104.40.*
FROM 223.104.40.*
是600多页的书,确定可以?
【 在 wuduan 的大作中提到: 】
: 文件给我,我试试
--
FROM 39.144.79.*
问题页面已经找了一个叫totalPDF的网站解决了。 但是这个书还有其他很多页,应该还有很多问题的页面
【 在 wuduan 的大作中提到: 】
: 就把你说的“尼罗河给识别成了尼萝河, 有些地方干脆整段都识别不出来。”这种地方挑一两页发出来我试试就行了。
: 我试过的福昕,虽然不像白描那么好,但是好像没达到整段识别不出来的。
:
--
FROM 223.104.40.*