全职独立开发了几年,一直在更新维护的 APP —— 支持文字/表格/PDF/公式识别

日期 : 2020-07-30 08:42:46

2010 年入行的程序猿,2015 年开始辞职做全职独立开发。因为一直对算法比较感兴趣( 15 年初还参加过 CSDN 的在线算法比赛,阴差阳错地得了第三名),所以打算做跟 OCR 有关的 app 。



当时尝试了很多算法,后面感觉深度学习是个好东西,所以 app 直接就叫“深度识别”。虽然其实没有多少深度学习的东西(-_-||)。不过原创的 OCR 识别引擎还是保留下来了。

一开始只有 OCR 文字识别(调百度的在线接口+本地 OCR 识别双引擎)的功能,后面模仿扫描全能王加入了制作 PDF 扫描件的功能。

接着看到表格识别需求比较高,自己整了个表格识别的算法。在生成不规则表格上有时候比百度的表格识别接口还厉害一点(而且百度的表格识别接口太贵了,咱也用不起啊)。分析表格采用原创算法,但是构造表格调用了 C#。

表格识别搞定后,又添加了个图片转 word 的功能。跟表格识别类似,版面分析算法是原创的,生成 word 在底层调用 C#相关的东西。

PDF 识别就比较简单了,其实就是截图+OCR 文字识别。

公式识别是调用 mathpix 的接口。毕竟业界最强,也就不考虑自己再造轮子了。


======================================================================

16 年上线 ios 版本,app store 官网链接:

https://apps.apple.com/cn/app/%E6%B7%B1%E5%BA%A6%E8%AF%86%E5%88%AB-%E6%96%87%E5%AD%97%E8%AF%86%E5%88%AB%E6%89%AB%E6%8F%8F%E5%85%A8%E8%83%BD%E7%8E%8B/id1179334124

标签 :