全职独立开发了几年，一直在更新维护的 APP —— 支持文字/表格/PDF/公式识别|三颗蛋

全职独立开发了几年，一直在更新维护的 APP —— 支持文字/表格/PDF/公式识别

日期 : 2020-07-30 08:42:46作者 : 中原锦绣

2010 年入行的程序猿，2015 年开始辞职做全职独立开发。因为一直对算法比较感兴趣（ 15 年初还参加过 CSDN 的在线算法比赛，阴差阳错地得了第三名），所以打算做跟 OCR 有关的 app 。

当时尝试了很多算法，后面感觉深度学习是个好东西，所以 app 直接就叫“深度识别”。虽然其实没有多少深度学习的东西（-_-||）。不过原创的 OCR 识别引擎还是保留下来了。

一开始只有 OCR 文字识别（调百度的在线接口+本地 OCR 识别双引擎）的功能，后面模仿扫描全能王加入了制作 PDF 扫描件的功能。

接着看到表格识别需求比较高，自己整了个表格识别的算法。在生成不规则表格上有时候比百度的表格识别接口还厉害一点（而且百度的表格识别接口太贵了，咱也用不起啊）。分析表格采用原创算法，但是构造表格调用了 C#。

表格识别搞定后，又添加了个图片转 word 的功能。跟表格识别类似，版面分析算法是原创的，生成 word 在底层调用 C#相关的东西。

PDF 识别就比较简单了，其实就是截图+OCR 文字识别。

公式识别是调用 mathpix 的接口。毕竟业界最强，也就不考虑自己再造轮子了。

======================================================================

16 年上线 ios 版本，app store 官网链接：

https://apps.apple.com/cn/app/%E6%B7%B1%E5%BA%A6%E8%AF%86%E5%88%AB-%E6%96%87%E5%AD%97%E8%AF%86%E5%88%AB%E6%89%AB%E6%8F%8F%E5%85%A8%E8%83%BD%E7%8E%8B/id1179334124

标签 : 深度识别

免版权图片

免版权字体

传输存储

图床