请问有什么好的个人资料库存储思路吗?

日期 : 2022-05-14 09:57:19作者 : 熊人

平时上网查资料时,发现一些写得特别好的个人博客文章会记录一下 URL ,但过一段时间想去回顾这篇文章,仅靠 URL 不太方便查找,有时好不容易找到这篇文章,但博客直接打不开了。 于是想着搭建个人资料库,整理出以下几个需求:


能方便的自由复制文章中的代码文字等。

样式特效等不要求保持原网页一致,只要求方便阅读即可。

能实现全文关键字搜索。

存储流程尽量做到自动化。

我目前的方案是一个网页保存一份 mhtml 和一份 html 。搜索文章时在 html 中搜索关键字,找到后打开对应的 mhtml 。这种方案数据量较少时还比较方便,现在收藏网页数越来越多了,这样用起来实在不方便。找了一圈没发现有合适的轮子,想着手开发一套资料库,但一直想不到有什么好的方案。


之前尝试过保存 html ,然后写脚本将 JS 、CSS 等外部引用内嵌。但效果不是很好,如果只针对某一种主题的网站,那没问题,但是不同网站前端得写不同的脚本,请教一下大家的个人资料库是如何存储的呢?

保存 mht 或者 html 很多站点其实是无效的。

我是页面截图+全文存数据库。。


我写了个火狐插件。点击插件图标。弹出输入框询问输入补充说明,可以不填。

然后插件就自动全屏截图。把所有的 css js html xhr 的文本拼接在一起。就不怕有文字搜不到了。是不是:真·全文搜索。

服务端是 php+mysql 。图片编码后直接存入数据库。

另外会自动保存页面上浏览器能直接“下载”的视频和 gif 。这两玩意儿是普通截图克星。


对于功能类网页没办法。

标签 :