re库提取网页文本的方法

这是一种提取网页中的显示的文本内容,去除标签的方法。

主要用到了re库。直接上代码:

阅读更多

yilia主题添加gitalk

之前用过一段时间的畅言和valine,总体感觉一般,valine虽说很好用,但是需要leacloud,不是特别方便,所以最后选择了gitalk。

但是在gitalk集成在yilia上是,却出现了一些问题。

故此写下,也希望可以帮助别的博主。

阅读更多
所以

所以

我们只是相交线,是过客,终究越来越远

只是爱的不够罢了。

chrome伪装抓取微信公众号内容

chrome伪装抓取微信公众号内容

前一段时间一直在做微信公众号内容的获取
总结一下,有下面三种方法:

  1. chrome伪装抓取
  2. 内存获取方法
  3. selenium自动爬取法
阅读更多