打赏

相关文章

Scrapy + Splash 渲染爬取微博:从动态页面到数据挖掘的完整实战

一、写在前面:为什么要用 Scrapy + Splash 爬微博? 在爬虫的世界里,微博是一座“数据金矿”——用户的公开博文、热点话题、互动数据、传播路径,蕴含着极大的商业与科研价值。然而,微博的前端采用了大量的 JavaScript 动态渲染技术,传统的 requests + BeautifulSoup 方式…

PyZMQ:Python 分布式消息通信的轻量级方案

文章目录PyZMQ:Python 分布式消息通信的轻量级方案1、PyZMQ 解决了什么2、版本和平台支持3、安装方式4、版本兼容策略5、适合哪些场景PyZMQ:Python 分布式消息通信的轻量级方案 pyzmq 在 GitHub 上拿到了 4,142 个 Star。 ZeroMQ 是一套轻量级分布式消…

DiskCache:把磁盘空间变成高性能缓存

文章目录DiskCache:把磁盘空间变成高性能缓存1、DiskCache 是什么2、性能怎么样3、为什么不用 Redis 或者 Memcached4、缓存之外还能做什么5、和同类方案的对比6、适合哪些场景DiskCache:把磁盘空间变成高性能缓存 diskache 在 GitHub 上拿到了 2,884 个…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部