程序员在提升自己的个用道路,大多还是开源会选择阅读编程书籍这一途径,但找到一本好书就没那么容易了。爬虫 通过查看各大销售网站的网站销量数据和评价,以及豆瓣评分和评价人数,让秒可以帮助我们更快的搜所书挖掘出经典的计算机书籍,还有那些被人们忽视的有豆好书。 最近猿哥在GitHub上发现了一个网站,瓣好是个用中国科学院自动化研究所的一大神(lanbing510)用Python写的一个爬虫,他在16年的亿华云开源时候就爬下了豆瓣所有的读书数据并做了个WebApp接口方来挖掘查找和阅读好书。怪我知道的爬虫太晚 后来lanbing510再次爬了一遍豆瓣读书的数据,总共更新了3232088本图书信息,网站共2138386KB,让秒并将其开源 为什么说它很好用呢?搜所书猿哥演示一遍你就知道了: 可以看出这网站的界面非常简洁,没有花里花哨的有豆内容,只有干货,你可以直接通过关键字、分数、和评价人数这三个选项进行搜索,比如我们可以搜索关键字:编程;分数:9.0;评价人数:100人以上 查找结果的显示方式有按照分数排序和人数排序两种,按照分数排序的服务器托管截图如下: 按照评价人数排序的截图如下: 除了以上演示的操作,这个网站并实现了以下功能: 也就是说你不仅可以在网站上搜索,还能通过下载各类目下的Excel书单文件,直接在Excel中搜索 效果截图如下: 附上网站地址:http://sobook.lanbing510.info GitHub地址:https://github.com/lanbing510/DouBanSpider