非科班人的爬虫入门好书

云计算扫地僧
• 阅读 635

几年前,我刚刚入门编程,会了一点python的基础语法之后,第一时间就想写个爬虫应用,当时在知乎上看了好几篇关于爬虫的教学文章,最后发现了崔庆才崔大的《一起学爬虫》专栏(应该是18年初,那时候还没出书),一阅便不可收拾...
非科班人的爬虫入门好书
崔大的文章可以说是爬虫小白的入门佳作了,从开发环境配置,到爬虫基础的教学,再到爬虫实战,入门者不懂的,基本都可以在专栏中找到自己想要的答案。
后面在博客上知道崔大终于出了书《Python3网络爬虫开发实战》,之前白嫖了这么久的文章,有点过意不去(笑,所以就第一时间入手了。
好家伙,厚厚的一本书,里面的内容是在专栏的基础上加了更多的进阶内容,并且配有实验用的案例网站,爬虫相关的知识讲解的还是一如既往的好,当时我也看了一半左右的内容。不过这一半内容,经过一段时间的消化,也让我也从爬虫小白,成为了有一点经验的爬虫萌新。
我是土木出身的,为了科研需要批量下载一批地震动做分析,可那是好几十万的数据,我不可能手动逐个下载,但学了爬虫以后,能够编写简单的脚本,用selenium进行自动化下载,那感觉可太爽了,属于是非科班人的喜悦。
可惜的是到现在,还没完整地把书给看完,因为内容实在太多了。出来工作后,更多是遇到爬虫问题的时候当工具书来使~
总的来说,这本书对于爬虫所需的知识讲解的比较不错,适合有一定python基础和爬虫经验的人,纯小白的话建议先学好python,然后从视频入门较好~如果已经有一点的爬虫基础想要进阶,那这本《Python3网络爬虫开发实战》(最近第二版已经出了~听说更厚内容更多),你肯定不能错过。

点赞
收藏
评论区
推荐文章
samzhangjy samzhangjy
4年前
知乎文章转Markdown的艰辛历程
好吧,让我们从头说起。众所不周知,我有了我自己的博客,于是就想把我的知乎内容同步到博客上去(目前还空空如也)。但是,出于能犯懒就犯懒的原则,我决定做一个自动化程序,自动将知乎上的文章转换成Markdown食用。嗯……结果还挺满意的,就是好像时间耗费的长了一点(三个月啊,中间搁置了两个月零30天)。。总之,我Python爬虫,成功构建了一个知乎2MD全自动转换
浅梦一笑 浅梦一笑
4年前
多人说Python简单,但是如何入门Python并精通?
一般而言,Python几个月就可以开始使用了。假如你几个月没入门,那肯定是方法不对,或者是偷懒.我在公众号里有一篇文章详细写了“初学者别上爬虫”,爬虫虽然很有趣,但不适合于小白用户。以下是2点:多人说Python简单,但是如何入门Python并精通?Python再简单再通俗,它也是一门语言,掌握一门语言绝非一朝一夕,我个人不推荐初学者上岸学习爬虫,我举一个很
Karen110 Karen110
4年前
手把手教你用Python爬取百度搜索结果并保存
一、前言大家好,我是崔艳飞。众所周知,百度上直接搜索关键字会出来一大堆东西,时常还会伴随有广告出现,不小心就点进去了,还得花时间退出来,有些费劲。最近群里有个小伙伴提出一个需求,需要获取百度上关于粮食的相关讲话文章标题和链接。正好小编最近在学习爬虫,就想着拿这个需求来练练手。我们都知道,对Python来说,有大量可用的库,实现起来并不难,动手吧。二、项目
Wesley13 Wesley13
3年前
50 行代码教你爬取猫眼电影 TOP100 榜所有信息
对于Python初学者来说,爬虫技能是应该是最好入门,也是最能够有让自己有成就感的,今天,恋习Python的手把手系列,手把手教你入门Python爬虫,爬取猫眼电影TOP100榜信息,将涉及到基础爬虫架构中的HTML下载器、HTML解析器、数据存储器三大模块:HTML下载器:利用requests模块下载HTML网页;HTML解析器:利用re正则表达
Stella981 Stella981
3年前
Python自带爬虫库urllib使用大全
击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤门前冷落鞍马稀,老大嫁作商人妇。这篇文章主要来讲解下Python自带的爬虫库urllib常见用法,主要围绕urllib定义、urllib的常用模块和urlliblxml爬虫案例三个部分进行展开。
Stella981 Stella981
3年前
Python爬取暴走漫画动态图
最近再之乎上看到比较好的Python爬虫教程,看过之后对爬虫有了大概的了解,随后自己写了个爬取暴走漫画(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fbaozoumanhua.com%2Fcatalogs%2Fgif)动图的爬虫练练手,另外附上Python爬虫教程(https://w
Stella981 Stella981
3年前
Python爬虫
Python爬虫xpathPython爬虫xpath说明再说明插件推荐语法讲述举栗子代码里使用实战句子迷需要的总结:说明关于Python爬虫请求数据方面的知
Stella981 Stella981
3年前
Python_爬虫笔记_2018.3.19
Python\_爬虫\_笔记1.前言1.1爬虫用途:网站采集、接口采集(地图(jis热力学屋里端口/协议)、微信、知乎、)1.2基本流程:网页下载(requests)网页解析爬虫调度网页解析:在当前网站找信息、下一个入口等信息调度:调度器/
Wesley13 Wesley13
3年前
PHP 爬虫体验(二)
自从使用hexo在githubpage更新博客之后,我每次在cnblog上发布文章,需要手动再更新hexo。hexo使用markdown格式来写文章,手动更新需要对文章本身内容进行转化,做成md文件再进行上传,后来就想到,本身爬虫就可以对页面中的各种元素进行提取,同时markdown使用的是标记语法,那么使用爬虫分析文章元素,提取主要内容并且根据模板自动生
Stella981 Stella981
3年前
Python爬虫知识点全面梳理
学任何一门技术,都应该带着目标去学习,目标就像一座灯塔,指引你前进,很多人学着学着就学放弃了,很大部分原因是没有明确目标,所以,在你准备学爬虫前,先问问自己为什么要学习爬虫。有些人是为了一份工作,有些人是为了好玩,也有些人是为了实现某个黑科技功能。不过肯定的是,学会了爬虫,能给你的工作提供很多便利。作为零基础小白,大体上可分为三个阶段去实现,第一阶段是
云计算扫地僧
云计算扫地僧
Lv1
时间游走,岁搁浅,斑驳的影子映着千言万语。
文章
3
粉丝
0
获赞
0