机读格式显示(MARC)
- 000 01422nam0 2200253 450
- 010 __ |a 978-7-121-39406-5 |d CNY79.00
- 100 __ |a 20200925d2020 em y0chiy50 ea
- 200 1_ |a Python 3网络爬虫宝典 |A Python 3wang luo pa chong bao dian |f 韦世东著
- 210 __ |a 北京 |c 电子工业出版社 |d 2020
- 215 __ |a x, 262页 |c 图 |d 24cm
- 314 __ |a 韦世东, 资深爬虫工程师、2019华为云·云享专家、掘金社区优秀作者、GitChat认证作者。
- 330 __ |a Python3是当前市面上极受欢迎的人工智能和网络爬虫语言。本书介绍了爬虫方面更深入的知识。书中首先回顾了爬虫的基础知识; 然后详细介绍爬虫常用工具与库的相关知识; 接着学习Redis, 为后面的学习打下基础; 然后讨论了Redis在分布式爬虫中的作用以及分布式爬虫的原理、分类与实现方法; 再进一步学习增量爬取的原理与实现方法; 然后通过学习网页文本抽取方法和智能抽取方法实现了大规模、多网站的数据爬取; 在部署方面通过了解、剖析成熟稳定的爬虫部署平台Scrapyd, 并根据实际业务需求重新构建了一套兼容性更强的爬虫部署平台; 最后学习了Python中常用的几个任务调度库与框架, 通过了解Celery逻辑与结构, 我们掌握了调度相关的知识, 并根据实际业务需求构建了一套支持动态任务增删的任务调度平台。
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _0 |a 韦世东 |A wei shi dong |4 著
- 801 _0 |a CN |b 湖北三新 |c 20200925
- 905 __ |a WXCSXY |d TP311.56/823