MARC状态:审校 文献类型:中文图书 浏览次数:15
- 题名/责任者:
- 用Python写网络爬虫/(德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森著 李斌译
- 出版发行项:
- 北京:人民邮电出版社,2018
- ISBN及定价:
- 978-7-115-47967-9/CNY49.00
- 载体形态项:
- 196页:图;24cm
- 统一题名:
- Python web scraping
- 个人责任者:
- 雅姆尔 (Jarmul, Katharine) 著
- 个人责任者:
- 劳森 (Lawson, Richard) 著
- 个人次要责任者:
- 李斌 译
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.56
- 版本附注:
- 译自原书第2版
- 出版发行附注:
- 本书由英国Packt Publishing公司授权人民邮电出版社出版
- 责任者附注:
- Katharine Jarmul, 是德国柏林的一位数据科学家和Python支持者。她经营了一家数据科学咨询公司--Kjamistan, 为不同规模的企业提供诸如数据抽取、采集以及建模的服务。Richard Lawson, 来自澳大利亚, 毕业于墨尔本大学计算机科学专业。毕业后, 他创办了一家专注于网络爬虫的公司, 为超过50个国家的业务提供远程工作。李斌, 毕业于北京科技大学计算机科学与技术专业, 获得硕士学位。
- 提要文摘附注:
- 本书包括网络爬虫的定义以及如何爬取网站, 如何使用几种库从网页中抽取数据, 如何通过缓存结果避免重复下载的问题, 如何通过并行下载来加速数据抓取, 如何利用不同的方式从动态网站中抽取数据, 如何使用叔叔及导航等表达进行搜索和登录, 如何访问被验证码图像保护的数据, 如何使用Scrapy爬虫框架进行快速的并行抓取, 以及使用Portia的Web界面构建网路爬虫。
全部MARC细节信息>>



