机读格式显示(MARC)
- 000 01714nam0 2200301 450
- 010 __ |a 978-7-115-47967-9 |d CNY49.00
- 100 __ |a 20180723d2018 em y0chiy50 ea
- 200 1_ |a 用Python写网络爬虫 |A yong Pythonxie wang luo pa chong |f (德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森著 |d = Python web scraping |f Katharine Jarmul, Richard Lawson |g 李斌译 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2018
- 215 __ |a 196页 |c 图 |d 24cm
- 306 __ |a 本书由英国Packt Publishing公司授权人民邮电出版社出版
- 314 __ |a Katharine Jarmul, 是德国柏林的一位数据科学家和Python支持者。她经营了一家数据科学咨询公司--Kjamistan, 为不同规模的企业提供诸如数据抽取、采集以及建模的服务。Richard Lawson, 来自澳大利亚, 毕业于墨尔本大学计算机科学专业。毕业后, 他创办了一家专注于网络爬虫的公司, 为超过50个国家的业务提供远程工作。李斌, 毕业于北京科技大学计算机科学与技术专业, 获得硕士学位。
- 330 __ |a 本书包括网络爬虫的定义以及如何爬取网站, 如何使用几种库从网页中抽取数据, 如何通过缓存结果避免重复下载的问题, 如何通过并行下载来加速数据抓取, 如何利用不同的方式从动态网站中抽取数据, 如何使用叔叔及导航等表达进行搜索和登录, 如何访问被验证码图像保护的数据, 如何使用Scrapy爬虫框架进行快速的并行抓取, 以及使用Portia的Web界面构建网路爬虫。
- 500 10 |a Python web scraping |A Python Web Scraping |m Chinese
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _1 |a 雅姆尔 |A ya mu er |g (Jarmul, Katharine) |4 著
- 701 _1 |a 劳森 |A lao sen |g (Lawson, Richard) |4 著
- 702 _0 |a 李斌 |A li bin |4 译
- 801 _0 |a CN |b WXCSXY |c 20190615
- 905 __ |a WXCSXY |d TP311.56/459