机读格式显示(MARC)

000 01714nam0 2200301 450

001 0000508385

005 20190615170100.0

010 __ |a 978-7-115-47967-9 |d CNY49.00

100 __ |a 20180723d2018 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 用Python写网络爬虫 |A yong Pythonxie wang luo pa chong |f (德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森著 |d = Python web scraping |f Katharine Jarmul, Richard Lawson |g 李斌译 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2018

215 __ |a 196页 |c 图 |d 24cm

305 __ |a 译自原书第2版

306 __ |a 本书由英国Packt Publishing公司授权人民邮电出版社出版

314 __ |a Katharine Jarmul, 是德国柏林的一位数据科学家和Python支持者。她经营了一家数据科学咨询公司--Kjamistan, 为不同规模的企业提供诸如数据抽取、采集以及建模的服务。Richard Lawson, 来自澳大利亚, 毕业于墨尔本大学计算机科学专业。毕业后, 他创办了一家专注于网络爬虫的公司, 为超过50个国家的业务提供远程工作。李斌, 毕业于北京科技大学计算机科学与技术专业, 获得硕士学位。

330 __ |a 本书包括网络爬虫的定义以及如何爬取网站, 如何使用几种库从网页中抽取数据, 如何通过缓存结果避免重复下载的问题, 如何通过并行下载来加速数据抓取, 如何利用不同的方式从动态网站中抽取数据, 如何使用叔叔及导航等表达进行搜索和登录, 如何访问被验证码图像保护的数据, 如何使用Scrapy爬虫框架进行快速的并行抓取, 以及使用Portia的Web界面构建网路爬虫。

500 10 |a Python web scraping |A Python Web Scraping |m Chinese

606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计

690 __ |a TP311.56 |v 5

701 _1 |a 雅姆尔 |A ya mu er |g (Jarmul, Katharine) |4 著

701 _1 |a 劳森 |A lao sen |g (Lawson, Richard) |4 著

702 _0 |a 李斌 |A li bin |4 译

801 _0 |a CN |b WXCSXY |c 20190615

905 __ |a WXCSXY |d TP311.56/459