MARC状态:审校 文献类型:中文图书 浏览次数:16
- 题名/责任者:
- 虫术:Python绝技/梁睿坤著
- 出版发行项:
- 北京:电子工业出版社,2018
- ISBN及定价:
- 978-7-121-34456-5/CNY99.00
- 载体形态项:
- xii, 414页:图;24cm
- 其它题名:
- Python绝技
- 个人责任者:
- 梁睿坤 著
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.56
- 责任者附注:
- 梁睿坤, 近二十年软件开发、项目管理、团队建设和管理经验。致力于互联网技术应用与大数据应用方面的研究与开发工作。
- 提要文摘附注:
- 本书以当下在大数据应用方面流行、常用的语言Python为基础, 由浅入深, 从网络爬虫的基础实现原理入手, 逐步将读者引领进入网络爬虫的世界。在各类爬虫框架中将使用最为广泛的Scrapy作为轴心, 从多个维度揭开爬虫技术的面纱。例如, 爬取规则的制定技巧, 高速爬虫的设计, 通过人工分析和机器学习技术让爬虫更“聪明”地“读”懂获取数据的技术, 将与日据增的海量数据进行分布式的存储技术, 具有高隐匿性的爬虫设计, 直至对大规模、高并发的分布式爬虫技术。本书基于Python这门灵活且简洁的语言, 结合作者在网络数据爬取和大数据的实际工程经验, 尝试总结成为一种实用性和系统化的理论与经验沉淀, 让更多数据工作者或编程爱好者在这一大数据时代从海量的信息中通过掌握“虫述”来获取对自已或企业具有价值的信息。
全部MARC细节信息>>



