
会员
Python网络爬虫技术与应用
邓维等主编更新时间:2023-08-25 12:19:37
最新章节:参考文献开会员,本书免费读 >
网络爬虫技术的重点之一是网络爬虫框架,因此《Python网络爬虫技术与应用》结合网络爬虫框架的相关案例重点介绍网络爬虫的常见框架,包括PySpider网络爬虫框架的安装和使用,Scrapy网络爬虫框架的安装和使用,以及Scrapy网络爬虫管理与部署。另外,《Python网络爬虫技术与应用》对Python网络爬虫开发需要的reguests库、Scrapy解析库、存储库、XPath进行了介绍,并介绍了requests库、正则表达式、XPath等的使用方法,还重点讲解了这些库的实际应用。《Python网络爬虫技术与应用》以Python网络爬虫开发为主线,兼顾理论与实战,全面介绍可操作的Python环境与系统开发相关知识,以及大数据算法、大数据分析、大数据系统互补的作用。另外,《Python网络爬虫技术与应用》还赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频,方便教师授课。《Python网络爬虫技术与应用》可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材,也可作为大数据及编程爱好者的参考用书。
品牌:清华大学
上架时间:2022-08-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
Python网络爬虫技术与应用最新章节
查看全部- 参考文献
- 本章习题
- 7.4.3 效果展示
- 7.4.2 抓取微信公众号文章的评论数据
- 7.4.1 所运用的内容讲解
- 7.4 实战案例4:微信公众号文章点赞阅读数抓取
- 7.3.3 查看效果
- 7.3.2 某研究中心的数据抓取
- 7.3.1 背景/案例知识介绍
- 7.3 实战案例3:分布式抓取
邓维等主编
主页
同类热门书
最新上架
- 会员
开源心法
本书全面介绍了华为在开源领域的实践和思考。首先,在认识开源部分,深入介绍了开源的起源、发展历程和底层逻辑;其次,在拥抱开源部分,揭示了华为积极参与和贡献开源的方式;然后,在践行开源部分,详细展示了华为在开源领域的具体实践和贡献;最后,在开源心法部分,深入探讨了华为对开源理念、价值观的理解和思考。此外,本书还剖析了开源产业、生态及文化的未来走向。本书旨在提供一个全面、深入的视角,让读者了解华为在开源计算机16.7万字 - 会员
Java Web程序设计任务教程(第2版)
本书使用深入浅出、通俗易懂的语言阐述JavaWeb相关知识,并结合典型的Web应用案例,帮助读者掌握Web应用程序的开发技术。本书共15章,详细讲解了网页开发的基础知识和JavaWeb开发的核心知识,其中网页开发基础知识包括HTML技术、CSS技术、JavaScript技术和Bootstrap技术,而JavaWeb的核心知识包括Servlet技术、会话技术,JSP技术、JDBC技术和数据库连计算机16.6万字 - 会员
Go语言从入门到精通
本书主要内容包括Go语言简介、开发环境准备、快速基础入门、数学科学领域的计算、开发一个自己的日常命令行工具、文件处理、数据格式分析与转换、正则表达式、并发处理、数据采集和清理应用、网络服务端应用、Web服务器、加密解密领域应用、网络提供的各种API、常用Go语言技术的示例与研究、实用函数实例等。安排了大量实例代码,介绍相关编程知识。计算机27万字 - 会员
uni-app跨平台开发与应用从入门到实践
本书分为三篇,共12章。第一篇:基础篇,包括第1-4章,介绍了uni-app的特点和优势、环境搭建、HBuilderX开发工具的安装和使用,以及uni-app的一些基础知识。第二篇:进阶篇,包括第5-9章,介绍了uni-app的基础配置、相关组件、导航栏、高效开发技巧,以及uniCloud云开发平台。第三篇:实战篇,包括第10-12章,通过第一个实战,介绍了如何使用uni-app开发小程序;通过第计算机10万字 - 会员
Elasticsearch实战(第2版)
本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti计算机27.5万字 - 会员
RHCSA/RHCE8红帽Linux认证学习教程
本书分为9篇,共35章。第1篇主要介绍基本配置;第2篇主要介绍用户及权限管理;第3篇主要介绍网络相关配置;第4篇主要介绍存储管理;第5篇主要介绍系统管理;第6篇主要介绍软件管理;第7篇主要介绍安全管理;第8篇主要介绍容器管理;第9篇主要介绍自动化管理工具ansible的使用。计算机12.4万字 - 会员
Web前端开发技术:HTML、CSS、JavaScript(第3版)
本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超计算机13.2万字 - 会员
深入浅出Java虚拟机:JVM原理与实战
本书主要以Java虚拟机的基本特性及运行原理为中心,分析了JVM的组成结构和底层实现,介绍了很多性能调优的方案和工具的使用方法。最后还扩展介绍了JMM内存模型的实现原理和Java编译器的优化机制。计算机12.1万字 - 会员
Python机器学习之金融风险管理
近年来,人工智能技术得到了快速发展,并在金融风险管理领域逐渐渗透。本书旨在引导读者了解金融风险建模背后的理论,学会在金融风险管理业务中运用Python语言和一系列机器学习模型。本书分为三部分,第一部分(第1~3章)介绍风险管理的基础知识,第二部分(第4~8章)通过一系列案例将机器学习模型运用到市场风险管理、信用风险管理、流动性风险管理和运营风险管理等场景,第三部分(第9章、第10章)讲解如何对其他计算机8.6万字