课程大纲

简介

设置开发环境

Python入门:数据结构、条件语句、文件处理等

用于网页抓取的Python包:Scrapy和BeautifulSoup

网站的工作原理

HTML的结构

发起网页请求

抓取HTML页面

使用XPath和CSS

使用正则表达式过滤数据

创建网页爬虫

使用Selenium抓取AJAX和JavaScript页面

网页抓取最佳实践

故障排除

总结与结论

要求

  • 编程经验,最好有Python经验。如果参与者有其他编程语言的经验,培训可延长以包含更多Python入门练习。

受众

  • 开发人员
 7 小时

客户评论 (1)

即将举行的公开课程

课程分类