发布网友 发布时间:2022-04-19 23:51
共3个回答
热心网友 时间:2022-05-10 07:19
现在之所以有这么多的小伙伴热衷于爬虫技术,无外乎是因为爬虫可以帮我们做很多事情,比如搜索引擎、采集数据、广告过滤等,以Python为例,Python爬虫可以用于数据分析,在数据抓取方面发挥巨大的作用。热心网友 时间:2022-05-10 08:37
建议你买一本书,可以在家自学热心网友 时间:2022-05-10 10:28
可以按照我这套学习路线图来学习
一、Python入门
这一阶段,你需要学习的知识点:
如果学习能力还不错的话,这一阶段,只需要一个多月的时间
Python视频教程:
1、重磅级教程推荐,讲的非常好
Python入门教程完整版(懂中文就能学会):http://pan.baidu.com/s/1miwZ1WW
2、Python基础教程:http://pan.baidu.com/s/1kUZpbOb
二、知识运用
利用上述课程中的知识搭建简单的Web服务。熟悉Scrapy各模块。熟悉Django各模块的使用
1、Scrapy视频教程:http://pan.baidu.com/s/1dF3qhFV
教程简介:
(1)Scrapy的简介。
主要知识点:Scrapy的架构和运作流程。
(2)搭建开发环境:
主要知识点:Windows及Linux环境下Scrapy的安装。
(3)Scrapy Shell以及Scrapy Selectors的使用。
(4)使用Scrapy完成网站信息的爬取。
主要知识点:创建Scrapy项目(scrapy startproject)、定义提取的结构化数据(Item)、编写爬取网站的 Spider 并提取出结构化数据(Item)、编写 Item Pipelines 来存储提取到的Item(即结构化数据)。
2、Django教程:http://pan.baidu.com/s/1nvFlfU5
教程简介:
(1)Django的简介。
主要知识点:MVC设计模式以及Django的MVT。
(2)搭建开发环境:
主要知识点:Linux的虚拟环境搭建和应用、Django的安装。
(3)利用Django框架完成简单的图书项目:
主要知识点:编写模型,使用API与数据库交互、使用Django的后台管理管理数据、通过视图接收请求,通过模型获
3、Python全栈教程:http://pan.baidu.com/s/1dETyqXF
教程简介:
(1)HTTP协议的分析:
HTTP格式。
包含知识点:HTTP GET请求的格式、HTTP POST请求的格式、HTTP响应的格式。
(2)HTTP协议的使用(实现Web静态服务器):
利用HTTP协议实现Web静态服务器。
包含知识点:浏览器首先向服务器发送HTTP请求、服务器向浏览器返回HTTP响应、使用类。
(3)服务器动态资源请求(实现Web动态服务器):
利用WSGI实现Web动态服务器。
包含知识点:浏览器请求动态页面的过程介绍、WSGI的介绍、定义WSGI接口。