Scrapy教程

(1)Scrapy教程

by giser · 2018-11-28

目录

Toggle

Scrapy是什么?

Scrapy是使用Python编写的一个快速开源Web抓取框架，使用基于XPath选择器来提取网页中的数据。

历史

Scrapy最初是在 2008年6月26日在BSD许可协议下发布，并在2015年6月发布的一个里程碑版本1.0。

为什么要使用Scrapy？

它更容易构建和大规模的抓取项目；
它内置的机制被称为选择器，用于从网站（网页）上提取数据；
它异步处理请求，速度十分快；
它可以使用自动调节机制自动调整爬行速度；
确保开发人员可访问性；

Scrapy的特点

Scrapy是一个开源和免费使用的网络爬虫框架；
Scrapy生成格式导出如：JSON，CSV和XML；
Scrapy内置支持从源代码，使用XPath或CSS表达式的选择器来提取数据；
Scrapy基于爬虫，允许以自动方式从网页中提取数据；

优点

Scrapy很容易扩展，快速和功能强大；
这是一个跨平台应用程序框架（在Windows，Linux，Mac OS和BSD）。
Scrapy请求调度和异步处理；
Scrapy附带了一个名为Scrapyd的内置服务，它允许使用JSON Web服务上传项目和控制蜘蛛。
也能够刮削任何网站，即使该网站不具有原始数据访问API；

缺点

Scrapy只面向Python2.7+以上版本；
不同的操作系统安装不太相同；

关注右侧公众号，随时随地查看教程
Scrapy教程目录

相关推荐

Tags: (1)Scrapy教程 scrapy

You may also like...

退出移动版