Scrapy框架get() 、getall() 、extract() 、extract_first()的区别

官方解释说明

extract() and extract_first()
If you’re a long-time Scrapy user, you’re probably familiar with .extract() and .extract_first() selector methods. Many blog posts and tutorials are using them as well. These methods are still supported by Scrapy, there are no plans to deprecate them.
However, Scrapy usage docs are now written using .get() and .getall() methods. We feel that these new methods result in a more concise and readable code.
#中文翻译
如果您是Scrapy的长期用户,则可能熟悉.extract()和.extract_first()选择器方法。许多博客文章和教程也正在使用它们。Scrapy仍支持这些方法,没有计划弃用它们。
但是,Scrapy用法文档现在使用.get()和 .getall()方法编写。我们认为这些新方法可以使代码更简洁易读。

get() 、getall() 是新版本的方法,extract() 、extract_first()是旧版本的方法。

前者更好用,取不到就返回None,后者取不到就raise一个错误。

推荐使用新方法,官方文档中也都改用前者。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注