快速使用Scrapy爬虫模拟cookies登录爬取页面

使用Scrapy爬虫读取网页时,如果目标数据是需要登录才能查看的页面,就需要处理cookies信息。很多人因此安装了其他更多的工具来处理cookies,其实仅凭Scrapy本身就可以完美实现爬取需要登[……]

继续阅读

python3.7下执行scrapy crawl命令SyntaxError: invalid syntax报错的解决方案

在win10环境下用python3.7写网页爬虫,采用scrapy1.5库时,执行一下命令:

scrapy startproject tutorial

可以正常创建项目文件,但是配置文件修改完毕,[……]

继续阅读