Scrapy、Scrapy-Splash、Scrapy-Redis安装

最新推荐文章于 2025-04-19 12:13:52 发布

原创

最新推荐文章于 2025-04-19 12:13:52 发布 · 438 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

该博客详细介绍了如何在已经安装了docker的环境中，通过JupyterLab和终端步骤安装Scrapy、Splash、Scrapy-Splash以及Scrapy-Redis。首先确保配置了国内镜像，然后逐个安装每个组件，包括启动和关闭Splash的流程。Scrapyrt作为轻量级Scrapyd的安装也进行了提及。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前题：安装docker并能使用

安装完在JSON文件中加入国内镜像，阿里云需要自己申请。

"registry-mirrors": [
    "https://********.mirror.aliyuncs.com",
    "https://registry.docker-cn.com",
    "http://hub-mirror.c.163.com",
    "https://docker.mirrors.ustc.edu.cn"
  ]

其他前题：

已为anaconda配置好PATH

Scrapy 安装

JupyterLab 输入

pip install scrapy

import scrapy

Splash 安装

终端中输入：

docker run -p 8050:8050 scrapinghub/splash

成功安装返回类似如下内容

Digest: sha256:b4173a88a9d11c424a4df4c8a41ce67ff6a6a3205bd093808966c12e0b06dacf
Status: Downloaded newer image for scrapinghub/splash:latest
2021-02-01 04:53:28+0000 [-] Log o