一.修改爬虫文件1.导入scrapy-redis模块:from scrapy_redis.spiders import RedisSpider
2.将当前爬虫类的父类修改成RedisSpider
3.将allowed_domains和start_urls进行删除
4.添加一个新的属性redis_key = 'xxx',该属性值表示的就是可以被共享的调度器队列的名称
二.进行配置文件的配置1.保证爬虫文件发起的请求都会被提交到可以被共享的调度器的队列中
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
2.保证爬虫文件提交的item...
from selenium import webdriver
# 1.创建浏览器对象
# chrome = webdriver.Chrome(executable_path='C:/python310/chromedriver.exe')
# service = webdriver.chrome.service.Service('C:/python310/chromedriver.exe')
from selenium.webdriver.chrome.service import Service as ChromeService
service = ChromeServ...
手动安装 inspetor
报错信息 No route found for /sessions
修改配置如图
配置的json信息{
"platformName": "Android",
"appium:platformVersion": "7.1.2",
"appium:deviceName": "SM-G977N",
"appium:appPackage": "com.android.browser",
"appium:appActivity": "BrowserActivity"
}
[scrapy.extensions.telnet] info: telnet console listening
这里默认会 telnet本机的一个端口 6023
因为本机开了代理导致的, 关闭本机代理即可
使用“from Crypto.Cipher import AES”相关函数解密:
#EXT-X-KEY 记录了加密的方式,一般是AES-128以及加密的KEY信息
出现问题:
from Crypto.Cipher import AES
pip install Crypto
出错
解决办法:
安装crypto库(首字母c是小写)
pip install crypto
进入python的库管理位置,site-packages文件夹,找到crypto,将其首字母c改为大写
判断是否解决的方式:
from Crypto.Cipher i...
0x01 下载安装tesseract
下载地址 : download
python安装 pytesseract
pip install pytesseractpip install pillow
0x02 配置环境变量
将Tesseract-OCR 加入到路径中
C:\Users\gyarmy\AppData\Local\Tesseract-OCR
0x03 验证安装# 命令如下
tesseract test.jpg result
cat result.txt
0x04 python 代码测试from PIL import Image
import pyt...
[该文章已设置加密,请点击标题输入密码访问]
xpath 定位节点
表达式
说明
nodename
选中该元素
/
从根节点选取、或者是元素和元素间的过渡
//
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
.
当前节点
..
父节点
@
属性
text()
选取文本节点
*
通配符
[@attr]
选取具有给定属性的所有元素
案例
https://i.hacking8.com/
//nav/ul/li/a/@href
节点的修饰语法
修饰语法
说明
...