原始版本 https://b.mortal.live/archives/txtspider增加了线程池的多线程爬虫解决了部分网站上存在的文字混合的问题,把图片转化成文字from turtle import htfrom matplotlib.pyplot import textimport requ
鼠标移动点击自己设置好之后,可以用来做重复性的人物from time import sleepimport pyautogui,keyboard# 长按 ESC 退出,3s以上while True: if keyboard.is_pressed("esc"):
没有代理可以设置proxies为空proxies={}import requestsfrom bs4 import BeautifulSoupimport reimport osimport timefrom lxml import etreeproxies={ 'http': 'http:/