Здесь все довольно просто... Итак, в настоящее время я экспериментирую с python, и у меня очень мало опыта... Я хотел создать парсер изображений, который переходит на страницу, загружает ссылку на изображение (следующая страница) и загружает другое изображение и так далее (в качестве источника я использую сайт, похожий на 9gag). Прямо сейчас мой скрипт может просто печатать URL-адрес изображения и URL-адрес следующей ссылки, поэтому я не могу понять, как заставить моего бота щелкнуть ссылку, загрузить следующее изображение и делать это бесконечно (пока условие не будет выполнено/остановлено и т. д.)...
PS я использую BeautifulSoup4 (я думаю LOL)
Заранее спасибо, Зил
Вот как сейчас выглядит скрипт, я как бы объединял пару скриптов в один, поэтому скрипт выглядит очень нечисто...
import requests
from bs4 import BeautifulSoup
import urllib
def trade_spider(max_pages):
page = 1
while page <= max_pages:
url2 = 'http://linksmiau.net/linksmi_paveiksliukai/rimtas_rudeninis_ispejimas_merginoms/1819/'
url = url2
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for img in soup.findAll('img', {'class': 'img'}):
temp = img.get('src')
if temp[:1]=="/":
image = "http://linksmiau.net" + temp
else:
image = temp
print(image)
for lnk in soup.findAll('div', {'id': 'arrow_right'}):
nextlink = lnk.get('onclick')
link = nextlink.replace("window.location = '", "")
lastlink = "http://linksmiau.net" + link
page += 1
print(lastlink)
url2 == lastlink
trade_spider(3)