Привет, я написал программу для экранирования страницы для URL-адресов, извлекая текстовое содержимое «href» и добавляя его к базовому URL-адресу. Затем URL-адрес записывается в ячейку на листах Google через gspread.
У меня проблема в том, что каждый раз, когда я запускаю программу, она снова начинается с ячейки 1. Поэтому я хочу проверить самую высокую пустую ячейку и запустить программу оттуда.
entire_wks=gsr.fetchEnitreSheet()
numrows=len(entire_wks.col_values(1))
for x in range(1,numrows+1):
col=1
row=x
print(x)
chem = entire_wks.cell(x, 1).value
for item in soup.find_all('a'):
if chem in str(item):
url=base_url+item.get('href') #pulls the href from the web page
print("updating cell, row=",x,"with url=",url)
entire_wks.update_cell(x, 2, url)
time.sleep(1) #just to stop the sheets API getting bombarded with too frequent requests
Поэтому я думаю, что мне нужно что-то вроде этого:
numrows=len(entire_wks.col_values(1))
last_cell= entire_wks.col(1).get_highest_row() ###I MADE THIS UP###
for x in range(last_cell,numrows+1):
#then the rest of the code to insert the new URLs into the blank cells
Скриншот таблицы Google
Может ли кто-нибудь просветить меня о том, как я могу это сделать?