Nano Hash - криптовалюты, майнинг, программирование

Невозможно извлечь href из тегов в элементах span

Я пытаюсь извлечь ссылки href (показаны ниже) после извлечения тегов span. Однако выдает следующую ошибку:

Трассировка (последний последний вызов): файл «C:/Users/qeq981/Desktop/work.py», строка 34, в print(element.find('a')['href']) TypeError: объект 'NoneType' не подлежит подписке

Я использую следующий код:
result2 = soup.find_all('span', {'style': 'white-space: nowrap'}) for element in result2: print(element) print(element.find('a')['href'])

Однако, если я опускаю ['href'], я получаю все теги span:

<span style="white-space: nowrap"><a href="https://www.mobygames.com/game/linux/americas-army-operations">Linux</a> (<em>2003</em>)</span> <a href="https://www.mobygames.com/game/linux/americas-army-operations">Linux</a> <span style="white-space: nowrap"><a href="https://www.mobygames.com/game/macintosh/americas-army-operations">Macintosh</a> (<em>2003</em>)</span> <a href="https://www.mobygames.com/game/macintosh/americas-army-operations">Macintosh</a> <span style="white-space: nowrap"><a href="https://www.mobygames.com/game/windows/americas-army-operations">Windows</a> (<em>2002</em>)</span> <a href="https://www.mobygames.com/game/windows/americas-army-operations">Windows</a>

Как я могу извлечь href?

26.01.2020

  • Я не очень хорошо знаком с синтаксисом Python, но будет ли это element.find('a[href]') ? 27.01.2020
  • Нет. Я почти уверен, что это ('a')['href'], потому что он работает, когда я использую тот же код для извлечения hrefs из тегов div. 27.01.2020
  • Принятый ответ говорит, что в вашем коде нет ошибок/проблем, это правильно? 27.01.2020

Ответы:


1

С HTML-кодом, который вы разместили, скрипт работает нормально (поэтому ошибка должна быть в другом месте вашего HTML-кода).

Чтобы быть дополнительно уверенным в том, что вы извлекаете правильные теги, вы можете использовать селектор CSS span[style="white-space: nowrap"] a[href], чтобы выбрать только <a> тегов с "href=" под указанными <span> тегами.

Например (txt — это фрагмент вашего вопроса):

from bs4 import BeautifulSoup

soup = BeautifulSoup(txt, 'html.parser')

for a in soup.select('span[style="white-space: nowrap"] a[href]'):
    print(a['href'])

Отпечатки:

https://www.mobygames.com/game/linux/americas-army-operations
https://www.mobygames.com/game/macintosh/americas-army-operations
https://www.mobygames.com/game/windows/americas-army-operations
26.01.2020
  • @ usr2564301 Может быть тег <span> без <a> внутри. Поэтому TypeError исключение. 27.01.2020
  • Но не в поставленном вопросе. 27.01.2020
  • @ usr2564301 Нет, очевидно, ОП опубликовал фрагмент HTML, который работает с его кодом. Я отредактировал свой ответ. 27.01.2020
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..