Nano Hash - криптовалюты, майнинг, программирование

Вопросы по теме 'beautifulsoup'

Проблема с удалением html-тегов при использовании Beautiful Soup
Я использую красивый суп, чтобы очистить некоторые данные с веб-сайта, но я не могу удалить теги html из данных при их печати. Ссылочный код: import csv import urllib2 import sys from bs4 import BeautifulSoup page =...

Запросы Python и robots.txt
У меня есть скрипт, предназначенный для личного использования, который очищает некоторые веб-сайты для получения информации, и до недавнего времени он работал нормально, но, похоже, один из веб-сайтов усилил свою безопасность, и я больше не могу...

BeautifulSoup анализирует вложенные теги div
Мне нужно выбрать второй div из следующей структуры <div> A **<div>** B <div> C </div> </div> </div> <div> A **<div>** B <div> C...
27.11.2023

Красивый суп и неправильные списки
Я пытаюсь вытащить данные из дрянного приложения, которое хранит свои данные в HTML. У меня есть участок кода, который выглядит так: <span id="blah"> item 1 <br /> item 2 <br /> item 3 <br /> </span> Я...
13.12.2023

Простой скрипт очистки изображений Python
Здесь все довольно просто... Итак, в настоящее время я экспериментирую с python, и у меня очень мало опыта... Я хотел создать парсер изображений, который переходит на страницу, загружает ссылку на изображение (следующая страница) и загружает другое...

Красивый суп. Как найти все ссылки с 3 атрибутами
Как я могу найти все ссылки, которые имеют 3 атрибута, используя красивый суп? Я хотел бы найти все ссылки, которые включают все атрибуты: a id="js_24" class="_27jf _3emk" data-hover="tooltip" Я пробовал так: emo = soup.find_all('a',...

BeautifulSoup4: изменить текст внутри тега xml
Я просто хочу изменить текст внутри тега xml после того, как он станет объектом BeautifulSoup. Текущий код: example_string = '<conversion><person>John</person></conversion>' bsoup = BeautifulSoup(example_string)...
14.01.2024

Beautiful Soup Find() возвращает AttributeError
У меня есть веб-страница, настроенная следующим образом: //a bunch of container divs.... <a class="food cat2 isotope-item" href="#" style="position: absolute; left: 45px; top: 0px;"> <div...

Не удается удалить некоторые элементы с веб-сайта zillow
Я пытаюсь очистить содержимое веб-сайта zillow. Ex- https://www.zillow.com/homedetails/689-Luis-Munoz-Marin-Blvd-APT-508-Jersey-City-NJ-07310/108625724_zpid/ Проблема в том, что я не могу очистить содержимое ценовой и налоговой истории. Я...

BeautifulSoup: сбор заголовков с www.themoviedb.org
Я знаю, что это специфично, но я ищу способ очистить следующий веб-сайт: https://www.themoviedb.org/discover/movie?page=1 и вернуть список названий фильмов. Я пробовал BeautifulSoup: from bs4 import BeautifulSoup import requests r =...

Определение HTML-элемента на веб-странице для просмотра веб-страниц
Вот HTML-код: <span class="milestone">Announcement:</span> "&nbsp; 2 April 2000 " <br> <span class="milestone">Ground Breaking:</span> "&nbsp; 23 February 2002 <br> etc. На веб-странице я...

Красивый стол для супа с перерывами на стол
Я пытаюсь скопировать таблицу в фрейм данных. Моя попытка возвращает только имя таблицы, а не данные в строках для каждого региона. Это то, что у меня есть до сих пор: from bs4 import BeautifulSoup as bs4 import requests url =...

Веб-скрейпинг Beautifulsoup.
Я пытаюсь очистить данные от DnDbeyond. Я использую Beautifulsoup и python и смог получить некоторую информацию, которая мне нужна, с помощью тега «Div» и классов «Find_all», но я не могу найти информацию из этих отформатированных блоков, которые...
27.10.2023

BeautifulSoup: анализировать динамический контент JavaScript
Я разрабатываю скрейпер на Python с помощью BeautifulSoup, который анализирует списки продуктов из этот веб-сайт и извлекает некоторую информацию для каждого списка продуктов (например, цену, поставщика и т. д.). Я могу извлечь большую часть этой...

Как извлечь элементы с одинаковыми тегами в одном и том же div в BeautifulSoup с помощью Python?
Я новичок, изучаю Python через небольшие проекты, поэтому в настоящее время изучаю парсинг в Интернете с помощью BeautifulSoup. HTML страницы выглядит так: <div class="BrandList"> <div><b>Brand Name: </b>ONCOTRON...

Очистите динамически загружаемую страницу с помощью BeautifulSoup
Я новичок в пакете BeautifulSoup. Я пытаюсь собрать все рецепты блюд, ссылки и ингредиенты с сайта https://indianrecipes.com/new_and_popular . Проблема в том, что этот сайт загружает больше еды только при прокрутке вниз. Я передал этот вопрос...

Использование многопроцессорности для улучшения очистки Википедии с помощью BeautifulSoup
Я использую BeautifulSoup, чтобы собрать базовую информацию с нескольких страниц Википедии. Программа работает, но медленно (около 20 минут на 650 страниц). Я пытаюсь использовать многопроцессорность, чтобы ускорить это, но это не работает должным...

Невозможно извлечь href из тегов в элементах span
Я пытаюсь извлечь ссылки href (показаны ниже) после извлечения тегов span. Однако выдает следующую ошибку: Трассировка (последний последний вызов): файл «C:/Users/qeq981/Desktop/work.py», строка 34, в print(element.find('a')['href']) TypeError:...
03.11.2023

Очистка поля Красивым супом
Я новичок в парсинге веб-страниц. Я не могу получить поле (имя пользователя) с веб-страницы. Это HTML-код веб-страницы с интересующим меня полем. <div class="block-body"> <div class="block-row...

Beautiful Soup не дает фактический тег div
Я пытаюсь очистить городской словарь с помощью Python . Но в настоящее время я сталкиваюсь с некоторыми проблемами. Сначала я решил очистить ‹div class = def-panel... теги div, которые содержат информацию о слове. Например, смысл,...

Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..