Вопросы по теме 'beautifulsoup'
Проблема с удалением html-тегов при использовании Beautiful Soup
Я использую красивый суп, чтобы очистить некоторые данные с веб-сайта, но я не могу удалить теги html из данных при их печати. Ссылочный код:
import csv
import urllib2
import sys
from bs4 import BeautifulSoup
page =...
02.12.2023
Запросы Python и robots.txt
У меня есть скрипт, предназначенный для личного использования, который очищает некоторые веб-сайты для получения информации, и до недавнего времени он работал нормально, но, похоже, один из веб-сайтов усилил свою безопасность, и я больше не могу...
03.01.2024
BeautifulSoup анализирует вложенные теги div
Мне нужно выбрать второй div из следующей структуры
<div>
A
**<div>**
B
<div>
C
</div>
</div>
</div>
<div>
A
**<div>**
B
<div>
C...
27.11.2023
Красивый суп и неправильные списки
Я пытаюсь вытащить данные из дрянного приложения, которое хранит свои данные в HTML. У меня есть участок кода, который выглядит так:
<span id="blah">
item 1 <br />
item 2 <br />
item 3 <br />
</span>
Я...
13.12.2023
Простой скрипт очистки изображений Python
Здесь все довольно просто... Итак, в настоящее время я экспериментирую с python, и у меня очень мало опыта... Я хотел создать парсер изображений, который переходит на страницу, загружает ссылку на изображение (следующая страница) и загружает другое...
07.11.2023
Красивый суп. Как найти все ссылки с 3 атрибутами
Как я могу найти все ссылки, которые имеют 3 атрибута, используя красивый суп?
Я хотел бы найти все ссылки, которые включают все атрибуты:
a id="js_24" class="_27jf _3emk" data-hover="tooltip"
Я пробовал так:
emo = soup.find_all('a',...
05.01.2024
BeautifulSoup4: изменить текст внутри тега xml
Я просто хочу изменить текст внутри тега xml после того, как он станет объектом BeautifulSoup.
Текущий код:
example_string = '<conversion><person>John</person></conversion>'
bsoup = BeautifulSoup(example_string)...
14.01.2024
Beautiful Soup Find() возвращает AttributeError
У меня есть веб-страница, настроенная следующим образом:
//a bunch of container divs....
<a class="food cat2 isotope-item" href="#" style="position: absolute; left: 45px; top: 0px;">
<div...
07.12.2023
Не удается удалить некоторые элементы с веб-сайта zillow
Я пытаюсь очистить содержимое веб-сайта zillow.
Ex- https://www.zillow.com/homedetails/689-Luis-Munoz-Marin-Blvd-APT-508-Jersey-City-NJ-07310/108625724_zpid/
Проблема в том, что я не могу очистить содержимое ценовой и налоговой истории. Я...
10.01.2024
BeautifulSoup: сбор заголовков с www.themoviedb.org
Я знаю, что это специфично, но я ищу способ очистить следующий веб-сайт:
https://www.themoviedb.org/discover/movie?page=1
и вернуть список названий фильмов.
Я пробовал BeautifulSoup:
from bs4 import BeautifulSoup
import requests
r =...
10.01.2024
Определение HTML-элемента на веб-странице для просмотра веб-страниц
Вот HTML-код:
<span class="milestone">Announcement:</span>
" 2 April 2000 "
<br>
<span class="milestone">Ground Breaking:</span>
" 23 February 2002
<br>
etc.
На веб-странице я...
02.01.2024
Красивый стол для супа с перерывами на стол
Я пытаюсь скопировать таблицу в фрейм данных. Моя попытка возвращает только имя таблицы, а не данные в строках для каждого региона.
Это то, что у меня есть до сих пор:
from bs4 import BeautifulSoup as bs4
import requests
url =...
11.01.2024
Веб-скрейпинг Beautifulsoup.
Я пытаюсь очистить данные от DnDbeyond. Я использую Beautifulsoup и python и смог получить некоторую информацию, которая мне нужна, с помощью тега «Div» и классов «Find_all», но я не могу найти информацию из этих отформатированных блоков, которые...
27.10.2023
BeautifulSoup: анализировать динамический контент JavaScript
Я разрабатываю скрейпер на Python с помощью BeautifulSoup, который анализирует списки продуктов из этот веб-сайт и извлекает некоторую информацию для каждого списка продуктов (например, цену, поставщика и т. д.). Я могу извлечь большую часть этой...
01.11.2023
Как извлечь элементы с одинаковыми тегами в одном и том же div в BeautifulSoup с помощью Python?
Я новичок, изучаю Python через небольшие проекты, поэтому в настоящее время изучаю парсинг в Интернете с помощью BeautifulSoup. HTML страницы выглядит так:
<div class="BrandList"> <div><b>Brand Name: </b>ONCOTRON...
06.01.2024
Очистите динамически загружаемую страницу с помощью BeautifulSoup
Я новичок в пакете BeautifulSoup. Я пытаюсь собрать все рецепты блюд, ссылки и ингредиенты с сайта https://indianrecipes.com/new_and_popular . Проблема в том, что этот сайт загружает больше еды только при прокрутке вниз. Я передал этот вопрос...
19.11.2023
Использование многопроцессорности для улучшения очистки Википедии с помощью BeautifulSoup
Я использую BeautifulSoup, чтобы собрать базовую информацию с нескольких страниц Википедии. Программа работает, но медленно (около 20 минут на 650 страниц). Я пытаюсь использовать многопроцессорность, чтобы ускорить это, но это не работает должным...
09.12.2023
Невозможно извлечь href из тегов в элементах span
Я пытаюсь извлечь ссылки href (показаны ниже) после извлечения тегов span. Однако выдает следующую ошибку:
Трассировка (последний последний вызов): файл «C:/Users/qeq981/Desktop/work.py», строка 34, в print(element.find('a')['href']) TypeError:...
03.11.2023
Очистка поля Красивым супом
Я новичок в парсинге веб-страниц. Я не могу получить поле (имя пользователя) с веб-страницы.
Это HTML-код веб-страницы с интересующим меня полем.
<div class="block-body">
<div class="block-row...
17.01.2024
Beautiful Soup не дает фактический тег div
Я пытаюсь очистить городской словарь с помощью Python . Но в настоящее время я сталкиваюсь с некоторыми проблемами.
Сначала я решил очистить
‹div class = def-panel...
теги div, которые содержат информацию о слове. Например, смысл,...
11.12.2023
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..