Я использую красивый суп, чтобы очистить некоторые данные с веб-сайта, но я не могу удалить теги html из данных при их печати. Ссылочный код:
import csv
import urllib2
import sys
from bs4 import BeautifulSoup
page = urllib2.urlopen('http://www.att.com/shop/wireless/devices/smartphones.html').read()
soup = BeautifulSoup(page)
soup.prettify()
for anchor1 in soup.findAll('div', {"class": "listGrid-price"}):
print anchor1
for anchor2 in soup.findAll('div', {"class": "gridPrice"}):
print anchor2
for anchor3 in soup.findAll('div', {"class": "gridMultiDevicePrice"}):
print anchor3
Вывод, который я получаю, выглядит следующим образом:
<div class="listGrid-price">
$99.99
</div>
<div class="listGrid-price">
$0.01
</div>
<div class="listGrid-price">
$0.01
</div>
Я хочу, чтобы на выходе были только цены без каких-либо html-тегов. Простите меня за мое невежество, так как я новичок в программировании.
anchor1
, вероятно, не то, что вы думаете. 19.12.2012anchor1.string
, и он работает, как и ожидалось. 19.12.2012