Я хочу выбрать все из html, кроме элемента <blockquote>
. Как это сделать самым простым способом с помощью Jsoup? Я знаю, что есть синтаксис :not
, но как его использовать в этом примере?
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class AppMain {
public static void main(String[] args) throws IOException {
String html = "<body> <blockquote> ...remove.this... </blockquote> ...get.this... </body>";
Document d = Jsoup.parse(html);
Element element = d.select(:not("blockquote").first(); // doesn't work
System.out.println(element.text()); // here I want get only: `...get.this...'
}
}
":not(blockquote)"
, и это ничего не дало. Я получаю:<html> <head></head> <body> <blockquote> ...remove.this... </blockquote> ...get.this... </body> </html>
Я просто хочу удалить этот блок цитат... 08.09.2017<blockquote>
и удалите их (добавлено в мой ответ). 08.09.2017