Я разбираю фрагмент html, не зная, что это фрагмент. Я использую HTML-парсер jsoup. Например:
String html = "<script>document.location = \"http://example.com/\";</script>";
Document document = Jsoup.parse(html);
System.out.println(document.html());
Вывод:
<html>
<head>
<script>document.location = "http://example.com/";</script>
</head>
<body></body>
</html>
Вопрос: Есть ли способ узнать, что теги <html>
, <head>
и <body>
были добавлены Jsoup, а не в исходном html-фрагменте?
Обновлять:
Я также попытался включить отслеживание ошибок:
Parser parser = Parser.htmlParser();
parser.setTrackErrors(500);
Document document = parser.parseInput(html, "example.com");
ParseErrorList errors = parser.getErrors();
Но я получаю пустой список ошибок.