Вопросы по теме 'nokogiri'
Nokogiri, open-uri и символы Unicode
Я использую Nokogiri и open-uri, чтобы получить содержимое тега title на веб-странице, но у меня проблемы с акцентированными символами. Каков наилучший способ справиться с этим? Вот что я делаю:
require 'open-uri'
require 'nokogiri'
doc =...
22.12.2023
При возврате списка элементов в массиве я получаю Errno::EINVAL: неверный аргумент в Textmate, но НЕ IRB
См. обновления ниже
Итак, это мой код:
def add_category(new_url)
new_url + '/web/'
end
url = 'http://www.someurl.com'
def modify_my_list(list)
puts "The number of links in this list are: #{list.count}"
list.each do |i, k|...
09.01.2024
Создание веб-краулера на Ruby. Как решить проблемы с производительностью?
Я создаю веб-сканер на Ruby, Rails в качестве внешнего интерфейса. Я использую Mechanize, который построен поверх Nokogiri. Я уже реализовал решение, которое будет сканировать веб-страницы, но я хочу иметь возможность сканировать 200 000 веб-сайтов...
08.11.2023
Пространство имен для включенных элементов XInclude
Рассмотрим эти два XML-документа:
а.xml
<a xmlns="foo" xmlns:xi="http://www.w3.org/2001/XInclude">
<xi:include href="b.xml" parse="xml" />
</a>
б.xml
<b>Hi Mom!</b>
В каком пространстве имен должен...
25.12.2023
Создание пустых XML-тегов с помощью Nokogiri?
Я пытаюсь создать XML-документ с помощью Nokogiri. Пока все довольно стандартно; большая часть моего кода выглядит примерно так:
builder = Nokogiri::XML::Builder.new do |xml|
...
xml.Tag1(object.attribute_1)...
13.11.2023
Как выполнить итерацию по узлам просмотра, возвращенным с помощью вызова поиска драгоценных камней amazon-ecs?
Я пишу внутреннее приложение для мониторинга наших продуктов, перечисленных на Amazon, и застрял с Amazon Product Advertising API (amazon-ecs ) Рубиновый драгоценный камень. Я хотел бы отобразить на экране узлы просмотра, подобные этому:...
17.11.2023
Как найти текст за границами тегов HTML?
У меня есть такой HTML:
<div>Lorem ipsum <b>dolor sit</b> amet.</div>
Как я могу найти совпадение на основе простого текста для моей строки поиска ipsum dolor в этом HTML? Мне нужны указатели на начальный и конечный...
31.12.2023
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..