Вопросы по теме 'parsing'
Лучший способ обработки смешанного HTML и пользовательского ввода?
В приложении PHP, которое я пишу, я хотел бы, чтобы пользователи вводили в текст сочетание HTML и текста с остроконечными скобками, но когда я отображаю этот текст, я хочу, чтобы теги HTML отображались тегами, отличными от HTML. быть показанным...
24.12.2023
Разбор: загрузить в память или использовать поток
Я пишу небольшой синтаксический анализатор и хотел бы знать преимущества и недостатки различных способов загрузки данных для анализа. Я подумал о двух способах:
Загрузите содержимое файла в строку, затем проанализируйте строку (доступ к символу...
10.01.2024
Haskell -> После разбора как работать со строками
Здравствуйте, после парсинга скриптом на Haskell получил файл с "внешним видом" списков строк. Однако, когда я вызываю содержимое файла с помощью функции getContents или hGetContents , т. е. читая содержимое, я получаю что-то например: Строка...
11.11.2023
Если бы я хотел получить данные с веб-страницы с помощью Java, с чего бы я начал?
Поскольку Google начал предоставлять очень хорошие списки кино , я хотел бы сделать приложение для Android, чтобы пользователь мог брать информацию с этой страницы и отображать ее для области, которую они вводят.
Я не спрашиваю, как сделать...
29.11.2023
Спецификатор формата Float to String
У меня есть некоторые значения с плавающей запятой, которые я хочу преобразовать в строку, я хочу сохранить форматирование при преобразовании, то есть 999.0000 (с плавающей точкой) -> 999.0000 (строка). Моя проблема заключается в том, что когда...
12.01.2024
разбор scala с вложенными скобками
Попытка проанализировать вложенные выражения, такие как GroupParser.parse("{{a}{{c}{d}}}") После многих часов у меня теперь есть следующий фрагмент, который хорошо анализирует {a}, но терпит неудачу с
[1.5] failure: ``}'' expected but `{' found...
12.01.2024
Как эффективно анализировать файлы фиксированной ширины?
Я пытаюсь найти эффективный способ анализа файлов, который содержит строки фиксированной ширины. Например, первые 20 символов представляют столбец, с 21:30 — еще один и так далее.
Предполагая, что строка содержит 100 символов, как можно эффективно...
08.12.2023
есть ли синтаксис человеческого текста для парсера HTML PHP?
Я работаю над проектом по преобразованию вики-сайта github в автономную документацию, поэтому мне нужен синтаксический анализатор php для преобразования этих форматов в HTML:
Аскид
креольский
Уценка
МедиаВики
Организационный режим...
13.12.2023
Разбор контекстно-свободных языков в потоке токенов
Проблема
Учитывая контекстно-свободную грамматику с произвольными правилами и потоком токенов, как можно эффективно идентифицировать фрагменты потока, соответствующие грамматике?
Пример:
Грамматика
S -> ASB | AB
A -> a
B -> b...
16.11.2023
PHP DOM для анализа всех текстовых узлов
Есть ли способ получить массив всех текстовых узлов из строки HTML? Я хотел бы, чтобы он извлекал «вложенные» элементы независимо, поэтому такая строка:
<p>This is a <b>nested <i>HTML</i> tag<b>...</p>...
29.12.2023
Преобразование EBNF в BNF для парсера LALR
Я знаю, что есть несколько постов с похожим названием. Большинство ссылок на мертвый сайт - и в любом случае у меня есть более конкретный вопрос.
Я пытаюсь преобразовать EBNF в спецификации XPath в прямой BNF, поэтому что я могу легко создать...
26.12.2023
Достигнут конец файла во время разбора
Я продолжаю получать это сообщение, когда пытаюсь скомпилировать: Достигнут конец файла при разборе Кто-нибудь знает, почему? Единственное, что я понял, это то, что это как-то связано с моими фигурными скобками. Я пытался перемещать фигурные скобки,...
09.01.2024
XML в XLSX и наоборот с помощью java
Я должен выполнить эту задачу: мне дан файл xml, который экспортируется из приложения, мне нужно сделать из него файл xlsx, содержащий иерархию таблиц, внести изменения в файл xlsx с помощью excel, а затем вернуть его обратно в xml со всеми Эти...
28.10.2023
Datapower - для анализа HTML
У меня есть ситуация, когда базовое приложение предоставляет уровень пользовательского интерфейса, который, в свою очередь, должен отображаться как портлет. Однако я не хочу, чтобы все части первоначально представленного пользовательского интерфейса...
14.01.2024
Разобрать запрос JSON в C#
Я хочу разработать веб-сайт на С#, который анализирует данные из запроса JSON, чтобы использовать их позже. До сих пор я нашел все библиотеки для использования, но после многих попыток синтаксический анализ не работает, и мне нужна ваша помощь,...
20.01.2024
Разбор текстового файла в базу данных sql с использованием python
экстремальный новичок в python/sql здесь. Я искал помощь в этом, но не смог найти именно то, что мне нужно, - буду очень признателен за любую помощь.
Как видно из названия, у меня есть очень большой текстовый файл, который я хочу преобразовать в...
29.11.2023
Поиск последнего вхождения подстроки в строке, замена этого
Итак, у меня есть длинный список строк в одном формате, и я хочу найти последний "." символ в каждом и замените его на ". -". Я пытался использовать rfind, но я не могу правильно использовать его для этого.
25.12.2023
Как создать данные парсера?
Я пытаюсь узнать, как сделать анализатор выражений в Haskell, и я нашел этот код (ниже), но я даже не знаю, как его использовать.
Я пробовал с: expr (Add (Num 5) (Num 2)) , но ему нужен тип данных «Парсер».
import Text.Parsec
import...
02.01.2024
Как разобрать циклы Python с помощью скрипта Python?
Моя основная цель - разобрать циклы Python, чтобы я мог вставить несколько операторов для своего анализа.
Normal code:
#A.py
[code Starts]
.
.
.
while [condition]:
[statements]
[statements]
[statements]
.
.
.
[code ends]...
21.12.2023
разобрать строку в javascript по общему разделителю
В javascript у меня есть строка вида «/john/smith». Я хотел бы получить массив «имя»: «джон», «фамилия»: «кузнец».
Есть ли в js простая функция для анализа этой строки на основе разделителя? Я ничего не видел, и Google ничего не вернул, кроме...
10.12.2023
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..