Nano Hash - криптовалюты, майнинг, программирование

Пользовательская форма обучения, выбор Отметить проблемы идентификации ограничивающей рамки

Я использую текущую предварительную версию FOTT, когда работаю над обучением пользовательской формы. Я заметил, что способность анализировать макет в некоторых случаях затрудняет определение отметок выбора. Я обучаю модель для использования со стандартной формой правительства США (MCSA-5876), поэтому у нас нет возможности изменить макет формы. Изображения загружаются в формате jpg, что является требованием этого проекта.

  1. Флажки (квадрат) вроде бы опознаются нормально
  2. Параметры радио работают большую часть времени, если параметр не установлен и изображение не искажается вообще.
  3. Радиоприемники, написанные от руки и заполненные знаком X, работают в большинстве случаев.
  4. Радиоприемники, поступающие из заполненного PDF-файла с точкой в ​​середине, чаще всего выходят из строя. Обратите внимание, что они отправляются нам в формате jpg, а не pdf.

Я попытался провести анализ некоторых заполненных PDF-файлов для тестирования, но результаты для них даже хуже, чем для jpg, в том, что касается выбора. Я также пробовал создавать свои собственные макеты форм и сохранять их в формате jpg с высоким разрешением, но они получили те же результаты, что и клиентские.

Я ищу предложения по повышению точности selectionMark. В настоящее время я работаю над настройкой обучающего набора для модели, содержащей более 20 изображений. Мне также интересно, есть ли способ изменить первоначальный анализ и указать ограничивающие рамки для выборок. Будет ли работать ручное редактирование файлов * .ocr.json в хранилище BLOB-объектов? Но определенно не идеальное решение.

Я прикрепил изображение, показывающее проблему, с которой я столкнулся. Радиоприемники, такие как MD, DO, Physician Assistant и т. Д., Не имеют ограничивающих рамок. Другие, такие как медсестра с продвинутой практикой и другой практикующий врач, делают. Если анализатор не может найти их для разметки, он не найдет их при анализе нового документа с использованием обученной модели. Таким образом, значение возвращается как null.

TIA Rich

Образец


Ответы:


1

Вы используете последнюю версию API Form Recognizer 2.1-preview.3? Мы постоянно улучшаем качество добычи. Я попробовал образец формы, и оба флажка и переключатели были извлечены. Не могли бы вы поделиться некоторыми образцами, в которых вы видели промахи (пожалуйста, анонимизируйте данные), вы также можете обратиться к Form Recognizer. Свяжитесь с нами [email protected] или откройте заявку в службу поддержки, и мы можем помочь.

Использовал последнюю версию испытательного инструмента FR - https://fott-preview.azurewebsites.net/layout-analyze выделенный выделенный текст и выделить отметки [1]: https://i.stack.imgur.com/Wk7yz.jpg

20.04.2021
  • Спасибо за ответ. Да, мы используем последнюю предварительную версию. Я соберу несколько образцов и отправлю их как можно скорее. - Богатый 21.04.2021
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..