Я пытаюсь прочитать некоторые записи из таблицы данных, заполненной именем, а затем столбцами чисел. Вот исходное изображение:
Между бинаризацией, преобразованием в черно-белое и просто инвертированием я обнаружил, что инвертирование изображения дает наилучшие результаты.
image = PIL.ImageOps.invert(image
Это позволяет мне обрабатывать примерно 90%+ столбцов, которые у меня есть, когда я прокручиваю вниз до большего количества изображений, но я все еще терплю неудачу с кучей из них. Иногда скобки в столбцах объединяют два числа, которые у меня есть в каждом столбце. Можно ли как-то исправить проблемы со скобками, которые смешиваются с числами, или, может быть, удалить весь зеленый текст?