Я достиг такого этапа на своем пути программирования, что я действительно с большим уважением отношусь к тем разработчикам, которые укладываются в сроки, особенно когда эти сроки устанавливаются людьми, которые не являются программистами, и они устанавливают их на основе своего «представления» о том, как долго проект надо брать.

В качестве добровольного проекта для моей церкви я создаю многофункциональное приложение, которое представляет собой текстовый редактор, транскрибатор аудио, поисковый интерфейс, способный использовать как ключевые слова, так и семантический поиск (и, по Его милости, скоро будет добавлено краткое изложение текста). способность).

Стремясь распространить Истину Евангелия Господа нашего Иисуса Христа, которая была почти затенена ложными учениями, о чем предупреждал апостол Павел в Галатам 1:6–9; 3:1–3 [Вся книга Послания к Галатам была написана как предостережение Церкви от верующих людей, проповедующих ложные учения с красивыми речами — Римлянам 16:17–18].

Мы работаем над расшифровкой аудио/видеосообщений, чтобы иметь возможность поделиться ими с большим количеством людей, и видим, насколько трудоемкой и чрезвычайно трудоемкой является ручная расшифровка аудио/видео сообщения [час аудио/видео может занять более 6 часов, или для большинства целый день на расшифровку, и есть аудио/видео сообщения, которые длятся более 10 часов, попробуйте представить, сколько времени это займет], даже если используются функции преобразования речи в текст Google Gboard.

Пытаясь упростить процесс, я рассказал о своих навыках и намерениях разработчика, и мне было поручено сконцентрироваться на создании приложения, но сосредоточиться только на реализации функции транскрибирования аудио/видео, поскольку это то, что крайне необходимо и на его выполнение было дано 2 недели. Я его выполнил за 3 недели, правда мне снятся кошмары о скрытых багах, которые есть в приложении.

Хотя большинство кнопок приложений не реагируют, так как их функции не реализованы. Я очень взволнован своим достижением: приложение смогло расшифровать 10-часовой аудиозапись 2 часа, предоставив другим легкую задачу расставлять акценты в расшифровке [кое-что, что я планирую автоматизировать с помощью интересных моделей восстановления пунктуации].

Я хотел бы поблагодарить Wanderson M. Pimenta за то, что их замечательный графический интерфейс PyQt был общедоступным, без которого я определенно не смог бы создать интерфейс достаточно быстро, и Martin Fitzpack за его замечательные книги по PyQt5, поскольку они служат отличным справочники при реализации функционала транскрибатора,

Наконец, Google и Houndify, потому что приложение использует как Google, так и Houndify API преобразования речи в текст, и я обнаружил, что, хотя Houndify работает в два раза медленнее, чем Google, он имеет тенденцию быть более точным. Хотя в качестве цели я стремлюсь сделать приложение полностью автономным, используя модели глубокого обучения для преобразования речи в текст.

Приложение действительно потрясающее! [по крайней мере, с моей точки зрения], он преобразует любое аудио/видео в формат .flac, и, поскольку Google или Houndify не позволят вам сбросить 10-часовое или 5-часовое видео на их API для их сразу переписать. Мне пришлось перебрать аудиофайл, чтобы отправить 100 секунд аудио в API и сохранить возвращенный текст.

Хорошо, я немного непреднамеренно соврал, приложение не просто расшифрует для вас ваше 10-часовое аудио/видео, оно позволит вам сбросить его, но не расшифрует. Вы должны разбить его на несколько 1-часовых аудио/видео, прежде чем оно будет расшифровано, это связано с проблемами памяти, поскольку аудио в формате .flac может стать очень большим и может привести к сбою некоторых систем, которым не хватает памяти.

Ух какие проблемы, с которыми я столкнулся, если бы не переполнение стека (Хвала ему — PBUI), этого приложения не было бы, самым напряженным было при попытке скомпилировать мои скрипты в .exe, и это было потому, что бинарного приложения FFMEG, которое я использовал для преобразования аудио/видео файлов в стандартный формат. Я решил эту проблему, изменив сторонний пакет, который я использовал для программного преобразования файлов.

Хотя графический интерфейс оставляет желать лучшего, основная цель достигнута, и это главное! Теперь передо мной стоит задача создания и размещения базы данных, а также резервной копии автономной базы данных [я буду использовать PostgreSQL , это единственная СУБД, которую я знаю], которая будет содержать стенограммы, а также реализовывать функцию поиска, которая сможет выполнять поиск в базе данных с использованием ключевых слов/семантического поиска [Теперь я понятия не имею, как это сделать!], а также у меня есть дали еще 2 недели.

Надеюсь, милостью Божьей, я буду публиковать свои успехи в течение следующих двух недель. Теперь позвольте мне вернуться к безумному кодированию и преследованию переполнения стека (PBUI).