Я хочу создать небольшую «диалоговую систему» на основе фонем, которая слушает речь, преобразует ее в строку фонем (как бы неправильно это ни было), обрабатывает/сохраняет их и воспроизводит на уровне фонемы. я стремлюсь использовать либо фестиваль / mbrola с ним, либо espeak. все работает на Raspberry Pi (проект называется babble pi).
я следовал очень хорошим инструкциям здесь: https://wolfpaulus.com/jounal/embedded/raspberrypi2-sr/
и я также получаю хорошее признание с помощью команды:
pocketsphinx_continuous -hmm /usr/local/share/pocketsphinx/model/en-us/en-us -lm 3199.lm -dict 3199.dic -samprate 16000/8000/48000 -inmic yes
теперь я прочитал эту статью о распознавании фонем здесь, на сайте sourceforge: http://cmusphinx.sourceforge.net/wiki/phonemerecognition
а также понял, что у prealpha5 явно новый бинарный формат. в статье о распознавателе фонем говорится, что в основном распознаватель английских фонем является частью установочного пакета по умолчанию, и поэтому предлагается протестировать его через:
pocketsphinx_continuous -infile test/data/goforward.raw -hmm en-us -allphone model/en-us/en-us-phone.lm.dmp -backtrace yes -beam 1e-20 -pbeam 1e-20 -lw 2.0
Я предполагаю, что статья о фонемах относится к более старым версиям (pocket-)sphinx, поскольку она относится к .dmp вместо расширения файла .bin, и поэтому я попробовал:
pocketsphinx_continuous -infile test/data/goforward.raw -hmm en-us -allphone model/en-us/en-us-phone.lm.bin -backtrace yes -beam 1e-20 -pbeam 1e-20 -lw 2.0
но я получил следующую ошибку:
ERROR: "acmod.c", line 83: Folder 'en-us' does not contain acoustic model definition 'mdef'
глядя на en-us, там на самом деле только .dict, .lm.bin и телефонный файл. и еще один каталог en-us, содержащий файл mdef, а также несколько других. копирование не помогает.
так что делать? удалить prealpha5 и установить версию 4? или я могу скачать нужный файл где-нибудь?
-allphone_ci yes
к аргументам командной строки, чтобы сделать его быстрее, но менее точным. Словарный запас в 130 тысяч слов не имеет значения. 06.08.2015