Nano Hash - криптовалюты, майнинг, программирование

Как использовать Google Voice API в Android

Мне нужно разработать приложение для Android, в котором пользователь что-то говорит, а ОС отправляет wav-файл на сервер, где API-интерфейс googlespeech должен возвращать некоторый текст, и я буду отображать его на экране активности Android.

Примечание. Не путайте себя с библиотекой преобразования текста в речь Android. Мне нужно отправить wav-файл
на клиентский сервер.

Проблема: я понятия не имею, как использовать этот API. Я могу записать голос с клиента и сохранить его в файле wav, но не знаю, как это сделать.

Ссылочная ссылка: http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/


Ответы:


1

На самом деле вы не можете записать файл wav и использовать его. На данный момент единственный способ сделать это — получить голос с микрофона с помощью намерения Android:

Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, "en-EN");
startActivityForResult(intent, CODE);

И тогда вы можете получить результат в функции onActivityResult:

protected void onActivityResult(int requestCode, int resultCode, Intent data) {
        List<String> matches = data.getStringArrayListExtra(
                RecognizerIntent.EXTRA_RESULTS);

}

Это основная идея.

28.01.2012
  • хорошо, чем в каком формате я сохраняю записанный носитель и не могу ли я преобразовать его в wav или что-то подходящее, чтобы я использовал API речи Google для Интернета, а не библиотеку TTS для Android ?? 29.01.2012
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..