Nano Hash - криптовалюты, майнинг, программирование

Обучите MFCC с помощью алгоритма машинного обучения

У меня есть наборы данных MFCC, которые, как я знаю, хороши. Я знаю, как поместить вектор-строку в алгоритм машинного обучения. У меня вопрос, как это сделать с MFCC, так как это матрица? Например, как бы я поместил это в алгоритм машинного обучения:?

http://archive.ics.uci.edu/ml/machine-learning-databases/00195/Test_Arabic_Digit.txt

Любой алгоритм будет работать. Я смотрю на двоичный классификатор, но буду изучать его больше. Scikit кажется хорошим ресурсом. А пока я просто хотел бы знать, как ввести MFCC в алгоритм. Шаг за шагом мне бы очень помог! Я искал во многих местах, но не нашел ответа.

Спасибо


  • Так что ты хочешь сделать? Передать звуковой файл A как функции и B как классы? 22.02.2017
  • Я перефразировал свой вопрос для ясности. Вопрос теперь включает ссылку. Мой набор данных выглядит именно так, и мне интересно, как передать это в алгоритм машинного обучения. 22.02.2017
  • Опять же, в приведенной вами ссылке куча цифр, что это? Почему между этими цифрами пустая строка? Существуют ли целевые классы классификации? Объясните данные 22.02.2017
  • Каждый блок представляет звуковой файл. Каждая строка представляет собой небольшую часть такого звукового файла (20-40 мс), а каждый столбец представляет собой коэффициенты мел частот кепстра (отсюда MFCC). Пустые строки отделяют звуковые файлы. Я думаю о создании столбца для целевых классов классификации, но пока не уверен, как его пометить, потому что для каждого звукового файла есть несколько строк. 22.02.2017
  • Каждая строка в чанке относится к одному и тому же таймфрейму для всех звуковых файлов. Или случайно? 22.02.2017
  • Первая строка каждого блока представляет временной интервал, например. 0-30мс, вторая строка будет 20мс-50мс и так далее. 22.02.2017
  • В порядке. Означает, что все фрагменты соответствуют одним и тем же временным рамкам. Верно? Затем вы можете развернуть все фрагменты в один вектор. Который будет вектором признаков для этого файла. Сделайте это для всех файлов, и вы получите свои тренировочные данные. 22.02.2017
  • Это звучит как хорошая идея, спасибо. Что делать, если у меня еще нет одинаковых временных рамок для всех звуковых файлов? Какими методами это сделать? 23.02.2017
  • Зависит от типа задачи классификации, которую вы решаете. Например, если найти характер звука (например, музыки), я думаю, что даже если нет одинаковых временных рамок для всех файлов, это может дать удовлетворительные результаты. 23.02.2017

Ответы:


1

В python вы можете легко сгладить матрицу, чтобы она стала вектором, например, вы можете использовать функцию выравнивания numpy и numpy, кроме того, мне приходит в голову идея (это просто идея может работать или не работать) использовать свертки , свертки очень хорошо работают с двумерными структурами.

21.02.2017
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..