Обучите MFCC с помощью алгоритма машинного обучения

У меня есть наборы данных MFCC, которые, как я знаю, хороши. Я знаю, как поместить вектор-строку в алгоритм машинного обучения. У меня вопрос, как это сделать с MFCC, так как это матрица? Например, как бы я поместил это в алгоритм машинного обучения:?

http://archive.ics.uci.edu/ml/machine-learning-databases/00195/Test_Arabic_Digit.txt

Любой алгоритм будет работать. Я смотрю на двоичный классификатор, но буду изучать его больше. Scikit кажется хорошим ресурсом. А пока я просто хотел бы знать, как ввести MFCC в алгоритм. Шаг за шагом мне бы очень помог! Я искал во многих местах, но не нашел ответа.

Спасибо

21.02.2017

Так что ты хочешь сделать? Передать звуковой файл A как функции и B как классы? 22.02.2017
Я перефразировал свой вопрос для ясности. Вопрос теперь включает ссылку. Мой набор данных выглядит именно так, и мне интересно, как передать это в алгоритм машинного обучения. 22.02.2017
Опять же, в приведенной вами ссылке куча цифр, что это? Почему между этими цифрами пустая строка? Существуют ли целевые классы классификации? Объясните данные 22.02.2017
Каждый блок представляет звуковой файл. Каждая строка представляет собой небольшую часть такого звукового файла (20-40 мс), а каждый столбец представляет собой коэффициенты мел частот кепстра (отсюда MFCC). Пустые строки отделяют звуковые файлы. Я думаю о создании столбца для целевых классов классификации, но пока не уверен, как его пометить, потому что для каждого звукового файла есть несколько строк. 22.02.2017
Каждая строка в чанке относится к одному и тому же таймфрейму для всех звуковых файлов. Или случайно? 22.02.2017
Первая строка каждого блока представляет временной интервал, например. 0-30мс, вторая строка будет 20мс-50мс и так далее. 22.02.2017
В порядке. Означает, что все фрагменты соответствуют одним и тем же временным рамкам. Верно? Затем вы можете развернуть все фрагменты в один вектор. Который будет вектором признаков для этого файла. Сделайте это для всех файлов, и вы получите свои тренировочные данные. 22.02.2017
Это звучит как хорошая идея, спасибо. Что делать, если у меня еще нет одинаковых временных рамок для всех звуковых файлов? Какими методами это сделать? 23.02.2017
Зависит от типа задачи классификации, которую вы решаете. Например, если найти характер звука (например, музыки), я думаю, что даже если нет одинаковых временных рамок для всех файлов, это может дать удовлетворительные результаты. 23.02.2017

Ответы:

В python вы можете легко сгладить матрицу, чтобы она стала вектором, например, вы можете использовать функцию выравнивания numpy и numpy, кроме того, мне приходит в голову идея (это просто идея может работать или не работать) использовать свертки , свертки очень хорошо работают с двумерными структурами.

21.02.2017

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Smart Contracts Typescript Productivity Tech Startup Investing Neural Networks Developer Computer Science NLP