Публикации по теме 'keras'
Остаточные нейронные сети в Python
Как я построил классификатор радиоволн ResNet с помощью Keras
Люк Кербс и Джордж Уильямс ([email protected])
Вступление
В моем последнем блоге я резюмировал исследовательскую работу, в которой исследовалось использование остаточных нейронных сетей для классификации радиосигналов.
В этом блоге я познакомлю вас с Google Cloud Platform и покажу, как создать классификатор сигналов ResNet на Python с помощью Keras. Вот ссылка на мой GitHub с кодом ResNet: GitHub ...
Skipgram — Введение + Реализация с использованием набора данных Indo4b
Цель этой статьи — предоставить пошаговое руководство для SkipGram, типа алгоритма, используемого в обработке естественного языка (NLP) и, в частности, для встраивания слов, а также пример реализации с использованием набора данных Indo4b.
Что такое СкипГрам?
Skip-gram — это тип алгоритма, используемого в обработке естественного языка (NLP) и, в частности, при встраивании слов. Вложения слов — это плотные векторные представления слов, которые фиксируют их семантическое и синтаксическое..
Оптимизация производительности модели: руководство по настройке гиперпараметров в Python с помощью Keras
Настройка гиперпараметров — это процесс выбора наилучшего набора гиперпараметров для модели машинного обучения для оптимизации ее производительности. Гиперпараметры — это значения, которые нельзя узнать из данных, но которые устанавливаются пользователем перед обучением модели. Примеры гиперпараметров включают скорость обучения, размер пакета, количество скрытых слоев и количество нейронов в каждом скрытом слое.
Оптимизация гиперпараметров важна, поскольку она может значительно..
Использование нескольких функций для прогнозирования цены закрытия биткойнов (многомерное прогнозирование временных рядов с…
В этой статье мы попытаемся предсказать цену закрытия BTC, используя несколько функций, связанных с биткойнами — историческую цену, объем, данные по цепочке и т. д. Вы можете обратиться к 1-й части этой статьи , чтобы понять намерение LSTM и данные. Я курировал. Мы начнем с извлечения данных из CyptoCompare API, создания последовательных данных, затем построения и обучения нашей модели LSTM и, наконец, использования ее для прогнозирования наших тестовых данных.
Импорт данных
Сначала..
Вопросы по теме 'keras'
Керас плотный входной слой
Я в основном пользователь кафе, мне интересно, как я могу ввести свое цветное изображение в полностью подключенный слой, а затем сгладить его (я знаю, что это не лучшее решение, но оно мне нужно). Это образец, который не работает:
model =...
10.01.2024
Странное поведение зависшей сети inceptionV3 в Керасе
Я загружаю inceptionV3 keras net с помощью тензорного потока. После загрузки сохраненных весов и установки флага обучаемости для всех слоев на false, я пытаюсь подогнать под модель и ожидать, что все будет стабильно. Но потеря валидации...
28.10.2023
Сохранение стабильной модели в keras (глубокое обучение)
Я пытаюсь обучить модель. Я использую обратный вызов для контрольных точек, которые в основном сохраняют лучшую модель (с функцией минимальных потерь при проверке). У меня проблема в том, что иногда этот минимум находится в первых эпохах, и проверка...
14.01.2024
Форма Keras LSTM для Pandas DataFrame
Я играю с машинным обучением и пытаюсь следовать некоторым примерам, но застрял, пытаясь передать свои данные в слой Keras LSTM.
У меня есть некоторые данные биржевого тикера в Pandas DataFrame, которые передискретизируются с 15-минутными...
26.11.2023
Как получить нейронные активации и их вероятности от Softmax в Керасе
Я заметил, что с in keras predict_proba и predict я получаю один и тот же результат, который представляет собой список вероятностей класса. Но как я могу получить нейронные активации от функции Softmax в keras? Спасибо за помощь.
15.12.2023
Стратегия регуляризации в Керасе
Я пытаюсь настроить проблему нелинейной регрессии в Keras. К сожалению, результаты показывают, что происходит переобучение. Вот код,
model = Sequential()
model.add(Dense(number_of_neurons, input_dim=X_train.shape[1], activation='relu',...
07.01.2024
Внимательная свертка с keras
Я реализовал слой внимательной свертки в keras, как описано в этой статье .
Вы можете увидеть код для этого gist
Я новичок в реализации пользовательских слоев, и это все еще очень медленно. Я использую много tf.map_fn , и я думаю, что это...
04.12.2023
Программирование архитектуры нейронной сети с несколькими входами с помощью Keras
Я хочу запрограммировать нейронную сеть и использую для этого библиотеку Keras. Один набор данных делится на случайное количество подмножеств (1-100). Неиспользуемые подмножества обнуляются. Одно подмножество состоит из 2*4+1 двоичных входных...
19.01.2024
Автоэнкодер работает для MNIST, но дает сбой для изображений большего размера
Я пытался следовать руководству по Keras , чтобы создать автоэнкодер для MNIST. Автоэнкодер сработал, а затем я попытался изменить изображения и, следовательно, форму ввода с 28, 28, 1 на 150, 150, 3 , и я получаю следующую ошибку:...
10.12.2023
Установка Keras сломала виртуальную среду Conda (Windows 10)
Я пытался установить Keras в своей среде Python 3.7, но затем заметил, что ни tensorflow, ни keras не поддерживают Python 3.7, они поддерживают 3.6 Затем я создал новую виртуальную среду с Python 3.6, используя conda/anaconda. Я смог чтобы...
13.01.2024
Ожидалось, что последний слой активации будет иметь форму (1,), но получил массив с формой (4,)
Разве мой последний слой не указывает количество классов? Что ожидает что-то формы 1?
Я пытаюсь классифицировать изображения по 4 группам. Мои слои следующие:
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=(96, 96, 3)))...
04.12.2023
Преобразование списка Python в массив numpy для Keras CNN
У меня есть 200000 цветных изображений каждого размера (50x50x3), хранящихся в виде списка в Python. Поскольку все это в списке, я хочу изменить его на пустой массив размерности (200000,50,50,3). Однако использование np.toarray(list) возвращает...
03.12.2023
В чем разница между слоями SeparableConv2D и Conv2D?
Я не нашел четкого ответа на этот вопрос в Интернете (извините, если он существует). Я хотел бы понять разницу между двумя функциями ( SeparableConv2D и Conv2D ), шаг за шагом, например, с входным набором данных (3,3, 3) (как изображение RGB)....
20.01.2024
Сопоставление вложений сущностей с исходными категориальными значениями
Я использую слои внедрения Keras для создания вложений сущностей, ставших популярными в магазине Kaggle Rossmann Store Sales Запись, занявшая 3-е место. Однако я не уверен, как вернуть вложения обратно к фактическим категориальным значениям....
01.11.2023
Как указать вход со списком массивов для слоя встраивания в Keras?
Я пытаюсь выполнить генерацию текста на уровне слов и столкнулся с следующей проблемой:
Мой ввод выглядит так:
tokenized_seq = [[w2v_model.wv.vocab[word].index for word in w2v_data[i]] for i in range(len(w2v_data))]
x_seq = []
y_seq =...
19.01.2024
Прогнозирование с разным временным шагом с помощью модели, обученной для данных с разным временным шагом
Я обучил свой LSTM с 3 временными шагами. Ниже приведен слой Keras LSTM.
model.add(LSTM(32, return_sequences=True, input_shape=(None, 3))).
ex:
X Y
[[1,2,3],[2,3,4],[4,5,6]] [[4],[5],[7]]
Теперь...
16.01.2024
Как аппроксимировать функцию, используя другую функцию - NN
Итак, существует универсальная теорема об аппроксимации, которая гласит, что нейронная сеть может аппроксимировать любую непрерывную функцию при условии, что она имеет хотя бы один скрытый слой и использует там нелинейную активацию.
Итак, мои...
17.01.2024
Почему после тренировки модель кераса становится больше?
Я замечаю, что создаю модель, используя tensorflow.keras.Sequential() , сохраняю ее, и размер файла составляет около 5 МБ, но после того, как я вызываю model.fit(..) , размер файла увеличивается до 17 МБ. Я скопировал модель, чтобы уменьшить размер...
08.11.2023
tensorflow.python.framework.errors_impl.InvalidArgumentError: вы должны указать значение для тензора-заполнителя 'sequential_input'
Я работаю над проблемой классификации OVA (один против всех). Для этого я обучил бинарные классификаторы Keras с сигмовидной функцией и binary_crossentropy. Мне нужно объединить их в мультиклассовую модель, аналогичную здесь Когда я пытаюсь это...
26.12.2023
Глубокое обучение - определение того, является ли данное изображение аномалией / новинкой / выбросом?
У меня есть только данные об изображениях класса "Positive" из эксперимента, и задача состоит в том, чтобы обучить их с помощью сети глубокого обучения. Все, что немного отличается от указанной выше категории, следует классифицировать как аномалию /...
27.11.2023
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..