Публикации по теме 'rnn'
Стробированные рекуррентные единицы, объяснение с помощью матриц: часть 2, функция обучения и потери
Автор: Спаркл Рассел-Пулери и Дориан Пулери
В части первой этой серии руководств мы продемонстрировали матричные операции, используемые для оценки скрытых состояний и выходных данных для прямого прохода ГРУ. Исходя из наших плохих результатов, нам, очевидно, необходимо оптимизировать наш алгоритм и протестировать его на тестовом наборе, чтобы обеспечить возможность обобщения. Обычно это делается с использованием нескольких шагов / методов. В этом руководстве мы рассмотрим, что..
Прогноз биткойнов на основе полярности Twitter с использованием LSTM
Я действительно разочарован онлайн-статьями, они ставили заголовок вроде прогноз бла-бла с использованием LSTM , но в их статьях не было реального прогнозирования будущего, просто продолжайте сравнивать реальные тенденции с прогнозируемыми. Эй, даже ARIMA может сделать лучше да , если так! (Я малазиец, большую часть нашего разговора мы используем лах , чтобы показать снобизма, https://www.urbandictionary.com/define.php?term=lah )
TL; DR, вы можете скачать набор данных и записную..
Прогнозирование цены биткойна (BTC) с использованием сетей RNN-LSTM
Краткое изложение того, как сети RNN-LSTM можно использовать для точного прогнозирования цены биткойнов (BTC).
В последние пару лет RNN были довольно популярны и стали предпочтительным выбором нейронных сетей, когда речь шла о задачах, связанных с последовательными данными. Например, прогнозирование курса акций, прогнозирование слов и многое другое.
В этом блоге я реализовал модель RNN-LSTM для прогнозирования и фиксации движения биткойнов (BTC) с начала 2022 года.
Данные обучения для..
Вопросы по теме 'rnn'
Сглаживание двух последних измерений тензора в TensorFlow
Я пытаюсь преобразовать тензор из [A, B, C, D] в [A, B, C * D] и передать его в dynamic_rnn . Предположим, что я заранее не знаю B, C и D (они являются результатом сверточной сети).
Думаю, в Theano такая переформовка выглядела бы так:
x =...
07.11.2023
Обучение изменению размера ввода RNN на Tensorflow
Я хочу обучить RNN с другим размером ввода предложения X без заполнения. Логика, используемая для этого, заключается в том, что я использую глобальные переменные, и для каждого шага я беру пример, пишу прямое распространение, т.е. строю график,...
08.12.2023
Потери Tensorflow RNN LM не уменьшаются
Я пытаюсь обучить базовую однонаправленную языковую модель LSTM RNN в банке PennTree. Моя нейросеть работает, но потери на тестовом наборе совсем не уменьшаются. Мне интересно, почему это?
Параметры сети:
V = 10000
batch_size = 20
hidden_size...
22.12.2023
Новые материалы
Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..
Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально
Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..
Частный метод Python: улучшение инкапсуляции и безопасности
Введение
Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..
Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования
Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..
Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv)
Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..
Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..
Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..