Nano Hash - криптовалюты, майнинг, программирование

Нейронная сеть 0 против -1

Я несколько раз видел, как люди использовали -1 вместо 0 при работе с нейронными сетями для входных данных. Как это лучше и влияет ли это на какую-либо математику для его реализации?

Изменить: использование прямой и обратной связи

Редактировать 2: я попытался, но сеть перестала обучаться, поэтому я предполагаю, что математика должна где-то измениться?

Редактировать 3: Наконец-то нашел ответ. Математика для двоичной системы отличается от биполярной. Смотрите мой ответ ниже.

02.02.2010

Ответы:


1

Недавно было обнаружено, что формула сигмовидной и сигмовидной производной должна быть изменена при использовании биполярного вместо двоичного.

Биполярная сигмовидная функция: f(x) = -1 + 2 / (1 + e^-x)

Биполярная сигмовидная производная: f’(x) = 0.5 * (1 + f(x)) * (1 – f(x) )

09.03.2010
  • Посмотрите на эту ссылку для справки: aforgenet.com /фреймворк/документы/html/ 26.12.2012
  • спасибо, я пытался выяснить, почему моя сеть не тренировалась с биполярными целями, понял, что сигноид не был биполярным, но не смог найти производную, теперь отлично работает. 02.12.2013
  • Для завершения: Чтобы расширить от обычного f(x)=sigmoid до [a,b] sigmoid ([-1,+1] в нашем случае), возьмите g(x) = (b-a)f(x) + a (в нашем случае становится 2f(x) - 1) 01.07.2017

  • 2

    Это было давно, но, насколько я помню, это не повлияло на математику, необходимую для реализации сети (при условии, что вы не работаете с типом сети, который по какой-то причине ограничивает какую-либо часть процесс до неотрицательных значений). Одним из преимуществ является то, что он делает большее различие между входными данными и помогает усилить обучающий сигнал. Аналогично для выходов.

    Кто-то, кто сделал это совсем недавно, вероятно, может сказать больше (например, о том, имеет ли значение пересечение 0; я думаю, что да). И на самом деле отчасти это зависит от того, какой именно тип нейронной сети вы используете. Я предполагаю, что вы говорите о backprop или его варианте.

    02.02.2010
  • Да, используя backprop. Я могу понять, что взвешенный ввод был бы другим (т.е. если бы вес был 1,84, ввод 0 привел бы к 0, а -1 привел бы к -1,84), но я не знаю, лучше это или нет и почему. 02.02.2010
  • Это влияет на математику. 09.03.2010

  • 3

    Сеть быстро обучается, используя входные данные -1/1 по сравнению с 0/1. Кроме того, если вы используете входы -1/1, 0 означает «неизвестная запись/шум/не имеет значения». Я бы использовал -1/1 в качестве входных данных для своей нейронной сети.

    03.02.2010
  • Но нужно ли мне что-то менять или это должно работать, просто заменив 0 на -1. Как я уже сказал, я попробовал, но получил странные результаты. MSE продолжал выводить одно и то же число в каждую эпоху. 03.02.2010
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..