Нейронная сеть 0 против -1

Я несколько раз видел, как люди использовали -1 вместо 0 при работе с нейронными сетями для входных данных. Как это лучше и влияет ли это на какую-либо математику для его реализации?

Изменить: использование прямой и обратной связи

Редактировать 2: я попытался, но сеть перестала обучаться, поэтому я предполагаю, что математика должна где-то измениться?

Редактировать 3: Наконец-то нашел ответ. Математика для двоичной системы отличается от биполярной. Смотрите мой ответ ниже.

neural-network math

02.02.2010

Ответы:

Недавно было обнаружено, что формула сигмовидной и сигмовидной производной должна быть изменена при использовании биполярного вместо двоичного.

Биполярная сигмовидная функция: f(x) = -1 + 2 / (1 + e^-x)

Биполярная сигмовидная производная: f’(x) = 0.5 * (1 + f(x)) * (1 – f(x) )

09.03.2010

Посмотрите на эту ссылку для справки: aforgenet.com /фреймворк/документы/html/ 26.12.2012

спасибо, я пытался выяснить, почему моя сеть не тренировалась с биполярными целями, понял, что сигноид не был биполярным, но не смог найти производную, теперь отлично работает. 02.12.2013

Для завершения: Чтобы расширить от обычного f(x)=sigmoid до [a,b] sigmoid ([-1,+1] в нашем случае), возьмите g(x) = (b-a)f(x) + a (в нашем случае становится 2f(x) - 1) 01.07.2017

Это было давно, но, насколько я помню, это не повлияло на математику, необходимую для реализации сети (при условии, что вы не работаете с типом сети, который по какой-то причине ограничивает какую-либо часть процесс до неотрицательных значений). Одним из преимуществ является то, что он делает большее различие между входными данными и помогает усилить обучающий сигнал. Аналогично для выходов.

Кто-то, кто сделал это совсем недавно, вероятно, может сказать больше (например, о том, имеет ли значение пересечение 0; я думаю, что да). И на самом деле отчасти это зависит от того, какой именно тип нейронной сети вы используете. Я предполагаю, что вы говорите о backprop или его варианте.

02.02.2010

Да, используя backprop. Я могу понять, что взвешенный ввод был бы другим (т.е. если бы вес был 1,84, ввод 0 привел бы к 0, а -1 привел бы к -1,84), но я не знаю, лучше это или нет и почему. 02.02.2010

Это влияет на математику. 09.03.2010

Сеть быстро обучается, используя входные данные -1/1 по сравнению с 0/1. Кроме того, если вы используете входы -1/1, 0 означает «неизвестная запись/шум/не имеет значения». Я бы использовал -1/1 в качестве входных данных для своей нейронной сети.

03.02.2010

Но нужно ли мне что-то менять или это должно работать, просто заменив 0 на -1. Как я уже сказал, я попробовал, но получил странные результаты. MSE продолжал выводить одно и то же число в каждую эпоху. 03.02.2010

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Typescript Smart Contracts Productivity Tech Startup Investing Neural Networks Developer Computer Science NLP