Контролируемое обучение . Учитель/родитель/гид помогает вам учиться, предоставляя примеры и отзывы. Мы используем набор данных для обучения и тестирования. Когда вы обучаете модель, помечаете данные и сообщаете алгоритму, что правильно, а что неправильно, он считается контролируемым. Алгоритм понимает из данных, какие правильные и неправильные ответы для разных точек данных/записей. Затем он должен быть в состоянии сказать вам правильный ответ с определенным уровнем точности, когда новая точка данных представлена ​​​​алгоритму. Например, у нас есть модель, которая пытается предсказать рыночную стоимость дома. Мы можем использовать набор данных, в котором цена домов зависит от его размера, возраста, местоположения и т. д., и использовать этот помеченный набор данных для прогнозирования цены на определенный дом.

Обучение без учителя: нет формального процесса обучения. Думайте об этом как об «обучении на рабочем месте». Алгоритму дается набор данных, и его просят найти взаимосвязи, группировки, шаблоны, корреляции, кластеры точек данных аналогичного типа. Например, эти алгоритмы могут просматривать наборы данных из социальных сетей, таких как Facebook, Instagram и т. д., и сообщать нам, какие круги друзей являются наиболее сплоченными. Это также может помочь вам определить различные сегменты рынка, если у вас есть данные о клиентах, которые очень пригодятся в индустрии электронной коммерции.

Обучение с подкреплением. Обычно это процесс проб и ошибок, когда мы поощряем желаемое поведение и препятствуем нежелательному поведению. Мы подкрепляем модель в качестве награды за правильные действия. Например, оптимизация на основе моделирования, при которой мы создаем смоделированный мир, запускаем нашего агента в мире и вознаграждаем агента за правильные действия. Это очень часто используется в случаях использования автономного вождения, таких как создание функции вознаграждения, которая максимизирует, если транспортное средство остается на пути, и не получает вознаграждения, если оно отклоняется от пути.

Я буду углубляться в каждую категорию алгоритмов в своих следующих постах. Если у вас есть мысли/предложения/отзывы, буду рад их услышать.