Это проблема контролируемого обучения.
У меня есть ориентированный ациклический граф (DAG). Каждое ребро имеет вектор признаков X, а каждый узел (вершина) имеет метку 0 или 1. Задача состоит в том, чтобы найти функцию стоимости w(X), такую, чтобы кратчайший путь между любой парой узлов имел наибольшее отношение От 1 до 0 (минимальная ошибка классификации).
Решение должно хорошо обобщаться. Я попробовал логистическую регрессию, и изученная логистическая функция довольно хорошо предсказывает метку узла, дающую характеристики входящего ребра. Однако такой подход не учитывает топологию графа, поэтому решение во всем графе неоптимально. Другими словами, логистическая функция не является хорошей весовой функцией, учитывая описанную выше постановку задачи.
Хотя моя постановка задачи не является типичной постановкой задачи бинарной классификации, вот хорошее введение в нее: http://en.wikipedia.org/wiki/Supervised_learning#How_supervised_learning_algorithms_work
Вот еще некоторые подробности:
- Каждый вектор признаков X представляет собой d-мерный список действительных чисел.
- Каждое ребро имеет вектор признаков. То есть, учитывая набор ребер E = {e1, e2, .. en} и набор векторов признаков F = {X1, X2 ... Xn}, тогда ребро ei связано с вектором Xi.
- Можно придумать функцию f (X), так что f (Xi) дает вероятность того, что ребро ei указывает на узел, помеченный 1. Примером такой функции является упомянутая выше, найденная с помощью логистического регресс. Однако, как я уже говорил выше, такая функция неоптимальна.
ТАК ВОПРОС: Учитывая граф, начальный узел и конечный узел, как мне узнать оптимальную функцию стоимости w (X), чтобы отношение узлов 1 к 0 было максимальным (минимальная ошибка классификации)?