Я запускаю многоклассовую логистическую регрессию (с LBFGS) со Spark 1.6.
учитывая x и возможные метки {1.0,2.0,3.0}, окончательная модель будет только выводить лучший прогноз, скажем, 2.0 .
Если мне интересно узнать, какой прогноз был вторым лучшим прогнозом, скажем, 3.0, как я могу получить эту информацию?
В NaiveBayes я бы использовал функцию model.predictProbabilities(), которая для каждой выборки выводит вектор со всеми вероятностями для каждого возможного результата.
LogisticRegressionModel
, один вspark.ml
и один вspark.mllib
. Только первый дает вам необработанные прогнозы. Я переписал ответ, чтобы объяснить это. Кажется, что проще всего просто использоватьspark.ml
, но если вы согласны с копированием кода из Spark, вы также можете сделать это с помощьюspark.mllib
. 09.02.2016