Глубокое обучение - определение того, является ли данное изображение аномалией / новинкой / выбросом?

У меня есть только данные об изображениях класса "Positive" из эксперимента, и задача состоит в том, чтобы обучить их с помощью сети глубокого обучения. Все, что немного отличается от указанной выше категории, следует классифицировать как аномалию / выброс? [Получение данных отрицательного класса из того же эксперимента - довольно сложная задача]

P.S: Не будет большой разницы между двумя классами данных. И задача состоит в том, чтобы использовать глубокое обучение без необходимости определять или давать какие-либо функции из изображений. Кроме того, для положительных данных о классе доступно лишь ограниченное количество изображений (около 300-400).

Позитивное изображение класса

Простое предположение о том, как будет выглядеть аномальное изображение

Я считаю, что это совсем не обучение без учителя, потому что я знаю ярлыки одного из классов. Я попытался использовать для этого OneClassSVM без определения каких-либо функций (только что попробовал - мало знаний о SVM). Также пробовал использовать сверточные автоэнкодеры из этого "https://github.com/artem-hryb/cnn-anomaly-detection-keras "и Deep Autoencoders из" https://github.com/otenim/AnomalyDetectionUsingAutoencoder ". Некоторое пороговое значение было установлено на основе обучения вышеуказанных моделей, а затем оно использовалось для прогнозирования, является ли данное изображение аномалией или нет. Прогнозы не оправдались.

Если бы кто-нибудь мог указать мне правильное направление, это было бы большим подспорьем.

30.08.2019

Поскольку вы знаете, что у вас нормальные данные, просто закодируйте все остальные данные как аномалию, тогда вы можете запустить сверточную нейронную сеть 2 классов. 30.08.2019
Привет. Если я правильно понимаю, мне нужны другие данные класса, чтобы закодировать их как аномалию, верно !? Если у меня есть только один класс данных, я не знаю, как это сделать. Не могли бы вы немного уточнить. (Извините, если это звучит глупо) 30.08.2019
Насколько я понимаю, у вас есть 2 вида изображений. Нормальные изображения, в наборе данных вы знаете, что такое нормальное изображение, и все нормальные изображения принадлежат к одному классу. Изображение аномалии, они могут принадлежать к разным классам, и вы не знаете их ярлык. 30.08.2019
Поскольку ваша цель - узнать, принадлежит ли изображение к нормальному или аномальному, вы можете закодировать присвоение метки аномалии всем изображениям, которые отличаются от нормального класса. я не уверен, что понимаю ваш вопрос (в основном посте) очень хорошо, так что я могу ошибаться 30.08.2019
Ой, извините за недопонимание. У меня есть только один класс данных! У меня вообще нет данных отрицательного класса для тренировки. Приведенное выше негативное изображение, которое я поместил, является лишь предположением о том, как оно может выглядеть. 30.08.2019
Если у вас нет аномального изображения, это более сложная задача! Я знаю, что многие люди используют вариационный автоэнкодер, который может работать лучше, чем традиционный автоэнкодер. 30.08.2019
Конечно. Посмотрим на VAE. Спасибо. 30.08.2019

Ответы:

Используйте предварительно обученную CNN (например, в ImageNet), чтобы извлечь вектор признаков для ваших изображений. Затем обучите AutoEncoder работе с этим представлением объекта. Это должно позволить легче изучать различия более высокого уровня, чем непосредственно обучать автоэнкодер на пикселях.

29.02.2020

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Typescript Smart Contracts Productivity Tech Startup Investing Developer Neural Networks Computer Science NLP