Обнаружение пешехода с использованием модели CaffeNet при средней частоте кадров

Я обучаю CaffeNet (точнее модель Cifar10 для классификации двух классов) модель. Теперь модель готова к обнаружению. Для тестирования модели с одним изображением я использую test_predict_imagenet.cpp. Я не проверял, насколько быстро код может работать для изображения 640 x 480. Моя цель - 5~10 кадров/сек, это просто хорошо для автономного обнаружения. Я понимаю, что мне нужно реализовать обнаружение нескольких размеров (т.е. что-то вроде того, что мы делаем в распознавании лиц, исходный размер изображения изменяется для разных меньших размеров), чтобы я не пропускал пешехода в каждом кадре.

Согласно этому статье, они используют размер изображения 64 x 128 для обучения, а обнаружение занимает 3 мс/окно. а для 100 окон/изображения требуется 300 мс/кадр. Не уверен, что они реализуют подход обнаружения нескольких размеров. Если реализован мультиразмер, это займет гораздо больше времени.

На данный момент у меня есть только знания о реализации метода test_predict_imagenet.cpp для обнаружения нескольких размеров. Я знаю, что это будет очень медленно. Есть ли более эффективный способ обнаружения с использованием модели CaffeNet? Моя цель просто хороша для скорости 5 ~ 10 кадров в секунду. Спасибо

deep-learning conv-neural-network caffe

13.08.2015

посмотрите на arxiv.org/abs/1506.01497 14.08.2015
Спасибо, теперь у меня есть некоторые идеи. Позже обсужу. Люди используют каскадный подход. Еще не решил, какой дизайн использовать. Позвольте мне сначала исследовать. 14.08.2015

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Typescript Smart Contracts Productivity Tech Startup Investing Neural Networks Developer Computer Science NLP