Вот различные вопросы, с которыми я сталкивался во время различных собеседований на роль инженера по компьютерному зрению / инженера по машинному обучению:

  1. Что такое компьютерное зрение? — Компьютерное зрение — это область компьютерных наук, которая позволяет компьютерам идентифицировать и понимать объекты и людей на изображениях и видео.
  2. Какая наиболее популярная библиотека используется для предварительной обработки изображений? — Открыть резюме
  3. Почему изображение преобразуется в оттенки серого? — чтобы упростить процесс вычислений, поскольку он упрощает данные изображения.
  4. Что такое функция потерь? Функция потерь — это функция, которая вычисляет расстояние между текущим результатом алгоритма и ожидаемым результатом.
  5. Что делает слой maxpooling? — слой Maxpooling уменьшает пространственные размеры входных данных, выбирая максимальное значение из небольшой области, помогая в извлечении признаков и субдискретизации.
  6. Для чего используется сверточный слой?. Сверточные слои используются в глубоком обучении из-за их способности обнаруживать локальные шаблоны и особенности в изображениях, обеспечивая эффективное распознавание и понимание изображений.
  7. Что такое оптимизаторы? — Оптимизаторы — это алгоритмы, используемые для минимизации функции потерь и обновления параметров модели в процессе обучения.
  8. Как работает оптимизатор ADAM?  — Оптимизатор Адама – это популярный алгоритм, используемый в глубоком обучении, который помогает корректировать параметры нейронной сети в режиме реального времени, чтобы повысить ее точность и скорость. Адам означает адаптивную оценку момента, что означает, что он адаптирует скорость обучения каждого параметра на основе его исторических градиентов и импульса.
  9. В чем разница между RELU, Sigmoid и Softmax? — RELU (выпрямленная линейная функция активации) преобразует отрицательное значение в ноль и сохраняет положительное значение как есть, Sigmoid сжимает значения в диапазоне от 0 до 1, а Softmax вычисляет вероятности для нескольких классов, суммируя их до 1.
  10. Чем категориальная кроссэнтропия отличается от бинарной кроссэнтропии и разреженной категориальной кроссэнтропии? – Категориальная кроссэнтропия используется для многоклассовой классификации, бинарная кроссэнтропия для бинарной классификации и разреженная категориальная кроссэнтропия, когда целевые значения являются целыми числами, а не горячие закодированные векторы.
  11. Как работает нейронная сеть? Нейронные сети — это вычислительные модели, вдохновленные структурой мозга. Они состоят из взаимосвязанных узлов (нейронов), организованных слоями. Сеть обрабатывает входные данные посредством прямого распространения, производя выходные прогнозы. Во время обучения обратное распространение корректирует веса и смещения, чтобы свести к минимуму ошибки и повысить точность модели.
  12. Объясните эффект полосы Маха? — Эффект полосы Маха — это оптическая иллюзия, при которой воспринимаемая яркость и контрастность края увеличиваются, когда он окружен более темной или светлой областью.
  13. В чем разница между семантической сегментацией и сегментацией экземпляров? — Семантическая сегментация присваивает метку класса каждому пикселю изображения, а сегментация экземпляров также различает отдельные экземпляры объектов внутри классов.
  14. Как метод скользящего окна работает при обнаружении объектов? — Подход скользящего окна при обнаружении объектов включает перемещение окна фиксированного размера по изображению и создание прогнозов для каждого окна для обнаружения объектов.
  15. Какие показатели измеряют эффективность обнаружения объектов? — MAP
  16. Что такое показатели для измерения эффективности классификации? — Точность, полнота, оценка f1, точность.
  17. Что такое показатели для измерения эффективности сегментации? — MIOU
  18. Когда при классификации учитываются точность и полнота вместо точности? — Точность и полнота учитываются вместо точности при классификации несбалансированных наборов данных, когда один класс может доминировать в числе выборок.
  19. Какие методы фильтрации шума изображения вы знаете? — К методам фильтрации шумов изображения относятся, среди прочего, размытие по Гауссу, медианный фильтр и билатеральный фильтр.
  20. Что бы вы сделали, если бы вам нужно было обучить классификатор изображений, но у вас недостаточно данных? — Для обучения классификатора изображений с недостаточным количеством данных можно использовать увеличение данных, перенос обучения и создание синтетических данных.