Достаточно ли мы думаем о том, как именно ИИ влияет на бизнес?

«Лучший способ иметь хорошую идею — иметь много идей». — Лайнус Полинг

Мотивирующий пример

Предположим, мы запускаем поисковую систему для электронной коммерции, которая использует машинное обучение на пользовательских запросах для определения предполагаемой категории продуктов. Скажем, рабочая модель имеет задержку прогнозирования 20 мс и точность 90 %.

Естественной следующей целью с точки зрения моделирования было бы повышение точности, скажем, до 95% или выше. Однако мы знаем, что повышение точности почти всегда требует потребления большего количества вычислительных ресурсов для обучающих моделей, а также может увеличить задержку вывода. Кроме того, процесс экспериментирования и связанные с ним инженерные работы могут длиться месяцы или даже годы.

Между тем, как увеличение точности на 5% соответствует бизнес-цели? Учитывая запрос пользователя, поисковая система должна обеспечивать релевантность и минимизировать время поиска продукта. Прогнозирование предполагаемой категории — это только промежуточный шаг к достижению бизнес-цели. Возможно, мы даже не заметим повышения эффективности последующего бизнеса, если доведем точность до 95%.

Чтобы повысить качество обслуживания клиентов и повлиять на бизнес электронной коммерции, мы должны думать не только о постепенном повышении точности этой конкретной модели релевантности запросов. У нас могла бы быть другая модель, предсказывающая предполагаемый «ценовой диапазон». Также может быть хорошей идеей разработать еще одно ИИ-решение для предсказания предполагаемых «атрибутов запроса» и, возможно, еще одно, чтобы предсказать склонность покупателя покупать по сравнению с изучением.

Если мы инвестируем только в улучшение одной задачи, мы, скорее всего, не реализуем весь потенциал ИИ. Однако расширение до нескольких задач, как правило, было бы трудно осуществить без ущерба для задержки или эксплуатационных расходов. Такие усилия, как правило, также требуют найма дополнительных экспертов для решения каждой из этих соответствующих проблем. У нас должна быть широкая направленность, чтобы оказывать влияние на бизнес, но нельзя масштабировать или устойчиво обрабатывать новые гипотезы, добавляя новый штат сотрудников. Нам нужны автоматизированные решения.

Необходимость AutoML

Чем короче время до лучшей гипотезы, тем быстрее прогресс.

Чтобы проверить гипотезу машинного обучения в условиях бизнеса, нам нужны три основных компонента: (1) данные, (2) готовая к производству модель и (3) инфраструктура для A/B-тестирования для выбора модели для развертывания. Хотя наборы данных и тестов часто зависят от предметной области, задача построения моделей машинного обучения имеет много общего в разных дисциплинах.

Более того, эффективный рабочий процесс разработки модели имеет огромную ценность, поскольку эффективное создание решений ИИ с меньшими усилиями разработчиков имеет решающее значение для проведения большего количества экспериментов, проверки большего количества гипотез и, в конечном итоге, для достижения трансформационного влияния на бизнес, как мы показали в нашем примере с электронной коммерцией выше. Лучший способ получить хорошую идею — перепробовать множество идей.

Целью AutoML является автоматизация разработки моделей машинного обучения. Это стремление к автоматизации не ново, и существует несколько предприятий и пакетов с открытым исходным кодом, предназначенных для решения этой проблемы. Однако все существующие инструменты AutoML не соответствуют этой грандиозной концепции раскрытия истинного потенциала достижения бизнес-целей с помощью ИИ, поскольку все они основаны на одном и том же базовом стеке программного обеспечения ML, который неэффективен.

Все библиотеки программного обеспечения для машинного обучения, широко используемые сегодня, ограничены. Библиотеки для обучения крупномасштабных нейронных сетей, хотя и эффективны при обучении на необработанных, неструктурированных данных, требуют доступа к дорогостоящему специализированному вычислительному оборудованию, такому как графические процессоры, и для обучения требуются недели или месяцы. Кроме того, эти решения для глубокого обучения очень часто также включают дорогостоящие этапы постобработки для сжатия моделей до размера, который может быть эффективно развернут. И наоборот, инструменты обработки данных, которые работают на обычном аппаратном обеспечении ЦП, неизменно ограничены структурированными наборами данных, такими как таблицы и электронные таблицы, и, таким образом, не могут использовать огромные массивы мультимодальной информации, доступные многим организациям.

Большинство инструментов AutoML также ограничены объемом и типом информации, которую они могут использовать, что приводит к тому, что возможности модели все еще неоптимальны. В случае персонализации платформа машинного обучения должна иметь возможность обрабатывать большое количество категорий и создавать прогностические модели, зависящие от каждого пользователя. Последовательная информация, которая почти всегда доступна в виде временных меток, обеспечивает важную информацию для создания действительно персонализированных моделей, учитывающих постоянно меняющееся временное поведение. Кроме того, метаданные в виде текста, скорее всего, потребуют некоторой формы обработки естественного языка (NLP). Существующие инструменты AutoML обычно не работают с этими различными модальностями одновременно.

В конечном счете, чтобы раскрыть ценность для бизнеса, нам нужно решение AutoML, которое устраняет все эти недостатки за счет: (1) эффективного обучения больших моделей нейронных сетей на недорогом оборудовании, (2) обработки нескольких модальностей данных, таких как текст, метаданные, и последовательные отношения, и (3) использование возможностей больших объемов данных.

Здесь появляется ThirdAI.

Отличие ThirdAI: AutoML на недорогом процессорном оборудовании

Наша библиотека AutoML Universal Deep Transformers (UDT) разрушает ограничения существующих инструментов AutoML, полагаясь за кулисами на наш собственный проприетарный стек программного обеспечения для глубокого обучения. Разрабатывая новые алгоритмы для эффективного обучения нейронных сетей на недорогом процессорном оборудовании, мы можем быстро обучать мультимодальные модели на неструктурированных наборах данных с автоматической настройкой гиперпараметров.

Кроме того, UDT выполняет логический вывод всего за 1 мс, а это означает, что разработчики могут немедленно запустить перспективную модель в производство без необходимости дорогостоящих операций сжатия, обычных для современных конвейеров глубокого обучения.

С помощью UDT заинтересованные стороны бизнеса могут быстро обучать многочисленные модели для различных задач с минимальными вычислительными затратами и без утомительной настройки параметров. Этот подход AutoML согласовывает ИИ с бизнес-целями, позволяя разработчикам свободно пробовать идеи и в конечном итоге концентрироваться на дифференцирующих решениях. Опробовав больше идей в масштабе и быстро, организации могут раскрыть истинную ценность ИИ.

Начало работы с UDT для ваших нужд AutoML

Чтобы начать работу с UDT и трансформировать свой бизнес, посетите наш веб-сайт или свяжитесь с нами, чтобы запросить пробную лицензию на наше программное обеспечение. Мы также рекомендуем вам попробовать наши демонстрационные записные книжки Python, чтобы увидеть, как UDT работает над различными задачами, включая персонализацию, классификацию текста, анализ табличных данных и переформулировку запросов.