В мире науки о данных и машинного обучения легко увязнуть в технических хитросплетениях и искушении передовых алгоритмов. Однако, чтобы действительно оказать влияние, группы данных должны убедиться, что наши усилия соответствуют конкретным потребностям и целям бизнеса. В этой статье я хотел бы исследовать важность преодоления разрыва между техническими решениями и бизнес-требованиями. Говоря конкретно о модели обработки естественного языка (NLP), которую мы создали для анализа отзывов клиентов.

Понимание бизнес-перспективы

Для инженеров и руководителей данных естественно погружаться в технические аспекты и стремиться к оптимизации. Однако важно помнить, что конечной целью групп обработки данных является предоставление информации, которая напрямую способствует росту бизнеса. Сосредоточение внимания исключительно на технической эффективности или новых подходах может привести к напрасным усилиям, если они не соответствуют конкретным потребностям и целям организации.

От слов к мудрости

Наша команда по взаимодействию с клиентами и защите интересов хотела понять болевые точки наших клиентов. Им нужна наша помощь, чтобы разобраться в отзывах клиентов в социальных сетях и на таких сайтах, как Trustpilot, Apple App Store и Google Play Store. Нашей первой мыслью было создать конвейер обработки данных, чтобы собрать все отзывы и удивить наших деловых партнеров облаком Word, отображающим наиболее цитируемые слова и фразы.

Конечно, мы будем использовать все методы машинного обучения — очищать данные, использовать стоп-слова и даже использовать лексикон настроений, чтобы подсчитать некоторые оценки настроений. Это должно сработать, верно? Они начнут выставлять нас напоказ за то, какие мы умные, да? А оказывается нет :)

Несмотря на то, что облака Word и анализ настроений — это круто, они редко раскрывают какую-либо значимую информацию, на основе которой бизнес может действовать. Поэтому мы вернулись к чертежной доске и подумали о том, что может принести пользу нашему бизнесу. Мы обучили модель обработки естественного языка (NLP) в контексте нашего продукта и бизнеса. Тренировал его на некоторых темах и ситуациях, имеющих отношение к нам.

Благодаря этому итеративному процессу усовершенствованная модель НЛП стала мощным инструментом для извлечения полезной информации. Это позволило классифицировать отзывы клиентов на трех уровнях:

Похвалы и жалобы:

Разделив отзывы на похвалы и жалобы, мы получили более глубокое понимание настроений клиентов. Эта категоризация позволила нам определить, что наши клиенты ценят больше всего, и болевые точки, с которыми они столкнулись.

Ведомственная классификация:

Мы пошли еще дальше, классифицировав их в соответствии с конкретными отделами, на которые ссылались клиенты. Эта возможность предоставила нам детальное представление о том, как различные отделы воспринимаются нашими клиентами. Это позволило нам узнать более широкие области, на которых наши клиенты хотели, чтобы мы сосредоточились.

Основные вопросы и темы:

Сила расширенной модели НЛП по-настоящему проявилась, когда мы успешно определили основные проблемы в каждом отделе. Эта важная информация позволила нам расставить приоритеты в наших усилиях и эффективно распределить ресурсы.

Соединение науки о данных и успеха в бизнесе

Успех проектов по науке о данных заключается в нашей способности преобразовывать данные в действенные идеи, которые стимулируют рост бизнеса. Преодолевая разрыв между техническими чудесами и бизнес-требованиями, специалисты по обработке данных могут раскрыть истинный потенциал наших усилий.