2 основных урока Патрисии Флорисси, вице-президента и главного технического директора по продажам DellEMC

Патрисия Флорисси - вице-президент и технический директор по продажам. В качестве глобального технического директора по продажам Патрисия помогает определить среднесрочную и долгосрочную технологическую стратегию, отражая потребности более широкой экосистемы Dell EMC в стратегических инициативах. Патрисия также является связующим звеном между Dell EMC и ее клиентами и партнерами, чтобы способствовать укреплению союзов и обеспечивать более высокую ценность. Патрисия ранее была вице-президентом и глобальным техническим директором по продажам в EMC до слияния Dell и EMC. Если вы думали, что ее опыт не может быть более впечатляющим, подумайте еще раз. Она также имеет почетное звание заслуженного инженера EMC, номинированную в октябре 2007 года. Нам выпала невероятная честь взять интервью у Патрисии недавно на World Summit AI от имени нашей DataSeries сеть.

Она является создателем, автором, рассказчиком и влиятельным лицом в серии образовательных видеоматериалов Dell EMC Big Ideas, посвященных новым технологиям и тенденциям. Анимационные видеоролики «Большие идеи» ускоряют и расширяют лидерство в области технической мысли в EMC с помощью инновационных методик обучения в увлекательной и простой форме, не рассказывая о продуктах как внутренней, так и внешней аудитории. В серии более 20 видеороликов, некоторые из которых локализованы на 10 языках, а общее количество просмотров превышает полмиллиона. Патрисия также пишет статьи о влиянии больших данных на ускорение инноваций.

Уроженец Бразилии увлекся искусственным интеллектом почти 10 лет назад. В Dell она начала с больших данных, сосредоточив внимание на задачах, связанных с извлечением больших объемов данных. На раннем этапе это привлекло Dell к Hadoop и Spark (и им подобным), что напрямую привело Патрисию и DellEMC к энтузиазму по поводу глубокого обучения сегодня.

Выводы Патрисии:

# 1 Уважайте и стремитесь к разнообразию данных. Вы можете быть счастливы, но никогда не должны останавливаться на достигнутом.

Мы спросили Патрицию о ее мнении о том, насколько важны данные для нее и компании, и она ответила, что это жизненно важно в наши дни. Почему? Что ж, по мере того, как мы все больше и больше движемся к машинному обучению и глубокому обучению, когда алгоритмы учатся на данных, речь идет уже не о количестве данных, которые используются для обучения, а, что более важно, о разнообразии данных, которые вносятся в таблицу. Да, очевидно, что можно и можно было бы обсуждать разнообразие данных в терминах «структурированных» и «полуструктурированных», то есть включая видео, текст и т. Д. Однако Патрисия имеет в виду не это. Когда она говорит «разнообразие», она имеет в виду качество контента. Содержание самих данных должно быть разнообразным. Например, если вы обучаете модель распознаванию изображений, вам абсолютно необходимо получить образцы лиц со всего мира (например, культур, национальностей, возраста и т. Д.). И когда у вас есть эти модели, которые обучаются на данных, именно тогда данные становятся бесценными.

Другой вопрос, который стоит задать себе: действительно ли вы хотите добиться разнообразия? По словам Патриции, одной из самых больших проблем для ИИ будет не дизайн или сложность используемых моделей, а его способность масштабироваться и, в свою очередь, позволять более сложные модели, обученные на более крупных наборах данных, и более крупных. вычислительные мощности, чтобы процветать. Тем не менее, вам нужно сделать все вышеперечисленное «федеративным» способом. Он не просто распределяется и находится близко к источнику данных. Модели, которые обучаются на местном уровне, смогут сотрудничать для получения обучения более высокого порядка. Более того, в ближайшем будущем ни у одной организации не будет всех данных, необходимых для обучения модели на достаточно разнообразном наборе данных. Интересно, что Патрисия считает, что мы можем ожидать создания динамичного цифрового рынка, на котором компании на потенциально широко распространенном уровне будут делиться (не обязательно самими данными, но) результатами анализа, полученного на основе данных. В частности, Патрисия предвидит потенциальные возможности торговли на основе аналитических алгоритмов, которые могут работать с данными других людей.

№2 Используйте итеративный процесс, связанный с «открытым исходным кодом» сегодня, чтобы лучше понять и воспользоваться финансовыми преимуществами обучаемых моделей.

Открытый исходный код традиционно означает, что ИТ совместно используется, но Патрисия твердо убеждена, что IP-адрес самих данных не будет использоваться совместно. Каждая компания будет владеть интеллектуальной собственностью данных, которые они фактически собирают. В результате владения данными они (как и должно быть) естественным образом получают финансовые выгоды от самих данных. Тем не менее, компании будут делиться алгоритмами, поступающими из открытых источников, и могут даже сотрудничать в обмене результатами этих самых алгоритмов, особенно когда они используются против их собственных данных. Например, вы хотите обучить модель распознаванию речи. Теперь имейте в виду, что у вас есть тысячи (а возможно, и сотни тысяч) часов людей по всему миру, говорящих на определенную тему (например, технологию). В случае DellEMC они будут обучать свою модель, используя свои собственные данные, и другие компании будут делать то же самое, используя свои собственные данные. Вот где начинается процесс - и это действительно процесс! Затем разные компании будут делиться параметрами моделей, которые были обучены, комбинировать эти параметры, достигать более высокого порядка, а затем снова делиться ими! Этот процесс очень итеративен для разных компаний и позволит всем участникам лучше понять финансовые преимущества моделей, которые были обучены.