Примечание. Внизу этого поста приведены ответы некоторых специалистов по данным, работающих в отрасли, о том, как лучше всего получить свою первую роль в области науки о данных.

Чтобы занять новую должность в области науки о данных, необходимо предпринять ряд шагов, чтобы продемонстрировать свою способность работать с данными и продемонстрировать, насколько хорошо вы вписываетесь в культуру компании. В этом посте я коснусь одной из самых важных частей процесса (и зачастую самой страшной): технического собеседования.

Большинство людей, с которыми я разговаривал, тратят много времени на отработку задач по программированию и оттачивание таких навыков, как SQL-запросы. Хотя это важные аспекты подготовки к собеседованию, они делают упор исключительно на том, насколько хорошо вы умеете работать с клавиатурой.

Во время собственного поиска работы я тратил много времени на размышления о том, как вместо этого использовать техническое собеседование как средство, чтобы выделиться среди других приложений. Большинство из нас может кодировать функцию, чтобы указать, является ли число простым или нет (подсказка: по модулю - ваш друг). Часто упускается из виду то, что каждый из ваших ответов дает возможность предоставить контекст для вашей конкретной формы решения проблемы. Оптимальный контекст будет зависеть от конкретного вопроса, который вы задаете, интервьюера и должности, на которую вы претендуете. Однако, по моему опыту, есть три основных типа контекста, которые хорошо работают в процессе собеседования.

Разработка

Хотя вопросы кодирования часто можно свести к использованию собственных компонентов предпочитаемого вами языка программирования, они указывают на вашу способность решать проблемы, не зная, когда следует вызывать конкретный метод. Независимо от того, отвечаете ли вы устно или на доске, каждый шаг вашего решения должен быть сформулирован в отношении того, почему вы выбираете тот или иной подход. Это позволяет вам обсуждать альтернативные решения, которые могут не работать так же хорошо, как выбранное вами, и показывает, что вы можете подумать о том, как ваш код может повлиять на масштабируемость продукта.

Хороший совет - знать, как проверить время вычислений при различных подходах. Таким образом, даже если вы не знаете, какие из них лучше масштабируются, вы можете указать, что существует n решений проблемы, и было бы интересно проверить время вычисления каждого из них. Таким образом, даже если у вас нет прямого ответа, вы все равно демонстрируете, что думаете о производительности и что, если бы вы сидели за компьютером, вы бы знали, как тестировать различные подходы.

Другой важный аспект разработки - обсуждение того, как конкретное решение по кодированию может быть использовано в контексте бизнес-проблемы, с которой может столкнуться кто-то в компании. Хотя это применимо не ко всем техническим вопросам, вы должны использовать любую возможность, чтобы обсудить решения в этом контексте. Примером может служить роль в области науки о данных, которая занимается прогнозированием оттока клиентов, вы можете объяснить основные технические вопросы (например, как работают глубокие нейронные сети) в терминах этой проблемы. Вы можете говорить о том, какие типы данных будут вводиться в нейронную сеть, и как эта сеть будет оптимизировать прогнозы, используя функции, относящиеся к оттоку.

Повествование

Рассказывание историй похоже на разработку, но предполагает использование конкретных прошлых событий, чтобы подчеркнуть свои навыки. Работая над проблемой, вы можете указать, как вы реализовывали подобное решение в прошлом. Важно подчеркнуть важные детали проекта, шаги, которые вы предприняли для решения проблемы, и какие конкретные результаты стали результатом ваших усилий.

Я выполнил действие X на этапе разработки функций проекта Y, что привело к увеличению Z точности модели и показателей AUC.

Важное использование повествования - также демонстрация поведения, которое выражает ценности компании. Многие технологические компании перечисляют свои основные ценности, иногда называемые миссиями, на своих веб-страницах. Другие компании, такие как банки и консалтинговые агентства, будут стремиться к лидерству и разрешению проблем. Например, Amazon чередует вопросы, оценивающие их принципы лидерства, с вопросами, ориентированными на данные. Хорошей основой для поведенческого повествования является формат STAR.

Формат STAR требует, чтобы вы сформулировали свой ответ, используя четыре шага:

1. Ситуация

2. Задача

3. Действия

4. Ответ

Подробнее о том, как реализовать метод STAR, можно узнать здесь.

Продолжение

Эта стратегия требует, чтобы вы раскрыли специфику определенных проблем, с которыми в настоящее время сталкивается компания. Идея здесь двоякая: продемонстрировать, что вы подходите к роли с мышлением, ориентированным на решение, и что вы действительно способны реализовать решения их проблемы.

Происходит это так: когда вам предоставляется возможность задать вопросы интервьюерам, вы спрашиваете о конкретных примерах проблем, с которыми вы столкнетесь на этой должности, или о важных проблемах, над которыми команда работает в настоящее время. После того, как собеседование завершится и вы вернетесь домой, вы тратите некоторое время на обрисовку проблемы и план по ее решению. Это не обязательно должно быть сверхтехническим, просто обзор, чтобы показать, что вы понимаете проблему и можете найти решения, которые будут реализованы самостоятельно. Затем вы связываетесь с интервьюером, который повторяет положительный опыт вашего интервью, и отправляете ему документ, в котором говорится примерно следующее: «Кстати, я подумал о проблеме, с которой вы сейчас сталкиваетесь, и придумал три решения, которые я мог бы реализовать в рамках первый месяц работы в вашей компании ». Это фактически дает интервьюеру дорожную карту, чтобы начать работу в компании, и, вероятно, станет первым проектом, над которым вы будете работать, если его возьмут на работу.

Прекрасным примером этого является портфельная техника Рамита Сетхи.

Дальнейшие мысли о том, как отличить себя

Готовясь к собеседованию, я спросил друзей, которые работали на должностях в области науки о данных, узнать об их опыте перехода в отрасль. Обратите внимание, что я и эти друзья перешли от программ PhD к ролям в области науки о данных, поэтому, если вы пришли из другой ситуации, их ответы следует интерпретировать с этой точки зрения.

Ответы представлены в полуанонимном формате от специалистов по данным из таких компаний, как Facebook, Uber и Amazon. Надеюсь, они будут полезны, когда вы думаете о том, как вы могли бы работать над уточнениями, повествованием и последующими действиями в процессе собеседования.

Вопрос 1: Помимо хорошего портфолио и технических навыков, что, по вашему мнению, важно для соискателя науки о данных / исследованиях / НЛП в вашей компании?

Ответ 1: чувство продукта с упором на показатели продукта. Это специально для роли Data Science Product Analytics (подавляющее большинство ролей в FB). Кроме того, существует небольшая группа специалистов по Core Data Science - в основном это инженеры-программисты, которые также знают статистику и создают инструменты, которые использует другая DS. Есть еще Infrastructure Data Science, и они для меня несколько загадочны, но работают с нашим хранилищем данных. У нас также есть роли исследователей, но они очень специфичны для предметной области.

Ответ 2: Деловое чутье / понимание - способность интуитивно понимать, какие проблемы компания пытается решить с помощью науки о данных, как они измеряют успех и как работает наука о данных, может наилучшим образом удовлетворить эти потребности. Понимание того, как использовать идеи DS и преобразовывать их в действенные рекомендации, а также креативность, эффективность, независимость, сотрудничество / альтруизм.

Ответ 3: определенно важно, чтобы вы могли показать влияние своей работы и чтобы вы могли подчеркнуть, как это учитывается в работе, которую вы выполняете. Частично это позволяет расставить приоритеты в самой важной работе. В Facebook всегда есть миллион вещей, над которыми вы могли бы работать, и знать, какие из них наиболее важны и оказывают наибольшее влияние, является ключевым моментом.

Ответ 4: Способность разбираться в наборах данных, способность быстро изучать здесь вещи, а также способность самостоятельно понимать и изучать концепции (существует ТОННА вики, которые вы должны уметь читать на своем владеть и что-то понимать).

Вопрос 2. При поиске работы, какая область (например, портфолио, знания предметной области, конкретные навыки, блог / информационно-пропагандистская деятельность) не оказала большого влияния на прием на работу?

Ответ 1: На самом деле нет. Я получил стипендию Insight Data Science, и они очень хорошо подготовились к прохождению собеседований DS. (Примечание: если вы можете попасть на учебный курс по науке о данных, вы находитесь в хорошей позиции. Особенно, если это Insight Fellowship.)

Ответ 2: У меня не было блога, но был личный веб-сайт и github. Я не уверен, рассматривали ли они кого-то при приеме на работу, но сейчас мы определенно рассмотрим их в поисках кандидата. Публикация, конечно, не имела значения (за исключением того, что она демонстрирует способность завершать проекты), но я этого ожидал.

Ответ 3: Это действительно хороший вопрос. На самом деле на протяжении своего пути в технологии я обнаружил, что наиболее значимыми были отношения. На самом деле я не получил работу, просто написав резюме. Все рабочие места я получил благодаря людям, которые знали меня или мою работу.

Ответ 4: Мое портфолио действительно не имело значения, я думаю, ха-ха.

Вопрос 3: Если бы вам пришлось повторить поиск работы, на какой области вы бы потратили больше времени?

Ответ 1: у меня нет здесь точного ответа, но это, вероятно, потому, что моя нынешняя роль довольно уникальна. Если бы я смотрел сегодня на вакансии DS более широко, я бы, вероятно, захотел усилить методы машинного обучения.

Ответ 2: в том же духе, что и выше. Нетворкинг, нетворкинг, нетворкинг. Я имел большой успех в выступлении. После одного выступления у меня было в основном 3–4 компании, заинтересованные в том, чтобы меня нанять. Хотя это может быть немного сложнее выйти из академических кругов. Я бы определенно посоветовал поискать возможности волонтерства на конференциях. Я бы также сделал ставку на большее количество встреч. В зависимости от того, где вы ищете работу, также может иметь смысл поискать людей в linkedin, которые там работают, и попросить их о встрече (даже через видеоконференцию). Во время этой встречи убедитесь, что вы изучили человека и у вас есть конкретные вопросы. Другой вариант - найти программы наставничества (я был наставником для шикарных компьютерщиков). В основном все, что строит отношения в реальной жизни, а не просто рассылает резюме.

Ответ 3: Знание онтологического моделирования (я до сих пор не знаю, что это такое полностью) и машинного обучения.

Вопрос 4: В чем, по вашему мнению, есть пара больших различий между работой в академии и промышленностью?

Ответ 1: Быстрая доставка намного важнее идеальной.

Право собственности на проект - я привык на 100% владеть всем, над чем я работал, но в отрасли гораздо больше взаимозависимостей.

Общение совершенно другое, потому что я почти никогда не работаю с другим специалистом по данным. Я разговариваю с инженерами / менеджерами по менеджменту и т. Д., И мне нужно соответствующим образом приспосабливаться (например, никого не волнуют или не понимают методы, они просто хотят знать результат).

Ответ 2: Скорость. В промышленности крайне важно быстро получать действенные ответы, а совершенство - враг хорошего. Что касается компромисса между скоростью и точностью, инстинкт (и ваш менеджер) должны сказать вам, когда вы получили правильный ответ * достаточно * и можете двигаться дальше.

Кросс-функциональность - многие специалисты по анализу данных работают в xf-командах и должны уметь хорошо общаться с людьми с совершенно разным опытом (например, бизнес, дизайн, инженерия и т. Д.).

Ответ 3: Самым важным, безусловно, являются временные рамки и учет реальных жизненных ограничений. В академических кругах цель обычно состоит в том, чтобы найти лучший и наиболее надежный ответ с помощью наиболее совершенного из возможных методов. Время, которое вам нужно, часто зависит от результата или этого соображения. В отрасли все правят сроки. Вы должны уметь взвешивать, что самое лучшее, что вы можете сделать за то время, которое у вас есть, с имеющимися у вас ресурсами, а также уравновешивать 3 других проекта. Рецензии также не очень строгие, и там очень мало усилий, таких как литературный обзор (если у вас есть время, чтобы сделать это хорошо, но определенно не является обязательным).

Я действительно люблю быстрые темпы развития индустрии, но это то, с чем иногда борются люди из академических кругов.

Также написание отчетности. Вы должны уметь визуализировать свои выводы и делать их приемлемыми для широкого круга людей. Это включает в себя возможность написать резюме, которое легко усваивается.

Кроме того, вам определенно нужно уметь давать действенные рекомендации по той работе, которую вы выполняете. Приятно получить интересную находку, но, что еще важнее, нужно показать «ну и что?». Каковы шаги, чтобы исправить то, что вы нашли, или предпринять действия, которые окажут влияние на бизнес? Так что для этого вам также необходимо действительно осознавать, какие бизнес-результаты вы добиваетесь.

Вопрос 5: Есть какие-нибудь общие советы по поводу моей первой должности в технологической компании?

Ответ 1: Я написал в блоге сообщение о моем переходе от академического сообщества к DS здесь.

Ответ 2: используйте рефералов, которые позволят вам хотя бы поближе познакомиться с рекрутером или менеджером. Адаптируйте свое резюме (не более 1 страницы) к каждой должности, на которую вы претендуете. Не говорите, что знаете какой-то навык, если не можете продемонстрировать, что знаете его лично. Изучите компании перед собеседованием, по возможности попробуйте их продукцию. Поиск HackerNews был отличным способом узнать о компаниях Кремниевой долины, а также может быть полезен для вас.

Ответ 3: обновите свой Linkedin. Убедитесь, что у вас есть резюме, и опишите свой опыт с учетом всего вышеперечисленного (проиллюстрируйте влияние вашей работы, покажите, что вы можете работать в сжатые сроки, покажите, что вы можете донести свою работу до широкого круга аудиторий и т. Д. ). Тот, кто рассматривает вас как кандидата на работу, скорее всего, взглянет на ваш Linkedin. Если у вас также есть веб-сайт, это замечательно.

Также не упускайте из виду человеческую составляющую. Покажите, что вас интересует, то, что отличает вас от других, волонтерство или работа на благо общества, которую вы сделали. Технологические компании (по крайней мере, Facebook) часто ищут людей, у которых есть точка зрения, насколько я могу судить. Также убедитесь, что вы просматриваете ценности компаний, в которые вы подаете заявку, и отражаете то, что вы знаете их, в своем резюме. (У Facebook есть такие ценности, как: быть открытым, сосредоточиться на влиянии и т. Д.)

Дополнительный вопрос: есть ли у вас какие-либо идеи о процессе собеседования в Amazon или о вещах, к которым вы бы хотели подготовиться более конкретно в связи с собеседованием?

Ответ 1: Что касается собеседования, большинство вопросов будут поведенческими. Они оценивают вас по тому, как вы справились с ситуацией, больше, чем по вашему фактическому набору навыков (хотя у вас может быть одно или два технических собеседования - на какую должность вы снова подали заявку?) Они предпочитают, чтобы все ваши ответы были в формате «ЗВЕЗДА» - ситуация, задача, действие и результат ‹- если у вас есть подготовленные истории в этом формате, отлично (у вас все будет хорошо). И многие вопросы являются глупыми и открытыми, например: «Расскажите мне о случае, когда вам пришлось не соглашаться со своим руководителем (или советником, или партнером по исследованиям). Что это было и как вы с этим справились? Каков был конечный результат ». Им также очень нравится, если вы можете связать вопросы с этими так называемыми принципами лидерства (вам не нужно явно говорить, что я хотел продемонстрировать свою принадлежность или я хотел глубоко погрузиться в эту проблему, но ваша способность продемонстрировать определенные LP в своих ответах будет обсуждаться в подведении итогов.

Я надеюсь, что это поможет всем на их пути в науку о данных и через нее. Если у вас есть другие советы или предложения, пожалуйста, оставьте мне комментарий.