Если вы любите математику, статистику, умеете и любите программировать и хотите зарабатывать 300-600 тысяч рублей в месяц, идите в анализ больших данных и машинное обучение — Data Science.

В этой статье расскажем, какие навыки и знания вам понадобятся, где этому научиться и какие профессии есть сейчас в одном из самых востребованных IT-направлений.

Data Scientist — что за профессия?

Data Science занимается сбором и анализом данных. Разброс сфер, в котором она применяется, огромен: большие данные помогают определять вероятность развития заболеваний, находить опухоли на снимке, показывать персонализированную рекламу, находить мошеннические транзакции.

Сюда же входят машинное обучение, нейросети и искусственный интеллект — тот самый поиск по картинке, «умный дом» и Алиса, которая понимает шутки и отвечает почти как реальный человек.

Интернет вещей, промышленность, маркетинг и любая IT-компания генерируют петабайты данных, которые нужно где-то хранить и обрабатывать, а потом на основе анализа делать прогнозы и предлагать решения для оптимизации и роста бизнеса. В Data Science есть несколько специалистов, которые этим занимаются:

  1. Инженер данных (Data Engineer) – разрабатывает систему обработки данных, которая выдерживает большие нагрузки и не отключается от перегрузки. Собирает, хранит и управляет потоками данных в реальном времени, работает с кластерами серверов на Linux, с Hadoop, Spark и облачными системами.
  2. Разработчик BI (Business Intelligence Developer) — проектирует внутренние хранилища данных и создает аналитические отчеты в BI-системах. Знает SQL, инструменты ETL и умеет программировать.
  3. Аналитик данных (Data Analyst) — суммирует и интерпретирует полученные данные — переводит их на понятный бизнесу язык. Знает Excel, SQL и системы аналитики.
  4. Специалист по данным (Data Scientist) — имеет самый обширный список навыков: анализирует данные, программирует, разрабатывает новые алгоритмы, обрабатывает большие объемы информации. Но главное — именно он делает прогнозы и помогает компаниям решать бизнес-задачи на основе полученных данных.

Отдельно — инженер по машинному обучению и специалист по AI (искусственному интеллекту). Они занимаются программированием, администрированием и ускорением обучения нейронных сетей, владеют инструментами обработки естественного языка и методами глубокого обучения.

Сколько зарабатывают специалисты по большим данным

В Big Data глобальный дефицит кадров: уже сейчас в США не хватает больше 150 тысяч специалистов, а Amazon и Google инвестируют суммарно 357 млн долларов только в поиск сотрудников в отдел машинного обучения.

Благодаря высокому спросу зарплаты таких специалистов соответствующие: в США data scientist получает в среднем $9700 в месяц, что по нынешнему курсу превышает 600 тысяч рублей, аналитик — $5600 или 360 тысяч рублей.

В России ставки чуть ниже: максимальная зарплата специалиста по данным — 300 тысяч, а аналитика — 200 тысяч рублей в месяц. Впрочем, при таком дефиците профессионалу устроят релокейт и предоставят бесплатные языковые курсы — главное, чтобы он владел нужными навыками и опытом.

Какие навыки нужны для работы с Big Data и Machine Learning

Начнем с основ: для работы в любом направлении, связанном с большими данными, вам понадобятся знания математики, математической статистики и понятий науки о данных. Например, на собеседовании вам обязательно зададут вопросы о:

  • теории вероятности — проверят, насколько хорошо вы в этом разбираетесь и можете ли самостоятельно просчитать вероятность события. Примеры заданий здесь;
  • корреляции — если работаете со статистическими методами, освежите знания и потренируйтесь решать задачи на корреляцию;
  • линейной регрессии — этот метод часто используют, чтобы решать проблемы классификации, так что ловите вопросы, на которые точно нужно знать ответ любому специалисту по данным.

Что еще нужно изучить? Машинное обучение, его алгоритмы и методы, так как оно составляет основу работы с большими данными:

  • обработка естественного языка (NLP),
  • дерево решений,
  • метод опорных векторов,
  • метод снижения соразмерности,
  • кластерный анализ.

Дальше — больше, точнее, глубже: Deep Learning — глубокое обучение, алгоритмы обработки изображений, анализа текстов и распознавания речи.

Из технических навыков: специалист по большим данным должен знать языки программирования Python и R, работать с инструментами SQL и NoSQL, SAS, понимать Map Reduce Hadoop и Hive/Pig, уметь работать в xaaS-сервисах (один из таких — Amazon Web Services).

Не забываем и про soft skills: недостаточно уметь программировать и обрабатывать информацию, нужно еще понимать бизнес, уметь стратегически мыслить, быть креативным и работать в команде, а пойманные инсайты превращать в конкретные бизнес-решения.

Такой набор навыков встречается редко, специалисты — на вес золота, а спрос сейчас во много раз превышает предложение. Поэтому самое время учиться.

Где учиться на Data Scientist — специалиста по большим данным

В университетах такая специальность встречается редко — пока только в ВШЭ, СПбГУ, МГУ и МФТИ.

Чаще всего учат некоторым аспектам профессии, а не комплексно, поэтому на фоне государственного образования выигрывают онлайн-курсы: они короче, интенсивнее, дают больше практики и главное — больше актуальных знаний и навыков, потому что информация постоянно обновляется и не успевает устаревать.

Можно выбрать несколько курсов по разным направлениям и постепенно вырасти из аналитика данных до самого востребованного сейчас Data Scientist’а.

А можно пройти один: Data Science с нуля за 12 месяцев — программа комплексного изучения науки о данных: если вы ни разу в жизни не программировали, а математику учили только в школе, этот курс научит вас всему необходимому для работы с данными. Персональный ментор, множество практики на реальных бизнес-задачах, соревнования и хакатоны, а в конце — стажировка для лучших студентов курса и помощь с трудоустройством.

На курсе повторите математику и основы статистики, с нуля напишете свою первую программу на Python, обучите нейронную сеть и напишете умного чат-бота. Через 12 месяцев станете крутым специалистом, за которого IT-компании будут бороться и конкурировать.

Добавить комментарий
You May Also Like