Хотите узнать больше о выходе на зарубежный фриланс, продвижении на LinkedIn и особенностях работы с иностранными заказчиками? Подписывайтесь на канал канал Brocli — все о зарубежном фрилансе!
Если вы любите математику, статистику, умеете и любите программировать и хотите зарабатывать 300-600 тысяч рублей в месяц, идите в анализ больших данных и машинное обучение — Data Science.
В этой статье расскажем, какие навыки и знания вам понадобятся, где этому научиться и какие профессии есть сейчас в одном из самых востребованных IT-направлений.
Data Scientist — что за профессия?
Data Science занимается сбором и анализом данных. Разброс сфер, в котором она применяется, огромен: большие данные помогают определять вероятность развития заболеваний, находить опухоли на снимке, показывать персонализированную рекламу, находить мошеннические транзакции.
Сюда же входят машинное обучение, нейросети и искусственный интеллект — тот самый поиск по картинке, «умный дом» и Алиса, которая понимает шутки и отвечает почти как реальный человек.
Интернет вещей, промышленность, маркетинг и любая IT-компания генерируют петабайты данных, которые нужно где-то хранить и обрабатывать, а потом на основе анализа делать прогнозы и предлагать решения для оптимизации и роста бизнеса. В Data Science есть несколько специалистов, которые этим занимаются:
- Инженер данных (Data Engineer) – разрабатывает систему обработки данных, которая выдерживает большие нагрузки и не отключается от перегрузки. Собирает, хранит и управляет потоками данных в реальном времени, работает с кластерами серверов на Linux, с Hadoop, Spark и облачными системами.
- Разработчик BI (Business Intelligence Developer) — проектирует внутренние хранилища данных и создает аналитические отчеты в BI-системах. Знает SQL, инструменты ETL и умеет программировать.
- Аналитик данных (Data Analyst) — суммирует и интерпретирует полученные данные — переводит их на понятный бизнесу язык. Знает Excel, SQL и системы аналитики.
- Специалист по данным (Data Scientist) — имеет самый обширный список навыков: анализирует данные, программирует, разрабатывает новые алгоритмы, обрабатывает большие объемы информации. Но главное — именно он делает прогнозы и помогает компаниям решать бизнес-задачи на основе полученных данных.
Отдельно — инженер по машинному обучению и специалист по AI (искусственному интеллекту). Они занимаются программированием, администрированием и ускорением обучения нейронных сетей, владеют инструментами обработки естественного языка и методами глубокого обучения.
Сколько зарабатывают специалисты по большим данным
В Big Data глобальный дефицит кадров: уже сейчас в США не хватает больше 150 тысяч специалистов, а Amazon и Google инвестируют суммарно 357 млн долларов только в поиск сотрудников в отдел машинного обучения.
Благодаря высокому спросу зарплаты таких специалистов соответствующие: в США data scientist получает в среднем $9700 в месяц, что по нынешнему курсу превышает 600 тысяч рублей, аналитик — $5600 или 360 тысяч рублей.
В России ставки чуть ниже: максимальная зарплата специалиста по данным — 300 тысяч, а аналитика — 200 тысяч рублей в месяц. Впрочем, при таком дефиците профессионалу устроят релокейт и предоставят бесплатные языковые курсы — главное, чтобы он владел нужными навыками и опытом.
Какие навыки нужны для работы с Big Data и Machine Learning
Начнем с основ: для работы в любом направлении, связанном с большими данными, вам понадобятся знания математики, математической статистики и понятий науки о данных. Например, на собеседовании вам обязательно зададут вопросы о:
- теории вероятности — проверят, насколько хорошо вы в этом разбираетесь и можете ли самостоятельно просчитать вероятность события. Примеры заданий здесь;
- корреляции — если работаете со статистическими методами, освежите знания и потренируйтесь решать задачи на корреляцию;
- линейной регрессии — этот метод часто используют, чтобы решать проблемы классификации, так что ловите вопросы, на которые точно нужно знать ответ любому специалисту по данным.
Что еще нужно изучить? Машинное обучение, его алгоритмы и методы, так как оно составляет основу работы с большими данными:
- обработка естественного языка (NLP),
- дерево решений,
- метод опорных векторов,
- метод снижения соразмерности,
- кластерный анализ.
Дальше — больше, точнее, глубже: Deep Learning — глубокое обучение, алгоритмы обработки изображений, анализа текстов и распознавания речи.
Из технических навыков: специалист по большим данным должен знать языки программирования Python и R, работать с инструментами SQL и NoSQL, SAS, понимать Map Reduce Hadoop и Hive/Pig, уметь работать в xaaS-сервисах (один из таких — Amazon Web Services).
Не забываем и про soft skills: недостаточно уметь программировать и обрабатывать информацию, нужно еще понимать бизнес, уметь стратегически мыслить, быть креативным и работать в команде, а пойманные инсайты превращать в конкретные бизнес-решения.
Такой набор навыков встречается редко, специалисты — на вес золота, а спрос сейчас во много раз превышает предложение. Поэтому самое время учиться.
Где учиться на Data Scientist — специалиста по большим данным
В университетах такая специальность встречается редко — пока только в ВШЭ, СПбГУ, МГУ и МФТИ.
Чаще всего учат некоторым аспектам профессии, а не комплексно, поэтому на фоне государственного образования выигрывают онлайн-курсы: они короче, интенсивнее, дают больше практики и главное — больше актуальных знаний и навыков, потому что информация постоянно обновляется и не успевает устаревать.
Можно выбрать несколько курсов по разным направлениям и постепенно вырасти из аналитика данных до самого востребованного сейчас Data Scientist’а.
А можно пройти один: Data Science с нуля за 12 месяцев — программа комплексного изучения науки о данных: если вы ни разу в жизни не программировали, а математику учили только в школе, этот курс научит вас всему необходимому для работы с данными. Персональный ментор, множество практики на реальных бизнес-задачах, соревнования и хакатоны, а в конце — стажировка для лучших студентов курса и помощь с трудоустройством.
На курсе повторите математику и основы статистики, с нуля напишете свою первую программу на Python, обучите нейронную сеть и напишете умного чат-бота. Через 12 месяцев станете крутым специалистом, за которого IT-компании будут бороться и конкурировать.
Узнай, как находить заказы на фриланс на зарубежном рынке в 2024 году, в моем гайде «Зарубежный фриланс 2024»! Всего 2990 рублей: скачать гайд и узнать, как получать заказы с Upwork БЕСПЛАТНО без оплаты коннектов.
Упоминающиеся в тексте Instagram и Facebook признаны на территории РФ экстремистскими.