• Цифровые профессии 2022

Data Scientist

Государство оплатит от 50% до 100% стоимости курсов

Длительность

334 ак. час

Уровень

Базовый

1 поток

(набор завершен)
11.07.2022 - 27.12.2022

2 поток

(набор завершен)
08.08.2022 - 07.02.2023

3 поток

(набор завершен)
05.09.2022 - 14.03.2023

4 поток

(набор завершен)
03.10.2022 - 11.04.2023

5 поток

(набор завершен)
07.11.2022 - 16.05.2023

6 поток

(набор завершен)
05.12.2022 - 14.06.2023

Стоимость участия:

90 000 рублей

Программа участвует в проекте «Цифровые Профессии». Государство оплатит от 50% до 100% стоимости курсов

Подробнее о проекте

Тестирование и регистрация на программу без участия в проекте

Data Science (наука о данных) – молодая отрасль на стыке интернет-технологий и бизнеса.

Задача исследователя данных (Data Scientist): строить математические модели, которые позволяют выявлять скрытые взаимосвязи в огромных массивах информации. Исследователь данных формирует на основе закономерностей в данных новые ценности, такие как предсказание будущего поведения в зависимости от начальных условий, рекомендации в зависимости от выявленных предпочтений и т.д. Помогает создавать продукты и повышать эффективность бизнес-решений, социальных взаимодействий, научных исследований и производственных процессов на основе выявленных математических моделей.

На текущий момент только в одной России больше 5000 компаний находятся в поисках специалистов по Data Science! Средняя зарплата в этой профессии составляет ~100 000 рублей и практически не имеет верхних границ.

Программа подойдет:

  • желающим начать свой путь в ИТ: мы дадим нужные знания и умения в программировании, математике, машинном и глубоком обучении, чтобы вы смогли сделать первые шаги навстречу карьере мечты;
  • аналитикам: вы сможете углубить свои знания, применить машинное обучение на практике и ускорить свое карьерное развитие;
  • начинающим программистам: вы откроете для себя удивительный мир анализа данных, расширите круг решаемых задач и возможности для карьерного роста. Специалисты в DS, обладающие опытом разработки ПО ценятся особенно сильно!

Вы научитесь:

  • программировать на Python – одном из самых популярных языков программирования в мире;
  • решать математические задачи, необходимые для работы с алгоритмами машинного обучения и нейронными сетями;
  • проводить первичный анализ данных с помощью SQL и библиотек Python: Pandas, Numpy, Seaborn, Matplotlib, etc
  • применять алгоритмы машинного обучения для решения прикладных задач;
  • обучать и применять в реальных задачах нейронные сети.

Кроме этого, мы поможем вам грамотно составить резюме и выстроить поиск первой работы в Data Science!

Обучение состоит из двух частей:

  • Базовый модуль, «бассейн» – онлайн-интенсив из электронных курсов и вебинаров для освоения базовых знаний и умений в математике, программировании и основах первичного анализа данных на Python.
  • Профильный модуль – обучение в формате вебинаров под руководством преподавателей-практиков, интересными ДЗ, персонализированной обратной связью и проектами!

На профильном модуле занятия проходят в формате «живых» вебинаров с преподавателем. Мы не набираем больших групп, чтобы каждый слушатель мог получить ответы свои вопросы во время занятий, личную обратную связь по домашним заданиям и проектам!

У кого вы будете учиться?

Команда преподавателей, методистов и кураторов с опытом организации обучения Data Science и Data Engineering более 3 лет. Команда сочетает в себе 3 ключевые экспертизы:

  • индустриальная: практики data engineers и ml/dl engineers из крупнейших российских и международных ИТ-компаний;
  • академическая: преподаватели и выпускники лучших ВУЗов России: ВШЭ, МФТИ, МГУ, Школа Анализа Данных Яндекса;
  • образовательная: через каждого преподавателя в нашей команде прошли сотни слушателей из российских компаний или вузов.

Во время обучения вы реализуете 3 проекта лично или в команде:

  • первичный анализ данных – найдете инсайты в реальном медицинском датасете;
  • предобработка данных и обучение ML-моделей для анализа стоимости недвижимости;
  • выпускной проект, тема которого согласуется с преподавателем во время обучения.

Примеры тем выпускных проектов с прошлых потоков (обучение прошли уже сотни слушателей):

  • Style Transfer. Разобраться в классическом алгоритме переноса стиля, реализовать его на PyTorch. Бонус -- реализовать любой из алгоритмов нейросетевого переноса стиля.
  • FaceSwap. Разобраться в нейросетевых архитектурах сегментации изображений и выделения ключевых точек лица. Написать алгоритм, который правдоподобно меняет два наперёд заданных лица местами.
  • Face ID. Разобраться в алгоритмах распознавания лиц на фото. Реализовать простейший алгоритм на основе эмбеддингов фотографий (скажем, через SVD-разложение) или какую-то нейросетевую архитектуру на PyTorch. Добиться того, чтобы алгоритм отличал ваше лицо от чужих (скажем, от моего).
  • Автопосты в Instagram. Разработать алгоритм для автоматической генерации постов в Instagram, обучающийся на реальных профилях пользователей;
  • Смена сезонов на фото. Реализовать архитектуру CycleGAN на Pytorch, обучить её на датасетах с изображениями зимних и летних пейзажей, научиться менять сезон на фото.

Важно!

Перед стартом обучения важно понимать, что программирование и анализ данных – это интересно и перспективно, но и очень сложно. Для достижения целей обучения вам придется много работать, практиковаться и самостоятельно искать информацию. Без этого не стать хорошим специалистом даже начального уровня. Научить учиться и искать информацию – одна из целей программы, ведь настоящий специалист регулярно занимается этим на работе! Убедитесь, что вы готовы уделять 15, а лучше 20 часов каждую неделю на обучение и вы уверены, что сможете освоить основы этой профессии в интенсивном режиме.

Цель программы

Получить компетенции, связанные с программированием на языке Python, математикой для анализа данных, машинным и глубоким обучением, необходимые для старта карьеры в сфере Data Science.

Актуальность

На текущий момент только в одной России больше 5 000 компаний находятся в поисках специалистов по Data Science! Средняя зарплата в этой профессии составляет ~ 100 000 рублей и практически не имеет верхних границ. Сегодня данные – основа успеха всех крупных преуспевающих компаний, которые видят себя лидерами будущего. Данные необходимо собирать, обрабатывать и строить на их основе модели, которые приносят пользу всему человечеству и бизнесу – для этого необходимы специалисты в сфере Data Science!

Требования к слушателям

  • Готовность упорно учиться, искать информацию и много самостоятельно работать – без этого не стать хорошим разработчиком!
  • Готовность на протяжении всего курса регулярно выделять достаточно времени учебе.
  • Уверенное владение ПК: установка/удаление ПО, работа с текстовыми редакторами, браузером Google Chrome.
  • Развитое логическое мышление, умение структурировать информацию.
  • Отсутствие проблем с школьной математикой. Решение квадратных уравнений и простейших систем линейных уравнений не вызывают проблем. Понимание, как нарисовать графики простейших линейных и квадратичных функций. Умение решать простейшие задачи с участием логарифма и экспоненты.
  • Если все же что-то из списка выше вызывает сомнения, то вам должно быть достаточно просто сесть вечером и повторить эти темы. Обязательно сделайте это, будет полезно перед курсом!
  • Очень желательно, но не обязательно знакомство с основами математического анализа: функции и их производные; линейной алгебры: вектора, матрицы и операции с ними; теории вероятностей и статистики.
  • Знание английского языка на уровне чтения технической документации.

Это программа участвует в проекте «Цифровые профессии», но вы также можете учиться у нас, даже если не входите в льготные категории граждан. Пройти вступительный тест и подать заявку

Требования к участникам и описание льготных категорий

Оферта на заключение договора оказания платных образовательных услуг с физическим лицом по программам цифровых профессий

Как записаться на обучение со скидкой

  • Заполните анкету на Госуслугах
  • Дождитесь подтверждения льготы

    Проверка документов до 5 дней

  • Пройдите вступительное испытание в форме тестирования

    Вы можете пользоваться чем угодно, чтобы пройти тест, потому что искать информацию — важный навык для любого ИТ-специалиста. Некоторые задачи из теста могут показаться сложными, но это только на первый взгляд, так как для решения абсолютно всех задач достаточно школьных знаний. У вас будет 1 попытка и 60 минут на прохождение теста. Достаточно ответить правильно хотя бы на 10 из 15 вопросов.

  • Оплатите стоимость обучения с учетом скидки

    Самостоятельно или за счёт работодателя

  • Пройдите обучение и получите документ о дополнительном образовании
  • Синтаксис
  • Типы и объекты
  • Типы операторов
  • Условные операторы
  • Циклы
  • Как не надо называть переменные
  • Числа
  • Строки
  • Списки
  • Кортежи
  • Словари
  • Множества
  • Функции
  • Исключения
  • Работа с файлами
  • Подключение модулей
  • Регулярные выражения
  • Структуры данных
  • Работа с индексами
  • Чистка данных
  • Математические операции
  • Операции объединения данных
  • Агрегирование данных
  • Визуализация данных
  • Основы булевой алгебры
  • Условное ветвление как основа алгоритма
  • Примеры алгоритмов. Вложенные ветвления
  • Наборы данных. Циклы
  • Классические алгоритмы
  • Теория вероятностей
  • Описательная статистика
  • Основы визуализации
  • Проблемы в данных
  • Проверка гипотез
  • Основы Python и алгоритмов: функции ввода-вывода, переменные, основные типы данных и операции с ними, приведение типов. Понятие алгоритма, что это такое и как с ними работать. Ошибки в коде и как с ними работать. Условные конструкции. Вложенные условные конструкции. List и работа с ним. Циклы.
  • Математическая база: функции, производные, вектора, матрицы и операции с ними, понятие вероятности, случайные величины, основы статистики.
  • Инструменты для анализа данных: основы библиотек Pandas, Numpy, Seaborn, Matplotlib.
  • Основы Python и алгоритмов: функции ввода-вывода, переменные, основные типы данных и операции с ними, приведение типов. Понятие алгоритма, что это такое и как с ними работать. Ошибки в коде и как с ними работать. Условные конструкции. Вложенные условные конструкции. List и работа с ним. Циклы.
  • Математическая база: функции, производные, вектора, матрицы и операции с ними, понятие вероятности, случайные величины, основы статистики.
  • Инструменты для анализа данных: основы библиотек Pandas, Numpy, Seaborn, Matplotlib.

Первичный анализ данных с помощью библиотек Python: matplotlib, seaborn, numpy, pandas. Аналитика в Pandas. Дискриминационный и корреляционный анализ. Основы статистического анализа данных.

Первичный анализ данных с помощью библиотек Python: matplotlib, seaborn, numpy, pandas. Аналитика в Pandas. Дискриминационный и корреляционный анализ. Основы статистического анализа данных.

Решение задач на использование библиотек Python: matplotlib, seaborn, numpy, pandas и аналитику в Pandas.

Общие концепции машинного обучения, метрики, линейная регрессия и классификация, логистическая регрессия, деревья принятия решений, ансамбли алгоритмов, бустинг.

Решения практических задач анализа данных с использованием алгоритмов: линейная регрессия, логистическая регрессия, деревья принятия решений, ансамбли алгоритмов, бустинг.

Решения практических задач анализа данных с использованием алгоритмов: линейная регрессия, логистическая регрессия, деревья принятия решений, ансамбли алгоритмов, бустинг.

Основные задачи, решаемые нейронными сетями; метод обратного распространения ошибки (backpropagation), перцептрон, полносвязные нейронные сети, сверточные нейронные сети, рекуррентные нейронные сети, современные архитектуры нейронных задач для решения задач компьютерного зрения (CV) и обработки текстов (NLP), фреймворки Pytorch, TensorFlow.

Решение задач классификации и регрессии, обработки изображений и текстов с помощью методов глубокого обучения, Python, его библиотек и фреймворка Pytorch.

Решение задач классификации и регрессии, обработки изображений и текстов с помощью методов глубокого обучения, Python, его библиотек и фреймворка Pytorch.

Общая оценка 5.0

По вопросам поступления

Хотите узнать больше о программе или курсе? Наш менеджер свяжется с Вами в ближайшее время, ответит на все вопросы и поможет с регистрацией.