Описание
Data Scientist [2021]
synergy academy
Data Scientist или «ученый по данным» — это востребованный специалист в сфере IT, который работает с большим объемом данных с помощью методов статистического анализа и построения математических моделей. Работая с аналитикой и нейронными сетями, Data Scientist помогает принимать грамотные бизнес-решения и оптимизировать процесс их реализации.
Кому подойдет обучение:
1. Новичкам
2. Начинающим специалистам в сфере программирования
3. Аналитикам
Чему вы научитесь:
1. Проектировать базы данных
2. Создавать и обучать модели
3. Программировать на Python
4. Понимать основы статистики
5. Применять методологии Agile/Scrum
6. Анализировать большой объем данных
Модуль 1 – Основы Python
- Введение в программироване
- Установка ПО. Мой первый скрипт на Python
- Основные типы данных в Python
- Операции в Python
- Оператор IF-ELIF-ELSE. Оператор try-except
- Цикл for и while
- Генератор списка и словаря. Стек, очередь, бинарное дерево
- Функции Python. Передача параметров.
- Функциональное программирование(map, filter, reduce, zip)
- Пакеты в Python. Создание модулей
- Что такое ООП. Принципы ООП
- Создание класса. Методы класса
- Декораторы, classmethos, static method
- Что такое база данных. Реляционные базы данных
- СУБД. Установка ПО. Знакомство с PostgreSQL
- Написание запросов. Подключение к БД из Python
- ORM в Python. sqlalchemy
- Введение в анализ данных
- Работа с Pandas, numpy, matplotlib
- Парсинг сайтов
- Классификация, анализ текстов
Модуль 2 – Линейная алгебра и математика, статистика
- Вектора и матрицы. Основные операции. Теория
- Собственные вектора и числа. Теория
- Вектора и матрицы. Основные операции. Практика
- Собственные вектора и числа. Практика
- Сингулярное разложение и низкоранговое приближение. Теория + практика
- Числовые ряды. Предел функции. Теория
- Числовые ряды. Предел функции. Практика
- Производная функции. Частные производные. Теория
- Градиент и градиентный спуск. Теория
- Интеграл. Теория
- Интеграл. Практика
- Ряды Фурье и Тейлора. Теория
- Размещение с повторениями. Размещение без повторений. Теория
- Размещение с повторениями. Размещение без повторений. Практика
- Сочетание с повторениями. Сочетание без повторений. Теория
- Сочетание с повторениями. Сочетание без повторений. Практика
- Числа Стирлинга. Биномиальные коэффициенты. Теория
- Числа Стирлинга. Биномиальные коэффициенты. Практика
- Вероятностное пространство.
- Условная вероятность. Полная вероятность. Теорема Байеса. Теория
- Условная вероятность. Полная вероятность. Теорема Байеса. Практика
- Независимые случайные величины. Схема Бернулли. Теория
- Математическое ожидание. Дисперсия. Теория
- Математическое ожидание. Дисперсия. Практика
- Теоремы Муавра-Лапласса. Теорема Пуассона. Теория
- Закон больших чисел. Центральная предельная теорема. Теория
- Введение в статистику. Нормальное распределение. Теория+Практика
- Виды распределений. Ковариация. Корреляция. Теория+Практика
- Виды распределений. Ковариация. Корреляция. Практика
- Правило 2х/3ч сигм. Доверительный интервал. Теория+Практика
- Статистическая значимость. Методы проверки гипотез. Часть 1
- Статистическая значимость. Методы проверки гипотез. Часть 2
- Статистическая значимость. Методы проверки гипотез. Часть 3
- А/Б тестирование. Теория
- Функция ошибки. Линейная регрессия. Теория+Практика
Модуль 3 – Анализ данных
Модуль 4 – Основы машинного обучения
- Задачи машинного обучения
- Модель и процесс машинного обучения
- Потоки данных в машинном обучении
- Задача регрессии
- Разведочный (исследовательский) анализ данных
- Процесс ETL и очистка данных
- Обучающая, проверочная и валидационные выборки
- Смещение, разброс и ошибка данных в модели
- Недообучение и переобучение модели
- Использование HDF
- Метрики регрессионных моделей
- Метод наименьших квадратов
- Модель линейной регрессии
- Линейная регрессия с регуляризацией
- Оптимизация гиперпараметров модели
- Изотоническая регрессия
- Полиномиальная регрессия
- Линеаризация регрессии
- Ансамбли моделей машинного обучения
- Ансамбль стекинга
Модуль 5 – Инжиниринг данных
- Проблема качества данных. Теория
- Работа с пропусками. Теория
- Работа с переменными. Теория
- Поиск выбросов и генерация новых признаков
- Feature Selection
- Эксплоративный анализ (EDA)
- Работа с текстовыми данными
- Итоговое практическое занятие. EDA и Feature Selection. Часть 1
- Итоговое практическое занятие. Работа с пропусками и переменными. Часть 2
- Итоговое практическое занятие. Поиск выбросов и генерация новых признаков. Часть 3
Модуль 6 – Нейронные сети
- Введение в нейронные сети
- Полносвязные нейронные сети
- Элементы теории оптимизации
- Обучение нейронных сетей
- Сверточные нейронные сети
- Рекуррентные нейронные сети 1 Часть
- Рекуррентные нейронные сети 2 Часть
- Tips and Tricks
- Pytorch
- Векторные представления слов
- Нейронные сети-трансформеры
Модуль 7 – Основы искусственного интеллекта
- Введение в ML
- Постановка задачи ML
- Классические алгоритмы ML. 1 часть
- Классические алгоритмы ML. 2 часть
- Метрика качества и работа с признаками
- Основы NLP
- Векторные представления слов
- Рекомендательные системы. Часть 1
- Рекомендательные системы. Часть 2
- Нейронные сети
- Компьютерное зрение
- Заключение
Модуль 8 – Методологии Agile/ Scrum
Модуль 9 – Продвинутые коммуникативные навыки
- Техника речи и ее особенности
- Речевые проблемы и упражнения
- Речевые упражнения для развития дикции, речевого аппарата и тела
- Навыки формулирования и изложения мысли
- Самопрезентация
- Личный бренд
- Основные ошибки ораторов
- Психология влияния
- Эмоциональная настройка
- Работа с аудиторией
- 10 правил публичного выступления
- Подготовка презентации
Примечание: на момент создания темы актуальная цена не известна.
Отзывы
Отзывов пока нет.