Цели курса:
1. Научиться решать задачи машинного обучения на Python – Вы освоите все основные темы машинного обучения и сможете применять эти методы в своей работе для решения текущего проекта или для трудоустройства в новую компанию и на новое направление
2. Реализовать свой рабочий проект – многие проекты могут потребовать применения методов машинного обучения, если у вас есть подобный проект, вы сможете реализовать его за курс
3. Получить сертификат, рекомендацию и создать портфолио проектов – после завершения курса вы получите весомый сертификат и рекомендацию, так же у вас будет портфолио из нескольких решённых вами практических задач.
4. Решить 10 практических задач по машинному обучению – каждое занятие будет сопровождаться практикой – решением конкретной задачи из области машинного обучения.
5. Получить практику на стажировке в Лаборатории Университета – в Лаборатории Университета искусственного интеллекта вы можете получить практический опыт применения машинного обучения в реальных проектах.
1. Подготовка данных для построения модели и простейшие алгоритмы машинного обучения
- Первичная обработка исходных данных. Основные недостатки исходных данных: «мусор», пропуски, выбросы;
- Метод k-соседей (k- neighbors);
- Обработка исходных данных DataSet Titanic и построение модели бинарной классификации.
2. Метрики в задачах бинарной классификации, классификаторы Байеса
- Метрики в задачах бинарной классификации. Полнота, точность, accuracy, ROC-AUC кривая, f-мера;
- Классификаторы Байес;
- Построение модели для DataSet Titanic, анализ качества моделей.
3. Линейные модели, задачи регрессии
- Линейная регрессия, метод наименьших квадратов;
- Задача регрессии и нормализация признаков;
- Построение модели для DataSet Energy Star Score, анализ качества модели.
4. Метод опорных векторов (SVM), предсказание вероятности принадлежности к классу
- Метод опорных векторов (SVM), наглядная демонстрация модели на примере DataSet Iris;
- Наглядная демонстрация модели на примере DataSeta Iris;
- Определение вероятности принадлежности классу на примере DataSet Titani.
5. Решающие деревья, случайный лес, градиентный бустинг
- Алгоритмы построения решающих деревьев ID3 и С4.5;
- Случайный лес в задачах регрессии и классификации;
- Градиентный бустинг;
- Построение моделей на основе решающих деревьев на примере DataSet Titanic.
6. Многоклассовая классификация, кластеризация
- Алгоритмы кластеризации данных (метод k-соседей, иерархические методы, t-SNE);
- Модели многоклассовой классификации, оценки их параметров на примере Wine Dataset Recognition.
7. Решение задачи регрессии
- Feature selection/ feature engineering;
- Построение модели на примере DataSet House Price.
8. Решение NLP задачи
- Регулярные выражения;
- Способы численного представления текстовой информации;
- Построение моделей на примере DataSet Imdb.
9. Решение маркетинговой задачи по оттоку клиентов
- Статистический анализ признаков;
- Построение модели на примере DataSet Telecom Churn.
10. Решение задачи по построению рекомендательной системы
- Подходы к построению рекомендательных систем;
- SVD-разложение, векторные представления объектов;
- Построение модели на примере MovieLens 20M DataSet.
11. Решение задачи идентификации