Описание
3 дня практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.
Программа курса GreenPlum для инженеров данных
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
- Введение в GreenPlum
- Архитектура GreenPlum
- Партиционирование таблиц, индексы
- Транзакции и блокировки
- Оптимизация и планы запросов
- Лабораторная работа
Часть 2. Внешние данные и код: GreenPlum как агрегатор данных и исполнитель кода
- Механизм внешних таблиц, протоколы, PXF
- Загрузка данных в GreenPlum
- Механизм UDF
- Работа с JSON, XML
- Экосистема и дополнительные библиотеки
- Лабораторная работа
Часть 3. GreenPlum в современных хранилищах данных
Отзывы
Отзывов пока нет.