Описание
Чему вы научитесь
- Расширенные рабочие процессы с данными из реального мира с помощью Pandas вы не найдете ни в одном другом курсе.
- Параллельная работа с Pandas и SQL-базами данных (лучшее из двух миров)
- Работа с API, JSON и Pandas для импорта больших наборов данных из Интернета
- Доведение Pandas до предела (и за его пределами …)
- Приложение для машинного обучения: прогнозирование цен на недвижимость
- Финансовые приложения: бэктестинг и форвардное тестирование инвестиционных стратегий + отслеживание индексов
- Разработка функций, стандартизация, фиктивные переменные и выборка с помощью Pandas
- Работа с большими наборами данных (миллионы строк / столбцов)
- Работа с полностью беспорядочными / нечистыми наборами данных (стандартный случай в реальном мире)
- Обработка строковых и вложенных данных JSON с помощью Pandas
- Загрузка данных из баз данных (SQL) в Pandas и наоборот
- Загрузка данных JSON в Pandas и наоборот
- Веб-парсинг с пандами
- Очистка больших и беспорядочных наборов данных (миллионы строк / столбцов)
- Работа с API и пакетами Python Wrapper для импорта больших наборов данных из Интернета
- Пояснительный анализ данных с большими наборами реальных данных
- Расширенная визуализация с Matplotlib и Seaborn
Требования
- Вы должны быть знакомы с Python (Стандартная библиотека, Numpy, Matplotlib)
- Вы должны были раньше работать с Pandas (по крайней мере, вы должны знать основы)
- Настольный компьютер (Windows, Mac или Linux), способный хранить и запускать Anaconda. Курс проведет вас через установку необходимого бесплатного программного обеспечения.
- Подключение к Интернету для потоковой передачи HD-видео.
- Некоторые математические навыки на уровне средней школы были бы отличными (не обязательно, но это помогает)
Описание
Добро пожаловать на первый продвинутый и проектный курс по науке о данных Pandas!
Этот курс начинается там, где заканчиваются многие другие курсы : вы можете написать код Pandas, но вы все еще боретесь с реальными проектами, потому что
- Реальные данные обычно не предоставляются в одном или нескольких текстовых файлах / файлах Excel -> более продвинутые методы импорта данных. требуются
- Реальные данные большие, неструктурированные, вложенные и нечистые -> более продвинутые методы обработки данных и анализа / визуализации требуются данных
- многие простые в использовании методы Pandas лучше всего работают с относительно небольшими и чистыми наборами данных -> для реальных наборов данных требуется больше общего кода (включая другие библиотеки / модули)
Независимо от того, нужны ли вам отличные навыки Pandas для анализа данных, машинного обучения или финансов, это правильный курс для вас, чтобы довести свои навыки до уровня эксперта! Осваивайте свои реальные проекты!
Этот курс охватывает полный рабочий процесс обработки данных AZ:
- Импорт (сложных и вложенных) данных из JSON файлов .
- Импортируйте (сложные и вложенные) данные из Интернета с помощью веб-API , JSON и пакетов Wrapper .
- Импорт (сложных и вложенных) данных из баз данных SQL .
- Хранить (сложные и вложенные) данные в JSON файлах .
- Хранить (сложные и вложенные) данные в данных базах SQL .
- Работайте с Pandas и базами данных SQL параллельно (используя лучшее из обоих миров).
- Эффективно импортируйте и объединяйте данные из множества текстовых / CSV-файлов .
- Очистите большие и беспорядочные наборы данных с помощью более общего кода .
- Очищайте, обрабатывайте и выравнивайте вложенные и строковые данные в DataFrames.
- Знайте, как обрабатывать и нормализовать строки Unicode .
- объединяйте и объединяйте Эффективно множество наборов данных.
- Масштабирование и автоматизация объединения данных.
- Пояснительный анализ данных и представление данных с помощью расширенных инструментов визуализации (расширенные Matplotlib и Seaborn).
- Проверьте пределы производительности Pandas с расширенными функциями агрегирования и группировки данных .
- Предварительная обработка данных и разработка функций для машинного обучения с помощью простого кода Pandas.
- Используйте свои данные 1. Обучите и протестируйте модели машинного обучения на предварительно обработанных данных и проанализируйте результаты.
- Используйте свои данные 2: бэктестирование и форвардное тестирование инвестиционных стратегий (стек финансов и инвестиций).
- Используйте свои данные 3: отслеживание индекса (стек финансов и инвестиций).
- Используйте свои данные 4. Представьте свои данные с помощью Python в красивом формате HTML (качество веб-сайта).
- и многое другое …
Я Александр Хагманн, специалист по финансам и специалист по данным (> 7 лет опыта работы в отрасли) и инструктор-бестселлер по Pandas, (финансовая) наука о данных и финансы с Python. Будем рады видеть вас на этом курсе!
Для кого этот курс:
- Всем, кто действительно хочет освоить большие, беспорядочные и нечистые наборы данных.
- Каждый, кто хочет улучшить свои навыки, от «Я могу написать код Pandas» до «Я могу освоить свои проекты данных реального слова с Pandas»
- Специалисты по данным
- Специалисты по машинному обучению
- Специалисты в области финансов и инвестиций
- Исследователи
Отзывы
Отзывов пока нет.