Скачать [Слёрм] Data-инженер [Анастасия Сафонова]

Информация
Цена: 495 РУБ
Организатор: Kail Kail
Ссылки для скачивания
Kail
Kail
Организатор
Организатор
Регистрация
09.04.2020
Сообщения
394 982
Реакции
38 788
Монеты
1 191
Оплачено
0
Баллы
0
  • #SkladchinaVip
  • #1
[Слёрм] Data-инженер [Анастасия Сафонова]
Ссылка на картинку

Кому подойдёт курс:

1. Системным и сетевым администраторам
Научитесь проектировать, разрабатывать и поддерживать архитектуру для работы с большими данными. Освоите основные инструменты Data-инженеров и сможете внедрять принятые решения в production.
2. Backend-разработчикам
Изучите все этапы работы с данными. Научитесь собирать информацию из разных источников и выполнять интересные задачи. Сможете увеличить доход и повысить свою ценность для компании.

Пройдя курс, вы:

1. Научитесь проектировать архитектуру хранилищ данных под разные задачи и условия. Узнаете основные принципы построения систем потоковой аналитики. Получите представление о существующих облачных и on-premise решениях.
2. Научитесь проводить обследование перед стартом нового проекта и определять «информационную зрелость» заказчика. Поймёте, что нужно знать перед проектированием архитектуры хранилища данных в новом проекте.
3. Получите базовые знания Apache Spark для Data-инженера. Научитесь использовать DataFrame API и Spark Streaming API для исследования, извлечения, преобразования и хранения данных.
4. Научитесь создавать пайплайны обработки данных с использованием opensource ETL-инструментов. Научитесь работать с основными инструментами Data-инженера.
5. Узнаете принцип работы технологий, упрощающих жизнь DE при работе с RDBMS. Научитесь оптимизировать запросы под нужды дата-инженера.
6. Узнаете принципы работы и применимость разных видов NOSQL БД. Научитесь работать с колоночными БД на примере HDFS.
7. Научитесь проектировать хранилища данных в условиях изменчивости первичных данных.
8. Научитесь оценивать качество данных и узнаете способы устранения проблем с data quality.
9. Научитесь работать с базовыми инструментами получения данных от граничных устройств в облако.

Содержание:

Модуль 1 - Инженерия данных
Научим проектировать архитектуру хранилищ данных, поможем освоить инструменты Data-инженера, расскажем о принципах подготовки проекта к запуску и не только.

Урок: Экосистема и роль инженерии данных
  • Что такое инженерия данных, кто такой дата инженер. Какие проблемы решает, роль в команде, почему DSов часто недостаточно для успешного проекта. Обязанности и навыки дата инженера
  • Обзор экосистемы инженерии данных: типы и структуры данных, форматы файлов, источники данных, используемые языки
Урок: Архитектура хранилищ данных
  • Традиционная архитектура хранилищ данных
  • Облачные хранилища
  • Озёра данных, витрины данных, хранилища данных - что это и чем отличаются
  • Что такое ETL, ELT. Обзор ETL-инструментов. Загрузчики данных, шины обмена данными
Урок: Реляционные базы данных
  • Реляционная модель данных
  • Принципы ACID
  • SQL. Оптимизация запросов для нужд data engineer'а
  • Индексирование
  • Партицирование, шардирование. Что это и зачем нужно
  • Доступ к данным с помощью ORM
  • Хранимые процедуры, триггеры
  • Транзакционное логирование: что это и зачем нужно. Механизмы CDC
  • Способы и инструменты исследования БД
Урок: NOSQL базы данных
  • Колоночные хранилища
  • Графовые базы данных
  • Документоориентированные хранилища
  • Хранилища ключ-значения
  • Time-Series DB"
  • Урок: Распределенные файловые системы
  • Hadoop - обзор
  • Технология Map-Reduce
Урок: Загрузчики данных
  • NiFi - знакомство и практические задачи
  • Урок: Оркестраторы данных
  • Airflow - знакомство и практические задачи
Урок: Шины данных
  • Kafka - знакомство и практические задачи
  • Урок: Принципы построения систем потоковой аналитики
  • Батчинг, стриминг
Урок: Spark for Data Engineering
  • Что такое Spark и зачем он нужен DE
  • DataFrames: Spark SQL, Reader & Writer, DataFrame & Column
  • Преобразования: Aggregations, Datetime, Strings & Collections, Non-Aggregate & Na
  • Functions, UDF
  • Партицирование, репартицирование
  • Spark Streaming
Урок: Предпроектное обследование
  • Как провести предпроектное обследование
  • Типовые вопросы для оценки «информационной зрелости» заказчика
Модуль 2 - Аналитический модуль
Научим проектировать хранилища данных и оценивать data quality.

Урок: Изменчивые данные и как с этим жить
  • Поддержка консистентности данных. Жизненный цикл данных
Урок: Оценка качества данных
  • Типы проблем КД, их причины и способы решения
Урок: «Тёмные» данные
  • О том, как данные врут и что с этим делать
Модуль 3 - DE & IoT модуль
Научим организовывать передачу данных от устройств в облако.

Урок: Data Engineering и IoT
  • MQTT и другие IoT-протоколы передачи данных от граничного устройства в облако
  • Инструменты сбора данных от IoT-устройств: RabbitMQ, mosquitto
Показать больше
 
Зарегистрируйтесь , чтобы посмотреть скрытый контент.
Поиск по тегу:
Теги
data-инженер все этапы работы с данными слёрм
Похожие складчины
Kail
Ответы
0
Просмотры
225
Kail
Kail
Kail
Ответы
0
Просмотры
672
Kail
Kail
Kail
Ответы
0
Просмотры
128
Kail
Kail
Kail
Ответы
0
Просмотры
1K
Kail
Kail
Kail
Ответы
0
Просмотры
418
Kail
Kail
Показать больше складчин

Войдите или зарегистрируйтесь

Вы должны быть авторизованны для просмотра материала

Создать аккаунт

Создать учетную запись займет не больше минуты!

Войти

Уже зарегистрированы? Просто войдите.