BOOKS - Apache Airflow и конвейеры обработки данных
Apache Airflow и конвейеры обработки данных - Харенслак Б., де Руйтер Дж. 2021 (2022) PDF Язык русскийКонвейеры обработки данных управляют потоком данных с момента их первоначального сбора д BOOKS
ECO~32 kg CO²

2 TON

Views
3965

Telegram
 
Apache Airflow и конвейеры обработки данных
Author: Харенслак Б., де Руйтер Дж.
Year: 2021 (2022)
Format: PDF
File size: 17 мб
Language: RU



Pay with Telegram STARS
The book covers topics such as ETL (Extract, Transform, Load), data integration, data transformation, data quality, and data governance, and provides practical examples and case studies to illustrate the concepts discussed. Book Description: Apache Airflow и конвейеры обработки данных (Apache Airflow and Data Processing Pipelines) is a comprehensive guide to using Apache Airflow in data processing pipelines. This book provides readers with a detailed understanding of how to design, implement, and manage data processing workflows using this powerful tool. The book covers a range of topics, including ETL (Extract, Transform, Load), data integration, data transformation, data quality, and data governance, and offers practical examples and case studies to illustrate the concepts discussed. The book begins by introducing the concept of data processing pipelines and the role that Apache Airflow plays in managing these workflows. It then delves into the details of how to create and manage Airflow tasks, including creating DAGs (Directed Acyclic Graphs), defining task dependencies, and using sensors and operators to handle errors and exceptions. The book also covers the use of Airflow's built-in sensors and operators, as well as how to create custom sensors and operators to meet specific use cases.
Книга охватывает такие темы, как ETL (извлечение, преобразование, загрузка), интеграция данных, преобразование данных, качество данных и управление данными, а также содержит практические примеры и тематические исследования, иллюстрирующие обсуждаемые концепции. Апачский и конвейеры обработки данных Потока воздуха (апачские Трубопроводы Потока воздуха и Обработки данных) является подробным руководством по использованию апачского Потока воздуха в трубопроводах обработки данных. Эта книга дает читателям подробное понимание того, как проектировать, внедрять и управлять рабочими процессами обработки данных с помощью этого мощного инструмента. Книга охватывает ряд тем, включая ETL (Extract, Transform, Load), интеграцию данных, преобразование данных, качество данных и управление данными, а также предлагает практические примеры и тематические исследования для иллюстрации обсуждаемых концепций. Книга начинается с введения концепции конвейеров обработки данных и роли, которую Apache Airflow играет в управлении этими рабочими процессами. Затем в нем подробно рассматриваются способы создания задач Airflow и управления ими, включая создание групп обеспечения доступности баз данных (направленных ациклических графов), определение зависимостей задач, а также использование датчиков и операторов для обработки ошибок и исключений. В книге также рассказывается об использовании встроенных датчиков и операторов Airflow, а также о том, как создавать пользовательские датчики и операторов для удовлетворения конкретных сценариев использования.
''

You may also be interested in:

Apache Cordova in Action
The McDonnell Douglas Apache
Apache Tactics 1830–86
Fort Treachery : Apache #5
Apache Legacy (Coltons, #4)
Portlets and Apache Portals
McDonnell Douglas AH-64 Apache
Apache Helicopter Pilots
The Legend of the Apache Kid
Apache The Definitive Guide
Apache Cordova 4 Programming
Apache Pulsar в действии
Pairing Apache Shiro and Java EE 7
Apache Springs (Bloody Arizona #1-2)
Apache Solr High Performance
Apache Rampage (Floating Outfit, #55)
Apache Solr Search Patterns
I60 Recipes for Apache CloudStack
Apache by Jere D James (2012-01-31)
Indeh: An Apache Odyssey, with New Maps
Apache Tactics 1830-86 (Elite)
Scaling Apache Solr (+code)
Apache Spark Graph Processing
Stream Processing with Apache Flink
Apache Dawn (The Wildfire Saga)
Stream Processing Hands-on with Apache Flink
The Apache Indians: In Search of the Missing Tribe
AH-64 Apache (Model Detail Photo Monograph №1)
Stream Processing Hands-on with Apache Flink
NoSQL Web Development with Apache Cassandra
Ambush at Apache Pass (Yakima Henry, #11)
Apache Lawman (U.S. Marshal Piedmont Kelly)
AH-64 Apache in Action (Squadron Signal 1095)
Big Data Processing with Apache Spark
Mastering Apache Pulsar (Third Early Release)
Apache Warrior vs US Cavalryman: 1846-86 (Combat, 19)
Apache Cochise 17 - Western: Apachen-Poker
Apache Oozie The Workflow Scheduler for Hadoop
Apache Spark in 24 Hours, Sams Teach Yourself
Programmer|s Guide to Apache Thrift