
BOOKS - PROGRAMMING - Data Quality Fundamentals

Data Quality Fundamentals
Author: Barr Moses, Lior Gavish, and Molly Vorwerck
Year: 2022-05-31 Fourth Release
Format: EPUB
File size: 10 MB
Language: ENG

Year: 2022-05-31 Fourth Release
Format: EPUB
File size: 10 MB
Language: ENG

They provide a systematic approach to building reliable data pipelines that deliver high-quality data to downstream consumers and help organizations make better decisions faster While many data engineers are familiar with the technical aspects of data integration and processing few have received formal training in data quality and its importance in the context of data engineering This book provides a comprehensive framework for understanding data quality and its relationship to business outcomes, as well as practical advice for implementing data quality processes and technologies to ensure that data is fit for purpose. The book "Data Quality Fundamentals" addresses a crucial issue faced by many data engineering teams today: the "good pipelines, bad data" problem. Despite having advanced data infrastructure, many teams struggle with poor quality data, which can lead to incorrect or misleading insights and ultimately impact business decision-making. The authors, Barr Moses, Lior Gavish, and Molly Vorwerck, experts from the data reliability company Monte Carlo, offer a systematic approach to ensuring high-quality data delivery and making better decisions faster. The book begins by highlighting the importance of understanding technology evolution and its impact on modern knowledge development. The authors emphasize the need to develop a personal paradigm for perceiving the technological process, as this will be essential for humanity's survival and the unification of people in a warring state. They argue that adaptation of text for human perception, analysis, and change of approaches to studying new technologies is necessary to make technological terms more accessible and easier to understand. The authors then delve into the challenges faced by data engineering teams, including broken datasets, stale quarterly reports, and funky dashboards.
Они обеспечивают системный подход к построению надежных конвейеров данных, которые доставляют высококачественные данные потребителям вниз по течению и помогают организациям быстрее принимать более эффективные решения. Хотя многие инженеры по данным знакомы с техническими аспектами интеграции и обработки данных, лишь немногие прошли формальное обучение по качеству данных и их важности в контексте инженерии данных. Эта книга обеспечивает всеобъемлющую основу для понимания качества данных и их связи с результатами бизнеса, а также практические рекомендации по внедрению процессов и технологий обеспечения качества данных для обеспечения соответствия данных целям. В книге «Основы качества данных» рассматривается важнейшая проблема, с которой сегодня сталкиваются многие команды специалистов по разработке данных: проблема «хороших конвейеров, плохих данных». Несмотря на развитую инфраструктуру данных, многие команды борются с низким качеством данных, что может привести к неправильному или вводящему в заблуждение пониманию и в конечном итоге повлиять на принятие бизнес-решений. Авторы, Барр Мозес, Лиор Гавиш и Молли Ворверк, эксперты из компании по надежности данных Монте-Карло, предлагают систематический подход к обеспечению высококачественной доставки данных и принятия лучших решений быстрее. Книга начинается с того, что подчеркивается важность понимания эволюции технологий и ее влияния на развитие современных знаний. Авторы подчеркивают необходимость выработки личностной парадигмы восприятия технологического процесса, так как это будет иметь существенное значение для выживания человечества и объединения людей в воюющем государстве. Они утверждают, что адаптация текста для человеческого восприятия, анализа и изменения подходов к изучению новых технологий необходима, чтобы сделать технологические термины более доступными и понятными. Затем авторы углубляются в проблемы, с которыми сталкиваются команды по разработке данных, включая сломанные наборы данных, устаревшие квартальные отчеты и забавные панели мониторинга.
Ils offrent une approche systémique pour construire des pipelines de données fiables qui fournissent des données de haute qualité aux consommateurs en aval et aident les entreprises à prendre des décisions plus rapides et plus efficaces. Bien que de nombreux ingénieurs en données connaissent les aspects techniques de l'intégration et du traitement des données, seuls quelques-uns ont reçu une formation formelle sur la qualité des données et leur importance dans le contexte de l'ingénierie des données. Ce livre fournit un cadre complet pour comprendre la qualité des données et leurs liens avec les résultats de l'entreprise, ainsi que des conseils pratiques sur la mise en œuvre des processus et des technologies d'assurance de la qualité des données pour s'assurer que les données sont conformes aux objectifs. livre s bases de la qualité des données traite d'un problème crucial auquel de nombreuses équipes de développement de données sont confrontées aujourd'hui : le problème des « bons pipelines, des mauvaises données ». Malgré le développement de l'infrastructure de données, de nombreuses équipes luttent contre la mauvaise qualité des données, ce qui peut conduire à une compréhension erronée ou trompeuse et, en fin de compte, influencer la prise de décisions commerciales. s auteurs, Barr Moses, Lior Gavish et Molly Vorverk, experts de la société de fiabilité des données Monte-Carlo, proposent une approche systématique pour fournir des données de haute qualité et prendre de meilleures décisions plus rapidement. livre commence par souligner l'importance de comprendre l'évolution de la technologie et son impact sur le développement des connaissances modernes. s auteurs soulignent la nécessité d'élaborer un paradigme personnel de la perception du processus technologique, car cela sera essentiel à la survie de l'humanité et à l'unification des gens dans un État en guerre. Ils affirment que l'adaptation du texte à la perception humaine, à l'analyse et à la modification des approches de l'apprentissage des nouvelles technologies est nécessaire pour rendre les termes technologiques plus accessibles et compréhensibles. s auteurs examinent ensuite les problèmes rencontrés par les équipes de développement de données, notamment les ensembles de données cassés, les rapports trimestriels périmés et les tableaux de bord amusants.
Proporcionan un enfoque sistémico para construir transportadores de datos confiables que entregan datos de alta calidad a los consumidores río abajo y ayudan a las organizaciones a tomar decisiones más rápidas y eficientes. Aunque muchos ingenieros de datos están familiarizados con los aspectos técnicos de la integración y el procesamiento de datos, pocos han recibido capacitación formal sobre la calidad de los datos y su importancia en el contexto de la ingeniería de datos. Este libro proporciona un marco integral para comprender la calidad de los datos y su relación con los resultados del negocio, así como recomendaciones prácticas para implementar procesos y tecnologías de garantía de calidad de datos para asegurar que los datos se ajusten a los objetivos. libro «Fundamentos de Calidad de Datos» examina el problema más importante que enfrentan hoy muchos equipos de especialistas en desarrollo de datos: el problema de «buenos transportadores, malos datos». A pesar de la infraestructura de datos desarrollada, muchos equipos luchan contra la mala calidad de los datos, lo que puede conducir a una comprensión errónea o enga y, en última instancia, influir en la toma de decisiones empresariales. autores, Barr Moisés, Lior Gavish y Molly Worwerk, expertos de la compañía de fiabilidad de datos Monte Carlo, proponen un enfoque sistemático para garantizar la entrega de datos de alta calidad y la toma de mejores decisiones más rápidamente. libro comienza subrayando la importancia de comprender la evolución de la tecnología y su impacto en el desarrollo del conocimiento moderno. autores subrayan la necesidad de generar un paradigma personal para la percepción del proceso tecnológico, ya que esto será esencial para la supervivencia de la humanidad y la unión de las personas en un Estado en guerra. Sostienen que la adaptación del texto a la percepción humana, el análisis y el cambio de enfoques para el estudio de las nuevas tecnologías es necesaria para que los términos tecnológicos sean más accesibles y comprensibles. A continuación, los autores profundizan en los problemas que enfrentan los equipos de desarrollo de datos, incluidos conjuntos de datos rotos, informes trimestrales obsoletos y paneles divertidos.
Eles fornecem uma abordagem de sistema para a construção de linhas de montagem confiáveis que fornecem dados de alta qualidade para os consumidores e ajudam as organizações a tomar decisões mais rápidas. Embora muitos engenheiros estejam familiarizados com os aspectos técnicos da integração e processamento de dados, poucos receberam treinamento formal sobre a qualidade dos dados e sua importância no contexto da engenharia de dados. Este livro fornece uma base abrangente para a compreensão da qualidade dos dados e sua relação com os resultados do negócio, além de recomendações práticas para a implementação de processos e tecnologias de garantia da qualidade dos dados para garantir a conformidade dos dados com os objetivos. O livro «Fundamentos da Qualidade dos Dados» aborda um problema crucial que muitas equipes de desenvolvimento de dados enfrentam hoje: «boas linhas de montagem, dados ruins». Apesar da infraestrutura avançada de dados, muitas equipes estão lutando contra a baixa qualidade dos dados, o que pode levar a uma compreensão errada ou enganosa e eventualmente afetar a tomada de decisões. Os autores, Barr Moses, Lior Gavish e Molly Worwerk, especialistas da empresa de confiabilidade de dados Monte Carlo, oferecem uma abordagem sistemática para fornecer dados de alta qualidade e tomar melhores decisões mais rapidamente. O livro começa enfatizando a importância de compreender a evolução da tecnologia e seus efeitos no desenvolvimento do conhecimento moderno. Os autores destacam a necessidade de criar um paradigma pessoal para a percepção do processo tecnológico, uma vez que isso seria essencial para a sobrevivência da humanidade e para a união das pessoas num Estado em guerra. Eles afirmam que a adaptação do texto para a percepção humana, análise e mudança de abordagem para o estudo de novas tecnologias é necessária para tornar os termos tecnológicos mais acessíveis e compreensíveis. Em seguida, os autores se aprofundam nos problemas enfrentados pelas equipes de desenvolvimento de dados, incluindo conjuntos de dados quebrados, relatórios trimestrais obsoletos e painéis divertidos de monitoramento.
Forniscono un approccio di sistema alla creazione di sistemi di montaggio dati affidabili che forniscono dati di alta qualità ai consumatori a valle e aiutano le organizzazioni a prendere decisioni più veloci. Anche se molti ingegneri di dati conoscono gli aspetti tecnici dell'integrazione e dell'elaborazione dei dati, pochi sono stati formati sulla qualità e l'importanza dei dati nel contesto dell'ingegneria dei dati. Questo libro fornisce una base completa per comprendere la qualità dei dati e la loro relazione con i risultati aziendali, nonché suggerimenti pratici sull'implementazione di processi e tecnologie per garantire la qualità dei dati in modo da soddisfare gli obiettivi. Il libro «Basi di qualità dei dati» affronta il problema cruciale che molti team di esperti di sviluppo di dati stanno affrontando oggi: «cattive reti di montaggio, dati negativi». Nonostante l'infrastruttura avanzata dei dati, molti team stanno affrontando la scarsa qualità dei dati, che può portare a una comprensione errata o ingannevole e alla fine influenzare le decisioni aziendali. Gli autori, Barr Moses, Lior Gavish e Molly Worwerk, esperti della società di affidabilità dati di Montecarlo, offrono un approccio sistematico per fornire dati di alta qualità e prendere decisioni migliori più rapidamente. Il libro inizia sottolineando l'importanza di comprendere l'evoluzione della tecnologia e il suo impatto sullo sviluppo delle conoscenze moderne. Gli autori sottolineano la necessità di sviluppare un paradigma personale per la percezione del processo tecnologico, poiché ciò sarà essenziale per la sopravvivenza dell'umanità e l'unione delle persone in uno stato in guerra. Sostengono che l'adattamento del testo per la percezione umana, l'analisi e il cambiamento degli approcci allo studio delle nuove tecnologie è necessario per rendere i termini tecnologici più accessibili e comprensibili. Gli autori approfondiscono quindi i problemi affrontati dai team di sviluppo dei dati, inclusi set di dati spezzati, rapporti trimestrali obsoleti e dashboard divertenti.
e bieten einen systematischen Ansatz für den Aufbau robuster Datenpipelines, die nachgeschaltete Verbraucher mit qualitativ hochwertigen Daten versorgen und Unternehmen helfen, bessere Entscheidungen schneller zu treffen. Obwohl viele Data Engineers mit den technischen Aspekten der Datenintegration und -verarbeitung vertraut sind, haben nur wenige eine formale Schulung zur Datenqualität und deren Bedeutung im Kontext des Data Engineering erhalten. Dieses Buch bietet einen umfassenden Rahmen für das Verständnis der Datenqualität und deren Beziehung zu Geschäftsergebnissen sowie praktische Empfehlungen zur Implementierung von Datenqualitätsprozessen und -technologien, um sicherzustellen, dass die Daten den Zielen entsprechen. Das Buch „Grundlagen der Datenqualität“ befasst sich mit dem wichtigsten Problem, mit dem viele Teams von Datenentwicklern heute konfrontiert sind: dem Problem der „guten Pipelines, schlechten Daten“. Trotz einer gut ausgebauten Dateninfrastruktur haben viele Teams mit schlechter Datenqualität zu kämpfen, was zu falschen oder irreführenden Einblicken führen und letztendlich die Geschäftsentscheidungen beeinflussen kann. Die Autoren, Barr Moses, Lior Gavish und Molly Vorwerk, Experten des Monte Carlo Data Reliability Company, schlagen einen systematischen Ansatz vor, um eine qualitativ hochwertige Datenbereitstellung zu gewährleisten und bessere Entscheidungen schneller zu treffen. Das Buch beginnt mit der Betonung der Bedeutung des Verständnisses der Entwicklung der Technologie und ihrer Auswirkungen auf die Entwicklung des modernen Wissens. Die Autoren betonen die Notwendigkeit, ein persönliches Paradigma der Wahrnehmung des technologischen Prozesses zu entwickeln, da dies für das Überleben der Menschheit und die Vereinigung der Menschen in einem kriegführenden Staat von wesentlicher Bedeutung sein wird. e argumentieren, dass die Anpassung des Textes an die menschliche Wahrnehmung, Analyse und Veränderung von Ansätzen zur Erforschung neuer Technologien notwendig ist, um technologische Begriffe zugänglicher und verständlicher zu machen. Die Autoren gehen dann tiefer auf die Herausforderungen ein, mit denen die Datenentwicklungsteams konfrontiert sind, darunter kaputte Datensätze, veraltete Quartalsberichte und lustige Dashboards.
Zapewniają one systematyczne podejście do budowy solidnych rurociągów danych, które dostarczają wysokiej jakości dane konsumentom niższego szczebla i pomagają organizacjom szybciej podejmować lepsze decyzje. Podczas gdy wielu inżynierów danych zna techniczne aspekty integracji i przetwarzania danych, niewielu otrzymało formalne szkolenie na temat jakości danych i ich znaczenia w kontekście inżynierii danych. Niniejsza książka zapewnia kompleksowe ramy dla zrozumienia jakości danych i ich związku z wynikami biznesowymi, a także praktyczne zalecenia dotyczące wdrażania procesów i technologii jakości danych w celu zapewnienia realizacji tych celów. Książka „Fundamentals of Data Quality” analizuje najważniejszy problem, z którym boryka się dziś wiele zespołów zajmujących się opracowywaniem danych: problem „dobrych rurociągów, złych danych”. Pomimo zaawansowanej infrastruktury danych, wiele zespołów zmaga się z niską jakością danych, co może prowadzić do nieprawidłowego lub wprowadzającego w błąd zrozumienia i ostatecznie wpływać na podejmowanie decyzji przez przedsiębiorstwa. Autorzy, Barr Moses, Lior Gavish i Molly Worwerk, eksperci w firmie Monte Carlo zajmującej się wiarygodnością danych, proponują systematyczne podejście w celu zapewnienia szybszego dostarczania danych wysokiej jakości i podejmowania lepszych decyzji. Książka zaczyna się od podkreślenia znaczenia zrozumienia ewolucji technologii i jej wpływu na rozwój nowoczesnej wiedzy. Autorzy podkreślają potrzebę opracowania osobistego paradygmatu postrzegania procesu technologicznego, ponieważ będzie to niezbędne dla przetrwania ludzkości i zjednoczenia ludzi w stanie wojennym. Twierdzą, że dostosowanie tekstu do postrzegania, analizy i zmieniania podejścia do uczenia się nowych technologii jest konieczne, aby warunki technologiczne były bardziej dostępne i zrozumiałe. Następnie autorzy zagłębiają się w wyzwania stojące przed zespołami rozwoju danych, w tym rozbite zbiory danych, przestarzałe raporty kwartalne i deski rozdzielcze zabawy.
הם מספקים גישה שיטתית לבניית צינורות מידע חסונים שמעבירים נתונים באיכות גבוהה מהנדסי נתונים רבים מכירים את ההיבטים הטכניים של שילוב ועיבוד נתונים, אך מעטים קיבלו הכשרה פורמלית על איכות המידע וחשיבותו בהקשר של הנדסת נתונים. ספר זה מספק מסגרת מקיפה להבנת איכות המידע והקשר שלו לתוצאות עסקיות, כמו גם המלצות מעשיות ליישום תהליכים וטכנולוגיות לאיכות מידע כדי להבטיח כי יעדים אלה יתממשו. הספר ”יסודות איכות הנתונים” בוחן את הבעיה החשובה ביותר שצוותי פיתוח נתונים רבים מתמודדים איתה כיום: הבעיה של ”צינורות טובים, נתונים רעים”. למרות תשתית נתונים מתקדמת, צוותים רבים נאבקים באיכות נתונים ירודה, שיכולה להוביל להבנה שגויה או מטעה ובסופו של דבר להשפיע על קבלת החלטות עסקיות. המחברים, ליאור גביש ומולי וורבק, מומחים בחברת אמינות המידע מונטה קרלו, מציעים גישה שיטתית כדי להבטיח העברת נתונים באיכות גבוהה והחלטות טובות יותר מתקבלות מהר יותר. הספר מתחיל בכך שהוא מדגיש את החשיבות של הבנת התפתחות הטכנולוגיה והשפעתה על התפתחות הידע המודרני. המחברים מדגישים את הצורך לפתח פרדיגמה אישית לתפיסת התהליך הטכנולוגי, שכן הדבר יהיה חיוני להישרדות האנושות ולאיחוד בני האדם במדינה לוחמת. הם טוענים כי התאמת טקסט לתפיסה אנושית, ניתוח, ושינוי גישות ללמידת טכנולוגיות חדשות הכרחית כדי להפוך מונחים טכנולוגיים לנגישים ומובנים יותר. המחברים אז מתעמקים באתגרים העומדים בפני צוותי פיתוח נתונים, כולל נתונים שבורים, דו "חות רבעוניים מיושנים ולוחות מחוונים מהנים.''
Alt tüketicilere yüksek kaliteli veri sağlayan ve kuruluşların daha iyi kararları daha hızlı almasına yardımcı olan sağlam veri boru hatları oluşturmak için sistematik bir yaklaşım sağlarlar. Birçok veri mühendisi veri entegrasyonu ve işlemenin teknik yönlerine aşina olsa da, çok azı veri kalitesi ve veri mühendisliği bağlamında önemi hakkında resmi eğitim almıştır. Bu kitap, veri kalitesini ve iş sonuçlarıyla ilişkisini anlamak için kapsamlı bir çerçeve ve bu hedeflerin karşılanmasını sağlamak için veri kalitesi süreçlerini ve teknolojilerini uygulamak için pratik öneriler sunmaktadır. "Veri Kalitesinin Temelleri" kitabı, birçok veri geliştirme ekibinin bugün karşılaştığı en önemli sorunu inceler:'iyi boru hatları, kötü veriler "sorunu. Gelişmiş bir veri altyapısına rağmen, birçok ekip düşük veri kalitesi ile mücadele eder, bu da yanlış veya yanıltıcı anlayışa yol açabilir ve sonuçta iş karar verme sürecini etkileyebilir. Yazarlar, Barr Moses, Lior Gavish ve Molly Worwerk, Monte Carlo veri güvenilirliği şirketinde uzmanlar, yüksek kaliteli veri teslimi ve daha iyi kararların daha hızlı alınmasını sağlamak için sistematik bir yaklaşım önermektedir. Kitap, teknolojinin evrimini ve modern bilginin gelişimi üzerindeki etkisini anlamanın önemini vurgulayarak başlıyor. Yazarlar, teknolojik sürecin algılanması için kişisel bir paradigma geliştirmenin gerekliliğini vurgulamaktadır, çünkü bu, insanlığın hayatta kalması ve insanların savaşan bir durumda birleşmesi için gerekli olacaktır. İnsan algısı, analizi ve yeni teknolojileri öğrenmeye yönelik değişen yaklaşımlar için metnin uyarlanmasının, teknolojik terimleri daha erişilebilir ve anlaşılır hale getirmek için gerekli olduğunu savunuyorlar. Yazarlar daha sonra kırık veri kümeleri, eski üç aylık raporlar ve eğlenceli gösterge tabloları dahil olmak üzere veri geliştirme ekiplerinin karşılaştığı zorlukları araştırıyorlar.
إنها توفر نهجًا منهجيًا لبناء خطوط أنابيب بيانات قوية تقدم بيانات عالية الجودة للمستهلكين في المصب وتساعد المؤسسات على اتخاذ قرارات أفضل بشكل أسرع. في حين أن العديد من مهندسي البيانات على دراية بالجوانب التقنية لتكامل البيانات ومعالجتها، فإن القليل منهم تلقى تدريبًا رسميًا على جودة البيانات وأهميتها في سياق هندسة البيانات. يوفر هذا الكتاب إطارًا شاملاً لفهم جودة البيانات وعلاقتها بنتائج الأعمال، بالإضافة إلى توصيات عملية لتنفيذ عمليات وتكنولوجيات جودة البيانات لضمان تحقيق هذه الأهداف. يبحث كتاب «أساسيات جودة البيانات» أهم مشكلة تواجهها العديد من فرق تطوير البيانات اليوم: مشكلة «خطوط الأنابيب الجيدة والبيانات السيئة». على الرغم من البنية التحتية للبيانات المتقدمة، تكافح العديد من الفرق مع جودة البيانات الرديئة، مما قد يؤدي إلى فهم غير صحيح أو مضلل ويؤثر في النهاية على اتخاذ قرارات الأعمال. يقترح المؤلفون، Barr Moses و Lior Gavish و Molly Worwerk، الخبراء في شركة مونت كارلو لموثوقية البيانات، نهجًا منهجيًا لضمان تقديم بيانات عالية الجودة واتخاذ قرارات أفضل بشكل أسرع. يبدأ الكتاب بالتأكيد على أهمية فهم تطور التكنولوجيا وتأثيرها على تطوير المعرفة الحديثة. يؤكد المؤلفون على الحاجة إلى تطوير نموذج شخصي لتصور العملية التكنولوجية، لأن هذا سيكون ضروريًا لبقاء البشرية وتوحيد الناس في دولة متحاربة. يجادلون بأن تكييف النص للإدراك البشري والتحليل والنهج المتغيرة لتعلم التقنيات الجديدة أمر ضروري لجعل المصطلحات التكنولوجية أكثر سهولة وفهمًا. ثم يتعمق المؤلفون في التحديات التي تواجه فرق تطوير البيانات، بما في ذلك مجموعات البيانات المكسورة والتقارير الفصلية القديمة ولوحات القيادة الممتعة.
다운 스트림 소비자에게 고품질 데이터를 제공하고 조직이 더 나은 의사 결정을 더 빨리 내릴 수 있도록 강력한 데이터 파이프 라인을 구축하기위한 체계적인 접근 방식을 제 많은 데이터 엔지니어가 데이터 통합 및 처리의 기술적 측면에 익숙하지만 데이터 품질과 데이터 엔지니어링의 맥락에서 그 중요성에 대한 공식적인 교육을받은 사람은 거의 이 책은 데이터 품질과 비즈니스 결과와의 관계를 이해하기위한 포괄적 인 프레임 워크와 이러한 목표를 달성하기위한 데이터 품질 프로세스 및 기술을 구현하기위한 실질적인 권장 사항을 "데이터 품질의 기초" 책은 오늘날 많은 데이터 개발 팀이 직면하고있는 가장 중요한 문제인 "좋은 파이프 라인, 나쁜 데이터" 문제를 조사합니다. 고급 데이터 인프라에도 불구하고 많은 팀이 열악한 데이터 품질로 어려움을 겪고 있으며, 이는 잘못되었거나 오해의 소지가있는 이해로 이어지고 궁극 Monte Carlo 데이터 신뢰성 회사의 전문가 인 Barr Moses, Lior Gavish 및 Molly Worwerk는 고품질 데이터 전달을 보장하고 더 나은 결정을 내릴 수있는 체계적인 접근 방식을 제안합니다. 이 책은 기술의 진화를 이해하는 것의 중요성과 현대 지식의 발전에 미치는 영향을 강조함으로써 시작됩니다. 저자들은 인류의 생존과 전쟁 상태에있는 사람들의 통일에 필수적이기 때문에 기술 과정의 인식을위한 개인적인 패러다임을 개발할 필요성을 강조한다. 그들은 기술 용어를보다 쉽게 이해할 수 있도록 인간의 인식, 분석 및 새로운 기술 학습에 대한 접근 방식을 변경하기 위해 텍스트를 조정해야한다고 주장합니 그런 다음 저자는 고장난 데이터 세트, 구식 분기 별 보고서 및 재미있는 대시 보드를 포함하여 데이터 개발 팀이 직면 한 문제를 조사합니다.
彼らは、下流の消費者に高品質のデータを提供し、組織がより良い意思決定を迅速に行うのを助ける堅牢なデータパイプラインを構築するための体系的なアプローチを提供します。多くのデータエンジニアは、データ統合と処理の技術的側面に精通していますが、データ品質とデータエンジニアリングの文脈での重要性について正式なトレーニングを受けた人はほとんどいません。本書では、データ品質と業績との関係を理解するための包括的なフレームワークと、これらの目標を確実に達成するためのデータ品質プロセスと技術を実装するための実際的な推奨事項を提供します。本「データ品質の基礎」は、多くのデータ開発チームが今日直面している最も重要な問題である「良いパイプライン、悪いデータ」の問題を調べます。高度なデータインフラストラクチャにもかかわらず、多くのチームはデータ品質の低下に苦慮しており、誤った理解や誤解を招き、最終的にビジネスの意思決定に影響を与える可能性があります。Monte Carloのデータ信頼性の専門家であるBarr Moses、 Lior Gavish、 Molly Worwerkは、高品質のデータ配信とより良い意思決定を迅速に行うための体系的なアプローチを提案しています。この本は、技術の進化と現代の知識の発展への影響を理解することの重要性を強調することから始まります。著者たちは、人類の存続と戦争状態における人々の統一に不可欠であるため、技術プロセスの認識のための個人的なパラダイムを開発する必要性を強調している。彼らは、新しい技術を学ぶために、人間の知覚、分析、変化するアプローチにテキストを適応させることは、技術用語をよりアクセスしやすく理解しやすいものにするために必要であると主張している。次に、データ開発チームが直面している課題(壊れたデータセット、時代遅れの四半期レポート、楽しいダッシュボードなど)を掘り下げます。
它們提供了一種系統化的方法來構建可靠的數據輸送機,為下遊消費者提供高質量的數據,並幫助組織更快地做出更有效的決策。盡管許多數據工程師熟悉數據集成和處理的技術方面,但很少有人接受過有關數據質量及其在數據工程中的重要性的正式培訓。本書為了解數據質量及其與業務成果的關系提供了一個全面的框架,並為實施數據質量保證流程和技術提供了實用指南,以確保數據符合目標。「數據質量基礎」一書探討了許多數據開發專業人員團隊今天面臨的一個關鍵問題:「良好的輸送機,糟糕的數據」問題。盡管開發了數據基礎架構,但許多團隊仍在努力應對低質量數據,這可能導致誤解或誤導,並最終影響業務決策。作者Barr Moses、Lior Gavish和Molly Vorwerk是數據可靠性公司Monte Carlo的專家,他們提出了一種系統化的方法,以確保高質量的數據交付並更快地做出更好的決策。這本書首先強調了了解技術演變及其對現代知識發展的影響的重要性。作者強調有必要制定一種個人範式,以感知技術過程,因為這對於人類的生存和交戰國人民的團結至關重要。他們認為,為了使技術術語更容易獲得和理解,有必要對文本進行調整,以適應人類的感知,分析和改變學習新技術的方法。然後,作者深入研究了數據開發團隊面臨的問題,包括破損的數據集,過時的季度報告和有趣的儀表板。
