Acquire the skills to design and build AWS-based data transformation pipelines like a pro
Gareth Eagar

#AWS
#Data_Engineering
#SQL
#Amazon
🚀 به دنبال این هستی که بازی Data Transformation رو روی AWS متحول کنی؟ جای درستی اومدی! از مفاهیم پایه تا ساخت عملی data engineering pipelineها، این راهنمای تخصصی که توسط یک فرد خبره نوشته شده، همه چیز رو برات پوشش میده.
🧩 ویژگیهای کلیدی
✨ با ابزارهای قدرتمند AWS برای ingest کردن، transform کردن و مصرف دادهها و همچنین orchestrate کردن pipelineها آشنا میشی.
✨ یک فصل کاملاً بهروز شده برای Data Governance که تو رو با آخرین استانداردها همگام نگه میداره.
✨ ساخت پلتفرمهای داده مدرن با یک بخش جدید درباره transactional data lakeها و data mesh.
📚 توضیحات کتاب
📖 این کتاب که توسط یک Senior Data Architect با ۲۵ سال تجربه نوشته شده، هدفش اینه که تو رو در استفاده حرفهای از اکوسیستم AWS برای Data Engineering به سطح تسلط برسونه. این نسخه بازبینیشده در تمام فصلها بهروزرسانی شده تا جدیدترین سرویسها و قابلیتهای AWS رو پوشش بده، نگاه تازهای به Data Governance داره و یک بخش کاملاً جدید درباره پلتفرمهای داده مدرن اضافه کرده که شامل رویکرد Data Mesh، فرمتهای جدول باز مثل Apache Iceberg و استفاده از DataOps برای اتوماسیون و observability میشه.
📖 در ابتدا با مفاهیم کلیدی و ابزارهای ضروری AWS در جعبهابزار یک Data Engineer آشنا میشی و با رویکردهای مدرن مدیریت داده کار میکنی. بعدش طراحی data pipeline رو یاد میگیری، منابع داده خام رو بررسی میکنی، دادهها رو transform میکنی و میبینی این دادههای پردازششده چطور توسط مصرفکنندههای مختلف استفاده میشن.
📖 همچنین یاد میگیری چطور Data Governance قوی داشته باشی و دادهها رو در data martها و data warehouseها بارگذاری کنی و جایگاه data lakehouse رو در این معماری درک کنی. بعدش با ابزارهای AWS برای تحلیل داده آشنا میشی، از جمله ابزارهای SQL ad-hoc و ساخت visualization.
📖 در ادامه وارد دنیای Machine Learning و AI میشی و یاد میگیری چطور ازشون برای استخراج insight از دادهها استفاده کنی. در فصلهای پایانی هم با transactional data lake، data mesh و طراحی یک پلتفرم داده مدرن روی AWS آشنا میشی.
📖 در نهایت این کتاب بهت کمک میکنه تا بتونی مثل یک حرفهای، تسکهای Data Engineering رو اجرا کنی و روی AWS pipelineهای داده بسازی.
🎯 آنچه یاد میگیری
🧠 استریم دادهها رو بهصورت یکپارچه با Amazon Kinesis Data Firehose ingest میکنی.
🧠 با AWS Glue Studio دیتاستها رو optimize، denormalize و join میکنی.
🧠 رویدادهای Amazon S3 رو برای اجرای transformation با AWS Lambda استفاده میکنی.
🧠 دادهها رو داخل Amazon Redshift load میکنی و queryها رو اجرا میکنی.
🧠 دادهها رو با Amazon QuickSight تحلیل و visualise میکنی.
🧠 تحلیل احساسات (sentiment) رو با Amazon Comprehend استخراج میکنی.
🧠 Transactional data lakeها رو با Apache Iceberg و Amazon Athena میسازی.
🧠 با رویکرد Data Mesh در AWS آشنا میشی و پیادهسازی اون رو یاد میگیری.
👥 این کتاب برای چه کسانی مناسب است
🎯 این کتاب برای Data Engineerها، Data Analystها و Data Architectهایی طراحی شده که تازه وارد AWS شدن و میخوان مهارتهاشون رو در cloud توسعه بدن.
🎯 همچنین برای هر کسی که تازه وارد حوزه Data Engineering شده و میخواد مفاهیم پایهای رو همراه با تجربه عملی روی سرویسهای AWS یاد بگیره مناسبه.
🎯 داشتن درک اولیه از مفاهیم Big Data و آشنایی با Python کمک میکنه بهتر از کتاب استفاده کنی، ولی پیشنیاز سختگیرانهای نیست.
🎯 آشنایی با AWS Console و سرویسهای پایه هم بهت کمک میکنه راحتتر مسیر یادگیری رو دنبال کنی.
📑 فهرست مطالب
📌 بخش ۱: مفاهیم و روندهای مهندسی داده در AWS
1 مقدمهای بر مهندسی داده
2 معماریهای مدیریت داده برای تحلیل
3 جعبهابزار مهندس داده در AWS
4 حاکمیت داده، امنیت و کاتالوگسازی
📌 بخش ۲: طراحی و پیادهسازی Data Lake و Data Lakehouse
5 طراحی معماری پایپلاینهای مهندسی داده
6 ورود دادههای دستهای و استریمینگ
7 تبدیل دادهها برای بهینهسازی تحلیل
8 شناسایی و توانمندسازی مصرفکنندگان داده
9 بررسی عمیقتر Data Martها و Amazon Redshift
10 ارکستریشن (Orchestration) پایپلاین داده
📌 بخش ۳: تصویر بزرگتر؛ تحلیل داده، بصریسازی و یادگیری ماشین
11 کوئریهای موردی با Amazon Athena
12 بصریسازی داده با Amazon QuickSight
13 توانمندسازی هوش مصنوعی و یادگیری ماشین
14 ساخت Transactional Data Lake
15 پیادهسازی استراتژی Data Mesh
16 ساخت یک پلتفرم داده مدرن روی AWS
17 جمعبندی و پایان بخش اول مسیر یادگیری
👨💻 درباره نویسنده
🧑🏫 گرت ایگر بیش از ۲۵ سال تجربه در صنعت IT داره، مسیر حرفهای خودش رو در آفریقای جنوبی شروع کرده، مدتی در بریتانیا کار کرده و الان در آمریکا مستقره.
🧑🏫 او از سال ۲۰۱۷ در AWS مشغول به کاره و تجربه گستردهای در سرویسهای مختلف AWS داره، با تمرکز عمیق روی ساخت پلتفرمهای داده روی AWS.
🧑🏫 در حال حاضر بهعنوان Solutions Architect فعالیت میکنه و قبلاً در بخش AWS Professional Services هم کار کرده و در طراحی و پیادهسازی پلتفرمهای داده برای مشتریان جهانی نقش داشته.
🧑🏫 او بهطور مرتب درباره موضوعات مرتبط با داده سخنرانی میکنه.
Looking to revolutionize your data transformation game with AWS? Look no further! From strong foundations to hands-on building of data engineering pipelines, our expert-led manual has got you covered.
This book, authored by a seasoned Senior Data Architect with 25 years of experience, aims to help you achieve proficiency in using the AWS ecosystem for data engineering. This revised edition provides updates in every chapter to cover the latest AWS services and features, takes a refreshed look at data governance, and includes a brand-new section on building modern data platforms which covers; implementing a data mesh approach, open-table formats (such as Apache Iceberg), and using DataOps for automation and observability.
You'll begin by reviewing the key concepts and essential AWS tools in a data engineer's toolkit and getting acquainted with modern data management approaches. You'll then architect a data pipeline, review raw data sources, transform the data, and learn how that transformed data is used by various data consumers. You’ll learn how to ensure strong data governance, and about populating data marts and data warehouses along with how a data lakehouse fits into the picture. After that, you'll be introduced to AWS tools for analyzing data, including those for ad-hoc SQL queries and creating visualizations. Then, you'll explore how the power of machine learning and artificial intelligence can be used to draw new insights from data. In the final chapters, you'll discover transactional data lakes, data meshes, and how to build a cutting-edge data platform on AWS.
By the end of this AWS book, you'll be able to execute data engineering tasks and implement a data pipeline on AWS like a pro!
This book is for data engineers, data analysts, and data architects who are new to AWS and looking to extend their skills to the AWS cloud. Anyone new to data engineering who wants to learn about the foundational concepts, while gaining practical experience with common data engineering services on AWS, will also find this book useful. A basic understanding of big data-related topics and Python coding will help you get the most out of this book, but it’s not a prerequisite. Familiarity with the AWS console and core services will also help you follow along.
Section 1: AWS Data Engineering Concepts and Trends
Chapter 1: An Introduction to Data Engineering
Chapter 2: Data Management Architectures for Analytics
Chapter 3: The AWS Data Engineer’s Toolkit
Chapter 4: Data Governance, Security, and Cataloging
Section 2: Architecting and Implementing Data Lakes and Data Lake Houses
Chapter 5: Architecting Data Engineering Pipelines
Chapter 6: Ingesting Batch and Streaming Data
Chapter 7: Transforming Data to Optimize for Analytics
Chapter 8: Identifying and Enabling Data Consumers
Chapter 9: A Deeper Dive into Data Marts and Amazon Redshift
Chapter 10: Orchestrating the Data Pipeline
Section 3: The Bigger Picture: Data Analytics, Data Visualization, and Machine Learning
Chapter 11: Ad Hoc Queries with Amazon Athena
Chapter 12: Visualizing Data with Amazon QuickSight
Chapter 13: Enabling Artificial Intelligence and Machine Learning
Chapter 14: Building Transactional Data Lakes
Chapter 15: Implementing a Data Mesh Strategy
Chapter 16: Building a Modern Data Platform on AWS
Chapter 17: Wrapping Up the First Part of Your Learning Journey
Gareth Eagar has over 25 years of experience in the IT industry, starting in South Africa, working in the United Kingdom for a while, and now based in the USA.Having worked at AWS since 2017, Gareth has broad experience with a variety of AWS services, and deep expertise around building data platforms on AWS. While Gareth currently works as a Solutions Architect, he has also worked in AWS Professional Services, helping architect and implement data platforms for global customers.Gareth frequently speaks on data related topics.









