0
نام کتاب
RAG from First Principles

🔍 Engineering retrieval-augmented generation systems with Python, LangChain, and LlamaIndex

✍️ Jia Huang

Paperback492 Pages
PublisherPackt
Edition1
LanguageEnglish
Year2026
ISBN9781835888667
719
A6920
انتخاب نوع چاپ:
جلد سخت
1,344,000ت
0
جلد نرم
1,214,000ت
0
طلق پاپکو و فنر
1,234,000ت
0
مجموع:
0تومان
کیفیت متن:اورجینال انتشارات
قطع:B5
رنگ صفحات:رنگی با کادر / تصویر
پشتیبانی در روزهای تعطیل!
ارسال به سراسر کشور

#RAG

#AI

#LangChain

#LlamaIndex

#ColBERT

#Python

توضیحات

🧠 یک راهنمای دقیق و کدمحور برای مهندسی RAG، نوشته یکی از نویسنده‌های پرفروش حوزه AI. از پایه، روی ورود داده، Chunking، Embeddingها، ذخیره‌سازی برداری، Hybrid Retrieval، Reranking و ارزیابی مسلط شو.


ویژگی‌های کلیدی

🧱 سیستم‌های RAG رو لایه‌به‌لایه مهندسی میکنی؛ از Ingestion تا Evaluation

🔍 استراتژی‌های Hybrid Retrieval، Reranking و بهینه‌سازی Index رو مسلط میشی

💬 با یک سبک آموزشی گفت‌وگومحور و کدمحور یاد میگیری؛ سبکی که بیش از ۱۰,۰۰۰ دانشجو ازش استفاده کرده‌اند


📘 توضیح کتاب

⚙️ بیشتر دولوپرها میتونن با LangChain یا LlamaIndex در یک بعدازظهر یک پایپ‌لاین RAG بالا بیارن. اما تعداد خیلی کمتری واقعاً میفهمن چرا Retrieval شکست میخوره یا چطور باید درستش کرد. این کتاب برای کساییه که میخوان عمیق‌تر برن.


🧩 کتاب RAG From First Principles استک Retrieval-Augmented Generation رو لایه‌به‌لایه باز میکنه و توضیح میده سندها چطور وارد و Parse میشن، چرا استراتژی Chunking مستقیماً روی کیفیت پاسخ اثر میذاره، مدل‌های Embedding چطور معنا رو کدگذاری میکنن، داخل یک Vector Database چه اتفاقی میفته، و Sparse Retrieval و Dense Retrieval چطور در یک سیستم Hybrid با هم تعامل دارن. این کتاب نوشته جیا هوانگ، Research Engineer و نویسنده پرفروش AI است و هم عمق پژوهشی داره، هم تجربه پروداکشن در یکی از مهم‌ترین دیسیپلین‌های مهندسی AI.


🧭 ساختار کتاب به شکل یک گفت‌وگوی پیش‌رونده بین یک مهندس باتجربه و دو دانشجو طراحی شده و دقیقاً سؤال‌هایی رو مطرح میکنه که متخصص‌ها در عمل میپرسن. هر فصل روی فصل قبلی ساخته میشه؛ از Data Import و Chunking گرفته تا انتخاب Embedding، طراحی Index، Hybrid Search و پردازش بعد از Retrieval. بعد هم سراغ Response Generation، Evaluation و پارادایم‌های پیشرفته‌ای مثل GraphRAG، Agentic RAG و Modular RAG میره.


🚀 تا پایان کتاب، درک معماری لازم رو داری تا سیستم‌های RAG خودت رو با اعتمادبه‌نفس بهینه‌سازی، دیباگ و گسترش بدی.


🎯 چیزهایی که یاد میگیری

📄 انواع مختلف سند مثل PDFها، جدول‌ها، تصویرها، صفحه‌های وب و داده‌های ساختاریافته رو Parse و Ingest میکنی

✂️ استراتژی Chunking مناسب رو بر اساس نوع محتوا و هدف‌های Retrieval انتخاب میکنی

🧠 مدل‌های Embedding رو برای دامنه کاری خودت انتخاب، مقایسه و Fine-Tune میکنی

🗄️ Indexهای برداری طراحی میکنی و متریک‌های Similarity مناسب رو برای استفاده در پروداکشن انتخاب میکنی

📈 کیفیت نتیجه‌ها رو با روش‌های Reranking بهتر میکنی؛ از جمله RRF، Cross-Encoderها و ColBERT

🧩 نتیجه‌های Retrieval رو با استفاده از مهندسی پرامپت و Self-RAG وارد پایپ‌لاین‌های Generation میکنی


👤 این کتاب برای چه کسانیه؟

👨‍💻 این کتاب برای مهندس‌های AI، متخصص‌های ML و دولوپرهای نرم‌افزاریه که دارن اپلیکیشن‌های مبتنی بر LLM میسازن و میخوان بفهمن Retrieval واقعاً چطور کار میکنه؛ نه اینکه فقط یاد بگیرن چطور یک فریم‌ورک رو صدا بزنن. این کتاب برای خواننده‌هایی ایده‌آله که قبلاً یک پایپ‌لاین پایه RAG ساخته‌اند و حالا دنبال شفافیت معماری و استراتژی‌های بهینه‌سازی هستن.


🏗️ تک‌لیدها و معمارهایی که دارن سیستم‌های AI پروداکشن طراحی میکنن، از نگاه سیستماتیک کتاب به Indexing، Hybrid Search، Reranking و Evaluation ارزش زیادی میگیرن. آشنایی با Python و کانسپت‌های پایه LLM در این کتاب فرض شده.


📖 فهرست مطالب

  1. ورود داده
  2. Chunking متن
  3. Embedding اطلاعات
  4. ذخیره‌سازی برداری
  5. پردازش قبل از Retrieval
  6. بهینه‌سازی Index
  7. پس‌پردازش Retrieval
  8. تولید پاسخ
  9. ارزیابی سیستم
  10. پارادایم‌های پیچیده RAG


👤 درباره نویسنده

👨‍🔬 جیا هوانگ Lead Research Engineer در A*STAR، یعنی Agency for Science, Technology and Research در سنگاپوره؛ جایی که کارش روی NLP، مدل‌های زبانی بزرگ و مهندسی AI کاربردی تمرکز داره. او با بیش از بیست سال تجربه در رهبری پروژه‌های بزرگ‌مقیاس AI و داده در دولت، فایننس، سلامت و eCommerce، یک نگاه خیلی عملی به موضوع‌های فنی و دقیق میاره.

🧠 در سال‌های اخیر، پژوهش‌های او بیشتر روی مدل‌های بزرگ پیش‌آموزش‌دیده در NLP و کاربردهای FinTech متمرکز بوده. او نویسنده شش کتاب فنی پرفروشه؛ از جمله Hands-on AI Agent Development for Large Model Applications که به‌عنوان یکی از بهترین کتاب‌های JD در سال ۲۰۲۴ انتخاب شد، و GPT: How Large Models Are Built که از طرف CSDN به‌عنوان تأثیرگذارترین کتاب IT سال ۲۰۲۳ معرفی شد. دوره آنلاین او درباره مهندسی RAG را بیش از ۱۰,۰۰۰ دانشجو کامل کرده‌اند.


A rigorous, code-first guide to RAG engineering by a bestselling AI author. Master data ingestion, chunking, embeddings, vector storage, hybrid retrieval, reranking, and evaluation from the ground up.


Key Features

  • Engineer RAG systems layer by layer, from ingestion to evaluation
  • Master hybrid retrieval, reranking, and index optimization strategies
  • Learn through a dialogue-driven, code-first teaching style used by 10,000+ of students


Book Description

Most developers can spin up a RAG pipeline in an afternoon using LangChain or LlamaIndex. Far fewer understand why retrieval fails or how to fix it. This book is for those who want to go deeper.

RAG From First Principles dismantles the retrieval-augmented generation stack layer by layer, explaining how documents are ingested and parsed, why chunking strategy directly impacts answer quality, how embedding models encode meaning, what happens inside a vector database, and how sparse and dense retrieval interact in a hybrid system. Written by Jia Huang, a research engineer and bestselling AI author, it brings both research depth and production experience to one of AI's most critical engineering disciplines.


Structured as a progressive dialogue between a seasoned engineer and two students, the book surfaces the questions practitioners actually ask. Each chapter builds on the last, covering topics from data import and chunking to embedding selection, index design, hybrid search, and post-retrieval processing, before moving on to response generation, evaluation, and advanced paradigms including GraphRAG, Agentic RAG, and Modular RAG.


By the end, you'll have the architectural understanding to optimize, debug, and extend your RAG systems with confidence.


What you will learn

  • Parse and ingest diverse document types like PDFs, tables, images, web pages, and structured data
  • Apply the right chunking strategy for your content type and retrieval goals
  • Select, compare, and fine-tune embedding models for your domain
  • Design vector indexes and choose the right similarity metrics for production use
  • Improve result quality with reranking methods including RRF, cross-encoders, and ColBERT
  • Integrate retrieval results into generation pipelines using prompt engineering and Self-RAG


Who this book is for

This book is for AI engineers, ML practitioners, and software developers building LLM-powered applications who want a deeper understanding of how retrieval actually works, not just how to call a framework. It is ideal for readers who have built a basic RAG pipeline and now want architectural clarity, optimization strategies.

Technical leads and architects designing production AI systems will find its systematic treatment of indexing, hybrid search, reranking, and evaluation particularly valuable. Familiarity with Python and foundational LLM concepts is assumed.


Table of Contents

  1. Data Import
  2. Text Chunking
  3. Information Embedding
  4. Vector Storage
  5. Pre-Retrieval Processing
  6. Index Optimization
  7. Retrieval Post-Processing
  8. Response Generation
  9. System Evaluation
  10. Complex RAG Paradigms


About the Author

Jia Huang is a Lead Research Engineer at A*STAR (Agency for Science, Technology and Research), Singapore, where his work focuses on NLP, large language models, and applied AI engineering. With over twenty years of experience leading large-scale AI and data projects across government, finance, healthcare, and e-commerce, he brings an unusually practical lens to technically rigorous subjects. In recent years, his research has primarily focused on NLP pre-trained large models and FinTech applications. He is the author of six bestselling technical books, including Hands-on AI Agent Development for Large Model Applications selected as one of JD Best Books of 2024 and GPT: How Large Models Are Built, named CSDN's Most Influential IT Book of 2023. His online RAG engineering course has been completed by over 10,000 students.

دیدگاه خود را بنویسید
نظرات کاربران (0 دیدگاه)
نظری وجود ندارد.
کتاب های مشابه
Artificial intelligence
1,083
Practical AI for Business Leaders, Product Managers, and Entrepreneurs
661,000 تومان
Artificial intelligence
966
Artificial You
574,000 تومان
AWS
1,052
Natural Language Processing with AWS AI Services
1,375,000 تومان
Artificial intelligence
1,324
Learn OpenAI Whisper
900,000 تومان
Artificial intelligence
998
OCaml Scientific Computing
900,000 تومان
Artificial intelligence
1,153
AI for Games
2,546,000 تومان
Artificial intelligence
664
Generative AI for Web Development
738,000 تومان
Artificial intelligence
1,028
Scary Smart
662,000 تومان
Artificial intelligence
1,041
Conversational AI
805,000 تومان
Artificial intelligence
1,084
Programming Game AI by Example
1,711,000 تومان
قیمت
منصفانه
ارسال به
سراسر کشور
تضمین
کیفیت
پشتیبانی در
روزهای تعطیل
خرید امن
و آسان
آرشیو بزرگ
کتاب‌های تخصصی
هـر روز با بهتــرین و جــدیــدتـرین
کتاب های روز دنیا با ما همراه باشید
آدرس
پشتیبانی
مدیریت
ساعات پاسخگویی
درباره اسکای بوک
دسترسی های سریع
  • راهنمای خرید
  • راهنمای ارسال
  • سوالات متداول
  • قوانین و مقررات
  • وبلاگ
  • درباره ما
چاپ دیجیتال اسکای بوک. 2024-2022 ©