Applications Beyond NLP
Nicole Koenigstein

#Transformers
#AI
#ML
#LLM
#Data_scientists
🚀 پتانسیل عظیم تکنولوژی هوش مصنوعی در حوزههایی مثل صدا، ویدیو و تحلیل دادههای پیچیده هنوز بهطور کامل استخراج نشده است. در واقع، خیلی از متخصصهای امروزی به خاطر نبود راهنمای درست و نمونههای پیادهسازی کاربردی، برای بهکارگیری نوآوریهای هوش مصنوعی در این دامنههای متنوع با چالش روبرو هستند.
✨ این راهنمای جامع که دقیقاً برای مهندسین ML سطح متوسط تا پیشرفته، دانشمندان داده و پژوهشگران طراحی شده، این خلاء رو پر میکنه. نویسنده کتاب، نیکول کونیگاشتاین، شما رو از بین کاربردهای تطبیقپذیر مدلهای ترنسفورمر عبور میده و علاوه بر عمیقتر کردن درک تئوری، روی استراتژیهای عملی برای پروژههای دنیای واقعی تمرکز میکنه. این کتاب شما رو به یک «نظریه وحدتبخش بزرگ» برای ترنسفورمرها مجهز میکنه؛ یعنی بینشهای بنیادی که باعث میشه فارغ از اینکه مدلهای SOTA چطور تغییر میکنن، شما همیشه در لبه تکنولوژی باقی بمونید.
🔹 بهکارگیری ترنسفورمرها در حوزههای غیرمتنی مثل تولید تصویر، ویدیو و موسیقی
🔹 مدلهای استدلال (Reasoning)، ایجنتهای کدنویسی و معماریهای چندعامله (Multi-agent)
🔹 استراتژیهای بهینهسازی در زمان آموزش (Training-time) و زمان تست (Test-time)
🔹 استقرار در محیط عملیاتی، مهندسی Runtime و کارایی سختافزاری
🌟 «بیشتر کتابهای ترنسفورمر در حد زبان متوقف میشن. اما نیکول کونیگاشتاین ادامه میده—از بینایی ماشین، صدا، ویدیو و سریهای زمانی گرفته تا یادگیری تقویتی (RL)—و کاری میکنه که معماری مشترک اونها به جای اینکه اتفاقی به نظر برسه، اجتنابناپذیر جلوه کنه. نکاتی که درباره KV Caching و سبکسنگین کردنهای استقرار در تولید گفته شده، واقعاً حاصل تجربههای دشوار و ارزشمندیه.»
— مایک ارلیسون، مدیر هوش مصنوعی در DriveNets
🌟 «تمرکز روی استدلال، همترازی (Alignment) و بهینهسازی در سطح سیستم، دقیقاً همون جایی رو هدف قرار داده که موج بعدی قابلیتهای هوش مصنوعی به سمتش میره. این کتاب به خاطر کاربردی و قابلفهم کردن این مباحث، واقعاً متمایزه.»
— آلما توماس، معمار داده سازمانی و مهندس ارشد داده در Americo
۱. از اصول اولیه تا جدیدترین ترنسفورمرهای SOTA
۲. ترنسفورمرها برای سریهای زمانی
۳. ترنسفورمرها برای وظایف بینایی (Vision)
۴. ترنسفورمرها برای تولید تصویر
۵. ترنسفورمرها برای تولید ویدیو
۶. از صدا تا توکن و برعکس: ترنسفورمرها در حوزه صوتی
۷. ترنسفورمرهای یادگیری تقویتی
۸. ورود به عصر تجربه: ترنسفورمرها برای برنامهریزی، استدلال و کدنویسی
۹. از اسکریپتها تا تفکر: ایجنتهای هوش مصنوعی برای وظایف پیچیده
۱۰. هوشمندتر، بهتر، سریعتر، قویتر: بهینهسازی LLMها و ایجنتهای هوش مصنوعی
۱۱. استقرار مدلهای ترنسفورمر
۱۲. مسیر بعدی: از مدلها به سمت سیستمهای هوشمند
👩💻 نیکول کونیگاشتاین پژوهشگر و متخصص هوش مصنوعی در زمینه سیستمهای عاملمحور (Agentic Systems) هست که در حوزههای پژوهش، مشاوره، تدریس و پیادهسازی مستقیم سیستمها برای ساخت هوش مصنوعی قابلاطمینان و آماده تولید فعالیت میکنه.
📚 اون نویسنده چندین کتاب از جمله «AI Agents: The Definitive Guide» (انتشارات اورایلی، ۲۰۲۶) هست.
🇪🇺 همچنین نیکول به عنوان ارزیاب خارجی برای یکی از چالشهای بزرگ هوش مصنوعی در کمیسیون اروپا فعالیت داشته.
The vast potential of AI technology remains untapped in areas like audio, video, and complex data analysis. In fact, many of today’s professionals find it challenging to apply AI innovations across these diverse domains due to a lack of guidance and practical implementations.
This comprehensive guide, tailored especially for intermediate to advanced ML engineers, data scientists, and researchers, fills the gap. Author Nicole Koenigstein guides readers through the versatile applications of transformer models, not only deepening theoretical understanding but also emphasizing actionable strategies for real-world applications. The book equips you with a grand unified theory for transformers— foundational insights that keep you on the cutting edge regardless of state-of-the-art model evolutions.
You’ll discover how to apply:
• Transformers in nontext domains like image, video, and music generation
• Reasoning models, coding agents, and multi-agent architectures
• Training-time and test-time optimization strategies
• Production deployment, runtime engineering, and hardware efficiency
“Most transformer books stop at language. Nicole Koenigstein keeps going—through vision, audio, video, time series, and RL—and makes the shared architecture feel inevitable rather than incidental. The production insights on KV caching and deployment trade-offs are especially hard-won.”
—Mike Erlihson Head of AI, DriveNets
“The focus on reasoning, alignment, and system-level optimization captures exactly where the next wave of AI capabilities is heading. This book stands out for making these topics both accessible and highly actionable.”
—Alma Thomas, MBA - Enterprise data architect and principal data engineer, Americo Financial Life and Annuity Insurance Company
Table of Contents
Chapter 1. From First Principles to State-of-the-Art Transformers
Chapter 2. Transformers for Time Series
Chapter 3. Transformers for Vision Tasks
Chapter 4. Transformers for Image Generation
Chapter 5. Transformers for Video Generation
Chapter 6. From Sound to Token and Back: Transformers in the Audio Domain
Chapter 7. Reinforcement Learning Transformers
Chapter 8. Embracing the Era of Experience: Transformers for Planning, Reasoning, and Coding
Chapter 9. From Scripts to Thinking: AI Agents for Complex Tasks
Chapter 10. Smarter, Better, Faster, Stronger: Optimizing LLMs and AI Agents
Chapter 11. Deploying Transformer Models
Chapter 12. Where to Go Next: From Models to Intelligent Systems
About the Author
Nicole Koenigstein is an AI researcher and practitioner in agentic systems, working across research, consulting, teaching, and direct system implementation to build reliable, production-ready AI systems. She is the author of several books, including AI Agents: The Definitive Guide (O’Reilly, 2026), and has served as an external evaluator for a European Commission AI Grand Challenge.







