حافظه عامل‌محور Hindsight اطلاعات را حفظ و بازیابی می کند

Q: 1. حافظه عاملی هایندسایت» (Hindsight) چیست و چه تفاوتی با RAG دارد؟

Hindsight یک معماری حافظه منبع باز جدید است که حافظه عاملهای هوش مصنوعی را در چهار شبکه منطقی مجزا سازماندهی میکند تا حقایق، تجربیات، خلاصه موجودیتها و باورهای تکاملی را تمییز دهد. برخلاف RAG که تمام اطلاعات بازیابیشده را یکسان میداند و فاقد مکانیسمهایی برای ردیابی عدم قطعیت یا تکامل باورها است، Hindsight حافظه را به عنوان یک زیرساخت ساختارمند برای استدلال یکپارچه میسازد.

Q: 2. چرا سیستمهای RAG موجود در حال از کار افتادن هستند؟

سیستمهای RAG، که برای پرسشهای یکباره بر روی اسناد ثابت طراحی شده بودند، نمیتوانند الزامات فزاینده دادهای عاملهای هوش مصنوعی را برآورده کنند. RAG در مدیریت زمینه در مکالمات چندجلسهای و تمایز بین حقایق مشاهده شده و عقاید شکل گرفته شکست میخورد.

Q: 3. Hindsight از چه اجزای اصلی برای بهبود استدلال استفاده میکند؟

Hindsight از دو جزء اصلی استفاده میکند: TEMPR، که برای بازیابی حافظه و حفظ آن از طریق چهار جستجوی موازی (شامل شباهت برداری و فیلتر زمانی) استفاده میشود، و CARA، که استدلال سازگار را با ادغام پارامترهای گرایشی مانند شک و تردید و همدلی تضمین میکند تا پاسخها جهانی ثابت باشند.

Q: 5. پیادهسازی Hindsight در سازمانها چگونه است؟

پیادهسازی Hindsight برای سازمانها ساده است. این سیستم به عنوان جایگزینی برای فراخوانیهای API موجود RAG عمل کرده و به صورت یک کانتینر داکر واحد اجرا میشود که با هر مدل زبانی از طریق یک پوششدهنده LLM کار میکند. این راهکار به طور ویژه برای شرکتهایی مناسب است که عملکرد ناکافی از زیرساختهای RAG خود مشاهده میکنند.

در سال‌های اخیر، تولید مبتنی بر بازیابی افزوده یا RAG به رویکرد پیش‌فرض برای متصل کردن مدل‌های زبان بزرگ (LLM) به دانش خارجی تبدیل شد. این الگو به طور سنتی شامل تکه‌تکه کردن اسناد، جاسازی آن‌ها به صورت برداری (وکتور)، ذخیره در پایگاه داده و بازیابی قطعات مشابه هنگام دریافت پرسش است. این روش برای پاسخ‌های یکباره به اسناد ثابت عملکرد قابل قبولی دارد. اما زمانی که عوامل هوش مصنوعی (AI agents) نیاز به فعالیت در جلسات متعدد، حفظ زمینه در طول زمان یا تمایز آنچه مشاهده کرده‌اند از آنچه باور دارند، دارند؛ این معماری دچار مشکل می‌شود.

چرا RAG دیگر جوابگو نیست؟

مشکل اصلی آنجاست که RAG همه اطلاعات بازیابی‌شده را به صورت یکنواخت و یکسان در نظر می‌گیرد. یک حقیقت مشاهده شده شش ماه قبل، همان رفتاری را دریافت می‌کند که یک نظر شکل گرفته دیروز داشته است. اطلاعات متناقض در کنار ادعاهای اصلی قرار می‌گیرند، بدون هیچ سازوکاری برای حل و فصل آن‌ها. این سیستم ابزاری برای نشان دادن عدم قطعیت، پیگیری چگونگی تکامل باورها یا درک دلیل رسیدن به یک نتیجه خاص ندارد. به گفته کریس لیتمر، مدیرعامل و یکی از بنیانگذاران Vectorize.io، زیرساخت‌های موجود RAG در سطحی که مورد انتظار است، عمل نمی‌کنند و «RAG در بخش مراقبت‌های ویژه است و حافظه عامل هوش مصنوعی قرار است آن را به طور کامل از بین ببرد».
زمانی که عامل هوش مصنوعی باید جزئیات را از صدها هزار نشانه (token) که در ده‌ها جلسه پخش شده‌اند به یاد بیاورد، این مشکل حادتر می‌شود. در چنین مواقعی، سیستم‌های RAG یا پنجره زمینه را با اطلاعات نامربوط پر می‌کنند و یا جزئیات بسیار حیاتی را به طور کامل از دست می‌دهند. نارن راما کریشنان، استاد علوم کامپیوتر در ویرجینیا تک، توضیح می‌دهد که اگر رویکردی یکسان برای حافظه وجود داشته باشد، یا بیش از حد لازم زمینه حمل می‌شود یا بسیار کمتر از مقدار مورد نیاز.

آشنایی با Hindsight: ساختار چهارگانه حافظه عامل

گذار از RAG به حافظه عامل‌محور Hindsight ، نشان‌دهنده یک تغییر معماری بنیادی است. به جای اینکه حافظه یک لایه بازیابی خارجی باشد که صرفاً تکه‌هایی از متن را درون دستورات اصلی (prompts) کپی می‌کند، Hindsight حافظه را به عنوان یک زیرساخت ساختارمند و درجه یک برای استدلال یکپارچه می‌سازد. این معماری جدید و منبع باز توسط Vectorize.io با همکاری ویرجینیا تک و واشنگتن پست توسعه یافته است.
نوآوری اصلی در هایندسایت، تفکیک دانش به چهار شبکه منطقی است:

شبکه جهان (The world network): حقایق عینی درباره محیط خارجی را ذخیره می‌کند.
شبکه بانک (The bank network): تجربیات و اقدامات خود عامل را که به صورت اول شخص نوشته شده‌اند، ثبت می‌کند.
شبکه عقیده (The opinion network): قضاوت‌های ذهنی و سوبژکتیو را با نمرات اعتماد به نفس نگهداری می‌کند که با رسیدن شواهد جدید به‌روزرسانی می‌شوند.
شبکه مشاهده (The observation network): خلاصه‌های خنثی از ترجیحات درباره موجودیت‌ها را که از حقایق اساسی سنتز شده‌اند، در خود جای می‌دهد.

این تفکیک شبکه‌ها با تمایز ساختاری بین شواهد و استنتاج، مفهوم «شفافیت معرفتی» را هدف قرار می‌دهد. وقتی یک عامل عقیده‌ای را شکل می‌دهد، آن باور به همراه نمره اعتماد به نفس، جدا از حقایقی که از آن پشتیبانی می‌کنند، ذخیره می‌شود. با ورود اطلاعات جدید، سیستم می‌تواند عقاید موجود را تقویت یا تضعیف کند، به جای اینکه همه اطلاعات ذخیره‌شده را به یک اندازه قطعی در نظر بگیرد.

اجزای کلیدی Hindsight برای استدلال و بازیابی

این معماری از دو جزء اصلی تشکیل شده است که عملکرد آن‌ها شبیه به نحوه کار حافظه انسان است:

TEMPR (Temporal Entity Memory Priming Retrieval): این جزء، بازیابی و حفظ حافظه را مدیریت می‌کند. TEMPR چهار جستجوی موازی را اجرا می‌کند: شباهت برداری معنایی، تطبیق کلمات کلیدی از طریق BM25، پیمایش نمودار از طریق موجودیت‌های مشترک، و فیلتر کردن زمانی برای پرسش‌های مقید به زمان. این سیستم با استفاده از ترکیب رتبه متقابل (Reciprocal Rank Fusion) نتایج را ادغام کرده و برای دقت نهایی یک بازرتبه‌دهنده عصبی را به کار می‌گیرد.
CARA (Coherent Adaptive Reasoning Agents): این جزء، بازتاب آگاهانه از ترجیحات را مدیریت می‌کند. CARA پارامترهای پیکربندی‌پذیر گرایش (disposition parameters) مانند شک و تردید (skepticism)، تحت‌اللفظی بودن (literalism)، و همدلی (empathy) را در استدلال عامل ادغام می‌کند. این قابلیت، مشکل استدلال‌های ناسازگار در جلسات مختلف را برطرف می‌کند؛ زیرا بدون این شرط‌بندی ترجیحی، عوامل پاسخ‌هایی تولید می‌کنند که از لحاظ محلی قابل قبول، اما در سطح جهانی ناسازگار هستند.

دقت بالا در مقایسه با استانداردهای صنعت

حافظه عامل‌محور Hindsight صرفاً یک پژوهش آکادمیک تئوری نیست؛ بلکه یک فناوری منبع باز است که در معیار مهم LongMemEval مورد ارزیابی قرار گرفت. این آزمون، توانایی عامل‌ها را برای به یاد آوردن اطلاعات، استدلال در طول زمان، و حفظ دیدگاه‌های ثابت در مکالماتی که تا ۱.۵ میلیون نشانه در چندین جلسه گسترده شده‌اند، اندازه‌گیری می‌کند.
هایندسایت با دقت خیره‌کننده ۹۱.۴٪ در این معیار، بالاترین نمره‌ای را که تا کنون ثبت شده، کسب کرده است. این معیار برای سنجش قابلیت عامل‌های هوش مصنوعی در سناریوهای استقرار دنیای واقعی طراحی شده، زیرا چالش کلیدی سازمان‌ها، شکست عامل‌ها در محیط تولید (Production) با وجود عملکرد مناسب در محیط تست است. نتایج جامع این معیار نشان داد که حافظه ساختارمند بیشترین دستاوردها را در کجا فراهم می‌کند؛ سوالات چندجلسه‌ای از ۲۱.۱٪ به ۷۹.۷٪ بهبود یافتند، استدلال زمانی از ۳۱.۶٪ به ۷۹.۷٪ جهش کرد، و سوالات به‌روزرسانی دانش از ۶۰.۳٪ به ۸۴.۶٪ ارتقا یافت. به گفته لیتمر، این پیشرفت‌ها به این معنی است که عامل‌های سازمان‌ها قادر خواهند بود وظایف بیشتری را با دقت و ثبات بالاتری نسبت به قبل انجام دهند.

پیاده‌سازی سازمانی و آینده RAG

برای سازمان‌هایی که به استقرار Hindsight می‌اندیشند، مسیر پیاده‌سازی ساده است. این سیستم به صورت یک کانتینر داکر (Docker container) اجرا می‌شود و با استفاده از یک پوشش‌دهنده LLM (LLM wrapper) با هر مدل زبانی کار می‌کند. لیتمر توضیح می‌دهد که این سیستم «جایگزین ساده‌ای برای فراخوانی‌های API شما است، و شما بلافاصله شروع به ذخیره حافظه‌ها می‌کنید».
این فناوری به طور خاص سازمان‌هایی را هدف قرار می‌دهد که زیرساخت RAG را مستقر کرده‌اند اما عملکرد مورد نیاز خود را نمی‌بینند. بسیاری از شرکت‌ها به دنبال راهکارهای قوی‌تری هستند که مشکل ناتوانی در بازیابی اطلاعات صحیح برای تکمیل وظایف را حل کند. لیتمر همچنین تاکید کرده است که Vectorize در حال همکاری با ارائه‌دهندگان خدمات ابری بزرگ (hyperscalers) است تا این فناوری را در پلتفرم‌های ابری آن‌ها ادغام کند و از مدل‌های زبان بزرگشان با قابلیت‌های حافظه عامل پشتیبانی نماید.
در نهایت، هایندسایت مسیری را فراتر از محدودیت‌های استقرارهای فعلی RAG برای سازمان‌هایی که پیشرو در پذیرش هوش مصنوعی هستند، ارائه می‌دهد. سازمان‌هایی که در RAG سرمایه‌گذاری کرده‌اند و شاهد عملکرد ناپایدار عامل‌های خود هستند، باید ارزیابی کنند که آیا حافظه ساختارمند می‌تواند نقص‌های خاص آن‌ها را برطرف کند یا خیر. این فناوری به ویژه برای برنامه‌هایی مناسب است که در آن‌ها عامل‌ها باید زمینه را در جلسات متعدد حفظ کنند، اطلاعات متناقض را در طول زمان مدیریت کنند یا دلایل استدلال خود را توضیح دهند. همانطور که لیتمر قاطعانه بیان می‌کند: «RAG مرده است، و من فکر می‌کنم حافظه عامل هوش مصنوعی قرار است آن را کاملاً از بین ببرد».

سوالات متداول

1. حافظه عاملی هایندسایت» (Hindsight) چیست و چه تفاوتی با RAG دارد؟

Hindsight یک معماری حافظه منبع باز جدید است که حافظه عامل‌های هوش مصنوعی را در چهار شبکه منطقی مجزا سازماندهی می‌کند تا حقایق، تجربیات، خلاصه موجودیت‌ها و باورهای تکاملی را تمییز دهد. برخلاف RAG که تمام اطلاعات بازیابی‌شده را یکسان می‌داند و فاقد مکانیسم‌هایی برای ردیابی عدم قطعیت یا تکامل باورها است، Hindsight حافظه را به عنوان یک زیرساخت ساختارمند برای استدلال یکپارچه می‌سازد.

2. چرا سیستم‌های RAG موجود در حال از کار افتادن هستند؟

سیستم‌های RAG، که برای پرسش‌های یک‌باره بر روی اسناد ثابت طراحی شده بودند، نمی‌توانند الزامات فزاینده داده‌ای عامل‌های هوش مصنوعی را برآورده کنند. RAG در مدیریت زمینه در مکالمات چندجلسه‌ای و تمایز بین حقایق مشاهده شده و عقاید شکل گرفته شکست می‌خورد.

3. Hindsight از چه اجزای اصلی برای بهبود استدلال استفاده می‌کند؟

Hindsight از دو جزء اصلی استفاده می‌کند: TEMPR، که برای بازیابی حافظه و حفظ آن از طریق چهار جستجوی موازی (شامل شباهت برداری و فیلتر زمانی) استفاده می‌شود، و CARA، که استدلال سازگار را با ادغام پارامترهای گرایشی مانند شک و تردید و همدلی تضمین می‌کند تا پاسخ‌ها جهانی ثابت باشند.

4. دقت Hindsight در مقایسه با سیستم‌های دیگر چقدر است؟

فناوری منبع باز Hindsight با کسب دقت ۹۱.۴٪ در معیار LongMemEval، بالاترین نمره ثبت شده در این آزمون را به دست آورده است. این معیار، توانایی عامل‌ها در استدلال در طول زمان و حفظ دیدگاه‌های ثابت را در مکالمات طولانی می‌سنجد.

5. پیاده‌سازی Hindsight در سازمان‌ها چگونه است؟

پیاده‌سازی Hindsight برای سازمان‌ها ساده است. این سیستم به عنوان جایگزینی برای فراخوانی‌های API موجود RAG عمل کرده و به صورت یک کانتینر داکر واحد اجرا می‌شود که با هر مدل زبانی از طریق یک پوشش‌دهنده LLM کار می‌کند. این راهکار به طور ویژه برای شرکت‌هایی مناسب است که عملکرد ناکافی از زیرساخت‌های RAG خود مشاهده می‌کنند.

ثمینه تفقدی

ثمینه تفقدی هستم علاقه مند به محتوا نویسی، از سال ۲۰۲۴ به تیمی که در زمینه ارز دیجیتال فعالیت داشت پیوستم و از اوایل سال ۲۰۲۵ با علاقه مند شدن به گجت ها و نوآوری هایی که برای اولین بار در جهان اتفاق می افتد، باعث شد تا با تیم جوان و با پشتکار پارس دیجی آشنا بشم از اون تاریخ به بعد درباره بهترین گجت ها تحقیق میکنم تا اطلاعات بهینه ای را در اختیار خوانندگان محترم این سایت قرار دهم