حافظه عاملمحور Hindsight اطلاعات را حفظ و بازیابی می کند
در سالهای اخیر، تولید مبتنی بر بازیابی افزوده یا RAG به رویکرد پیشفرض برای متصل کردن مدلهای زبان بزرگ (LLM) به دانش خارجی تبدیل شد. این الگو به طور سنتی شامل تکهتکه کردن اسناد، جاسازی آنها به صورت برداری (وکتور)، ذخیره در پایگاه داده و بازیابی قطعات مشابه هنگام دریافت پرسش است. این روش برای پاسخهای یکباره به اسناد ثابت عملکرد قابل قبولی دارد. اما زمانی که عوامل هوش مصنوعی (AI agents) نیاز به فعالیت در جلسات متعدد، حفظ زمینه در طول زمان یا تمایز آنچه مشاهده کردهاند از آنچه باور دارند، دارند؛ این معماری دچار مشکل میشود.
چرا RAG دیگر جوابگو نیست؟
مشکل اصلی آنجاست که RAG همه اطلاعات بازیابیشده را به صورت یکنواخت و یکسان در نظر میگیرد. یک حقیقت مشاهده شده شش ماه قبل، همان رفتاری را دریافت میکند که یک نظر شکل گرفته دیروز داشته است. اطلاعات متناقض در کنار ادعاهای اصلی قرار میگیرند، بدون هیچ سازوکاری برای حل و فصل آنها. این سیستم ابزاری برای نشان دادن عدم قطعیت، پیگیری چگونگی تکامل باورها یا درک دلیل رسیدن به یک نتیجه خاص ندارد. به گفته کریس لیتمر، مدیرعامل و یکی از بنیانگذاران Vectorize.io، زیرساختهای موجود RAG در سطحی که مورد انتظار است، عمل نمیکنند و «RAG در بخش مراقبتهای ویژه است و حافظه عامل هوش مصنوعی قرار است آن را به طور کامل از بین ببرد».
زمانی که عامل هوش مصنوعی باید جزئیات را از صدها هزار نشانه (token) که در دهها جلسه پخش شدهاند به یاد بیاورد، این مشکل حادتر میشود. در چنین مواقعی، سیستمهای RAG یا پنجره زمینه را با اطلاعات نامربوط پر میکنند و یا جزئیات بسیار حیاتی را به طور کامل از دست میدهند. نارن راما کریشنان، استاد علوم کامپیوتر در ویرجینیا تک، توضیح میدهد که اگر رویکردی یکسان برای حافظه وجود داشته باشد، یا بیش از حد لازم زمینه حمل میشود یا بسیار کمتر از مقدار مورد نیاز.
آشنایی با Hindsight: ساختار چهارگانه حافظه عامل
گذار از RAG به حافظه عاملمحور Hindsight ، نشاندهنده یک تغییر معماری بنیادی است. به جای اینکه حافظه یک لایه بازیابی خارجی باشد که صرفاً تکههایی از متن را درون دستورات اصلی (prompts) کپی میکند، Hindsight حافظه را به عنوان یک زیرساخت ساختارمند و درجه یک برای استدلال یکپارچه میسازد. این معماری جدید و منبع باز توسط Vectorize.io با همکاری ویرجینیا تک و واشنگتن پست توسعه یافته است.
نوآوری اصلی در هایندسایت، تفکیک دانش به چهار شبکه منطقی است:
- شبکه جهان (The world network): حقایق عینی درباره محیط خارجی را ذخیره میکند.
- شبکه بانک (The bank network): تجربیات و اقدامات خود عامل را که به صورت اول شخص نوشته شدهاند، ثبت میکند.
- شبکه عقیده (The opinion network): قضاوتهای ذهنی و سوبژکتیو را با نمرات اعتماد به نفس نگهداری میکند که با رسیدن شواهد جدید بهروزرسانی میشوند.
- شبکه مشاهده (The observation network): خلاصههای خنثی از ترجیحات درباره موجودیتها را که از حقایق اساسی سنتز شدهاند، در خود جای میدهد.
این تفکیک شبکهها با تمایز ساختاری بین شواهد و استنتاج، مفهوم «شفافیت معرفتی» را هدف قرار میدهد. وقتی یک عامل عقیدهای را شکل میدهد، آن باور به همراه نمره اعتماد به نفس، جدا از حقایقی که از آن پشتیبانی میکنند، ذخیره میشود. با ورود اطلاعات جدید، سیستم میتواند عقاید موجود را تقویت یا تضعیف کند، به جای اینکه همه اطلاعات ذخیرهشده را به یک اندازه قطعی در نظر بگیرد.
اجزای کلیدی Hindsight برای استدلال و بازیابی
این معماری از دو جزء اصلی تشکیل شده است که عملکرد آنها شبیه به نحوه کار حافظه انسان است:
- TEMPR (Temporal Entity Memory Priming Retrieval): این جزء، بازیابی و حفظ حافظه را مدیریت میکند. TEMPR چهار جستجوی موازی را اجرا میکند: شباهت برداری معنایی، تطبیق کلمات کلیدی از طریق BM25، پیمایش نمودار از طریق موجودیتهای مشترک، و فیلتر کردن زمانی برای پرسشهای مقید به زمان. این سیستم با استفاده از ترکیب رتبه متقابل (Reciprocal Rank Fusion) نتایج را ادغام کرده و برای دقت نهایی یک بازرتبهدهنده عصبی را به کار میگیرد.
- CARA (Coherent Adaptive Reasoning Agents): این جزء، بازتاب آگاهانه از ترجیحات را مدیریت میکند. CARA پارامترهای پیکربندیپذیر گرایش (disposition parameters) مانند شک و تردید (skepticism)، تحتاللفظی بودن (literalism)، و همدلی (empathy) را در استدلال عامل ادغام میکند. این قابلیت، مشکل استدلالهای ناسازگار در جلسات مختلف را برطرف میکند؛ زیرا بدون این شرطبندی ترجیحی، عوامل پاسخهایی تولید میکنند که از لحاظ محلی قابل قبول، اما در سطح جهانی ناسازگار هستند.
دقت بالا در مقایسه با استانداردهای صنعت
حافظه عاملمحور Hindsight صرفاً یک پژوهش آکادمیک تئوری نیست؛ بلکه یک فناوری منبع باز است که در معیار مهم LongMemEval مورد ارزیابی قرار گرفت. این آزمون، توانایی عاملها را برای به یاد آوردن اطلاعات، استدلال در طول زمان، و حفظ دیدگاههای ثابت در مکالماتی که تا ۱.۵ میلیون نشانه در چندین جلسه گسترده شدهاند، اندازهگیری میکند.
هایندسایت با دقت خیرهکننده ۹۱.۴٪ در این معیار، بالاترین نمرهای را که تا کنون ثبت شده، کسب کرده است. این معیار برای سنجش قابلیت عاملهای هوش مصنوعی در سناریوهای استقرار دنیای واقعی طراحی شده، زیرا چالش کلیدی سازمانها، شکست عاملها در محیط تولید (Production) با وجود عملکرد مناسب در محیط تست است. نتایج جامع این معیار نشان داد که حافظه ساختارمند بیشترین دستاوردها را در کجا فراهم میکند؛ سوالات چندجلسهای از ۲۱.۱٪ به ۷۹.۷٪ بهبود یافتند، استدلال زمانی از ۳۱.۶٪ به ۷۹.۷٪ جهش کرد، و سوالات بهروزرسانی دانش از ۶۰.۳٪ به ۸۴.۶٪ ارتقا یافت. به گفته لیتمر، این پیشرفتها به این معنی است که عاملهای سازمانها قادر خواهند بود وظایف بیشتری را با دقت و ثبات بالاتری نسبت به قبل انجام دهند.
پیادهسازی سازمانی و آینده RAG
برای سازمانهایی که به استقرار Hindsight میاندیشند، مسیر پیادهسازی ساده است. این سیستم به صورت یک کانتینر داکر (Docker container) اجرا میشود و با استفاده از یک پوششدهنده LLM (LLM wrapper) با هر مدل زبانی کار میکند. لیتمر توضیح میدهد که این سیستم «جایگزین سادهای برای فراخوانیهای API شما است، و شما بلافاصله شروع به ذخیره حافظهها میکنید».
این فناوری به طور خاص سازمانهایی را هدف قرار میدهد که زیرساخت RAG را مستقر کردهاند اما عملکرد مورد نیاز خود را نمیبینند. بسیاری از شرکتها به دنبال راهکارهای قویتری هستند که مشکل ناتوانی در بازیابی اطلاعات صحیح برای تکمیل وظایف را حل کند. لیتمر همچنین تاکید کرده است که Vectorize در حال همکاری با ارائهدهندگان خدمات ابری بزرگ (hyperscalers) است تا این فناوری را در پلتفرمهای ابری آنها ادغام کند و از مدلهای زبان بزرگشان با قابلیتهای حافظه عامل پشتیبانی نماید.
در نهایت، هایندسایت مسیری را فراتر از محدودیتهای استقرارهای فعلی RAG برای سازمانهایی که پیشرو در پذیرش هوش مصنوعی هستند، ارائه میدهد. سازمانهایی که در RAG سرمایهگذاری کردهاند و شاهد عملکرد ناپایدار عاملهای خود هستند، باید ارزیابی کنند که آیا حافظه ساختارمند میتواند نقصهای خاص آنها را برطرف کند یا خیر. این فناوری به ویژه برای برنامههایی مناسب است که در آنها عاملها باید زمینه را در جلسات متعدد حفظ کنند، اطلاعات متناقض را در طول زمان مدیریت کنند یا دلایل استدلال خود را توضیح دهند. همانطور که لیتمر قاطعانه بیان میکند: «RAG مرده است، و من فکر میکنم حافظه عامل هوش مصنوعی قرار است آن را کاملاً از بین ببرد».
سوالات متداول
1. حافظه عاملی هایندسایت» (Hindsight) چیست و چه تفاوتی با RAG دارد؟
Hindsight یک معماری حافظه منبع باز جدید است که حافظه عاملهای هوش مصنوعی را در چهار شبکه منطقی مجزا سازماندهی میکند تا حقایق، تجربیات، خلاصه موجودیتها و باورهای تکاملی را تمییز دهد. برخلاف RAG که تمام اطلاعات بازیابیشده را یکسان میداند و فاقد مکانیسمهایی برای ردیابی عدم قطعیت یا تکامل باورها است، Hindsight حافظه را به عنوان یک زیرساخت ساختارمند برای استدلال یکپارچه میسازد.
2. چرا سیستمهای RAG موجود در حال از کار افتادن هستند؟
سیستمهای RAG، که برای پرسشهای یکباره بر روی اسناد ثابت طراحی شده بودند، نمیتوانند الزامات فزاینده دادهای عاملهای هوش مصنوعی را برآورده کنند. RAG در مدیریت زمینه در مکالمات چندجلسهای و تمایز بین حقایق مشاهده شده و عقاید شکل گرفته شکست میخورد.
3. Hindsight از چه اجزای اصلی برای بهبود استدلال استفاده میکند؟
Hindsight از دو جزء اصلی استفاده میکند: TEMPR، که برای بازیابی حافظه و حفظ آن از طریق چهار جستجوی موازی (شامل شباهت برداری و فیلتر زمانی) استفاده میشود، و CARA، که استدلال سازگار را با ادغام پارامترهای گرایشی مانند شک و تردید و همدلی تضمین میکند تا پاسخها جهانی ثابت باشند.
4. دقت Hindsight در مقایسه با سیستمهای دیگر چقدر است؟
فناوری منبع باز Hindsight با کسب دقت ۹۱.۴٪ در معیار LongMemEval، بالاترین نمره ثبت شده در این آزمون را به دست آورده است. این معیار، توانایی عاملها در استدلال در طول زمان و حفظ دیدگاههای ثابت را در مکالمات طولانی میسنجد.
5. پیادهسازی Hindsight در سازمانها چگونه است؟
پیادهسازی Hindsight برای سازمانها ساده است. این سیستم به عنوان جایگزینی برای فراخوانیهای API موجود RAG عمل کرده و به صورت یک کانتینر داکر واحد اجرا میشود که با هر مدل زبانی از طریق یک پوششدهنده LLM کار میکند. این راهکار به طور ویژه برای شرکتهایی مناسب است که عملکرد ناکافی از زیرساختهای RAG خود مشاهده میکنند.

ثمینه تفقدی هستم علاقه مند به محتوا نویسی، از سال ۲۰۲۴ به تیمی که در زمینه ارز دیجیتال فعالیت داشت پیوستم و از اوایل سال ۲۰۲۵ با علاقه مند شدن به گجت ها و نوآوری هایی که برای اولین بار در جهان اتفاق می افتد، باعث شد تا با تیم جوان و با پشتکار پارس دیجی آشنا بشم از اون تاریخ به بعد درباره بهترین گجت ها تحقیق میکنم تا اطلاعات بهینه ای را در اختیار خوانندگان محترم این سایت قرار دهم
نظرات کاربران