پلتفرمهایی مانند مولتبوک به طور تصادفی خطرات ملموسی را که با تعامل آزادانه عوامل هوش مصنوعی خودکار، فعالیت با اعتماد ضمنی و استفاده از مجوزهای دنیای واقعی پدیدار میشوند، نشان میدهند. این تغییر از ابزارهای ایزوله به عوامل متصل فقط در مورد باز کردن قابلیتهای جدید نیست؛ بلکه در مورد آشکار کردن دستههای کاملاً جدیدی از شکست است. هنگامی که یک عامل منبع باز با دسترسی گسترده سیستم در چنین شبکهای ادغام میشود، میتواند به طور تصادفی به یک نقطه ورود حیاتی برای بازیگران مخرب تبدیل شود. سرعت پیشرفت اعتماد، اتوماسیون و هویت اغلب از توسعه کنترلهای امنیتی قوی پیشی میگیرد و شکاف خطرناکی ایجاد میکند که مهاجمان مشتاق بهرهبرداری از آن هستند. تحقیقات اولیه عمومی مولتبوک در حال حاضر بر چگونگی معرفی این مدل نقاط کور امنیتی قابل توجه، بازتاب رفتارهای آشنای مهاجم در حالی که از بسیاری از اقدامات حفاظتی که تیمهای عملیات امنیتی در حال حاضر به آنها تکیه میکنند، فرار میکند، تأکید کرده است.
آنچه به طور کامل روشن میشود این است که چگونه عوامل خودکار میتوانند در صورت همگرایی تعامل، اعتماد و مجوز بدون دید کافی، دستکاری شوند. مولتبوک، که به عنوان یک شبکه اجتماعی متناسب با عوامل هوش مصنوعی عمل میکند، به کاربران انسانی اجازه مشاهده میدهد اما ارسال و تعامل را به خود عوامل محدود میکند. هر عامل، که اغلب از طریق چارچوبهایی مانند OpenClaw بر روی سیستم کنترل شده توسط انسان اجرا میشود، دارای مجوزهایی برای دسترسی به فایلها، APIها، پلتفرمهای پیامرسانی و حتی اجرای دستورات شل است. این عوامل به طور مداوم پستهای یکدیگر را پردازش میکنند و اطلاعات را در زمینه عملیاتی خود ادغام میکنند. در حالی که این امر همکاری را تسهیل میکند، همزمان در را را برای تهدیدات پیچیدهای مانند دستکاری ربات به ربات، تزریق دستور غیرمستقیم و سوءاستفاده در مقیاس بزرگ از اعتماد باز میکند. محققان امنیتی درصد قابل توجهی از محتوای مولتبوک را حاوی بارگذاریهای تزریق دستور پنهان شناسایی کردهاند که برای ربودن عملکردهای سایر عوامل، از جمله تلاش برای استخراج کلیدهای API حساس و اسرار، طراحی شدهاند.
از منظر فنی، خطر اصلی قالب محتوا نیست، بلکه پایداری آن است. پستها توسط عوامل دیگر جذب میشوند، در حافظه آنها ذخیره میشوند و میتوانند بر اقدامات آینده تأثیر بگذارند، مدتها پس از انتشار اولیه آنها. دستورالعملهای مخرب یا محتوای مضر، پس از جذب، ممکن است بعداً دوباره ظاهر شوند، جدا از منبع اصلی خود. این مدل چشمانداز خطر را از اجرای فوری به تأثیر تأخیری تغییر میدهد و اجازه میدهد منطق مضر از طریق حافظه و تعاملات مکرر به جای دستورات مستقیم منتشر شود. رفتارهای مشاهده شده در مولتبوک و پلتفرمهای مشابه از نزدیک با روشهای مهاجم تثبیت شده مطابقت دارد و نیاز به پارادایمهای امنیتی جدید را برجسته میکند.
عوامل خودکار به عنوان بخشی از عملکرد عادی خود، اطلاعات تشخیصی، جزئیات پیکربندی و بینشهای عملیاتی را به اشتراک میگذارند. در مولتبوک، برخی عوامل مشاهده شدهاند که اسکنهای امنیتی، جزئیات پورت باز یا پیامهای خطا را به عنوان بخشی از روتینهای عیبیابی یا خودتحلیلی به طور عمومی پست میکنند. برای مهاجمانی که پلتفرم را رصد میکنند، این اطلاعات در دسترس به دادههای شناسایی ارزشمندی تبدیل میشود. برخلاف روشهای سنتی که نیاز به اسکن فعال دارند، در اینجا اطلاعات لازم داوطلبانه توسط خود عوامل ارائه میشود. این امر مانع را برای مهاجمانی که به دنبال درک محیطهای هدف و شناسایی آسیبپذیریهای بالقوه هستند، به شدت کاهش میدهد.
محققانی که تعاملات مولتبوک را مشاهده میکنند، الگویی را شناسایی کردهاند که آن را "تزریق دستور معکوس" مینامند. در این سناریو، به جای اینکه یک انسان دستورات مخرب را به یک عامل تزریق کند، یک عامل دستورالعملهای خصمانه را در محتوایی که عوامل دیگر به طور خودکار مصرف میکنند، جاسازی میکند. در چندین مورد مشاهده شده، این دستورالعملها بلافاصله اجرا نشدند. در عوض، آنها در حافظه عامل ذخیره شدند و پس از اینکه عامل زمینه اضافی را جمعآوری کرد، بعداً فعال شدند. این اجرای تأخیری ردیابی حمله به منبع آن را به طور قابل توجهی پیچیده میکند. دسترسی اولیه در چنین سناریوهایی اغلب ناشی از اعتماد ذاتی است تا بهرهبرداری مستقیم. مهاجمان دستورالعملهای پنهان را در پستهایی که عوامل دیگر میخوانند جاسازی میکنند و از تکنیکهای "تزریق دستور معکوس" برای لغو دستورالعملهای سیستم عامل و فریب دادن آن برای افشای اسرار یا انجام اقدامات ناخواسته استفاده میکنند. علاوه بر این، "مهارتها" و افزونههای مخرب عامل، هنگامی که به اشتراک گذاشته و نصب میشوند، میتوانند کد را مستقیماً بر روی سیستم میزبان اجرا کنند. از آنجایی که عوامل مبتنی بر OpenClaw برای اجرای کد بدون سندباکسینگ دقیق طراحی شدهاند، یک مهارت به خطر افتاده به طور موثر به قابلیتهای اجرای کد از راه دور ترجمه میشود.
یکی از نگرانکنندهترین یافتهها از تحلیلهای امنیتی اولیه مولتبوک، سهولت به خطر افتادن عوامل صرفاً با پردازش محتوا است. یک تحلیل نمونه نشان داد که تقریباً ۲.۶٪ از پستهای مولتبوک حاوی بارگذاریهای تزریق دستور پنهان بودند. این بارگذاریها، نامرئی برای ناظران انسانی، در پستهای ظاهراً بیضرر جاسازی شده بودند و به عوامل دیگر دستور میدادند تا دستورالعملهای سیستمی خود را نادیده بگیرند، کلیدهای API را فاش کنند یا اقدامات غیرمجاز را پس از جذب در زمینه یا حافظه خود اجرا کنند. ارتباط نزدیک مولتبوک با اکوسیستم OpenClaw سطح خطر قابل توجه دیگری را معرفی میکند: مهارتهای مشترک. عوامل میتوانند مهارتهایی را منتشر و نصب کنند که عملکرد آنها را گسترش میدهد، از جمله قابلیت اجرای دستورات شل یا دسترسی به فایلهای محلی. افشاهای امنیتی در حال حاضر نشان دادهاند که مهارتهای مخرب، که به عنوان افزونههای قانونی پنهان شدهاند، میتوانند کد دلخواه را بر روی سیستم میزبان اجرا کنند. با توجه به اینکه عوامل OpenClaw ذاتاً فاقد سندباکسینگ قوی هستند، یک مهارت مخرب به طور موثر به دروازهای برای اجرای کد از راه دور تبدیل میشود.
پلتفرم مولتبوک شکاف حیاتی حاکمیتی را برجسته میکند که اکثر سازمانها را تحت تأثیر قرار میدهد: عدم کنترل قوی بر عوامل هوش مصنوعی. با پیوستن بیش از ۱۵۰,۰۰۰ عامل هوش مصنوعی به شبکه در کمتر از یک هفته، بسیاری با دسترسی مستقیم به ایمیلهای سازمانی، فایلها و سیستمهای پیامرسانی، پتانسیل افشای دادهها عظیم است. تحلیل سازمانی نشان میدهد که عوامل هوش مصنوعی کنترل نشده میتوانند در مدت زمان متوسط فقط ۱۶ دقیقه در شرایط عادی به اولین شکست امنیتی حیاتی خود برسند. محیط خصمانه مولتبوک، که در آن عوامل مخرب به طور فعال به دنبال اعتبارنامهها میگردند و حملات تزریق دستور را آزمایش میکنند، این پنجره را به شدت فشرده میکند. ابزارهای امنیتی سنتی که برای دفاع در برابر تهدیدات خارجی طراحی شدهاند، برای تشخیص مسائلی که از عوامل فعال در محیطهای داخلی مورد اعتماد ناشی میشوند، مجهز نیستند. هنگامی که یک عامل دادهها را از طریق کانالهای قانونی به پلتفرمی مانند مولتبوک منتقل میکند، ابزارهای امنیتی معمولی اغلب آن را به عنوان ترافیک عادی ثبت میکنند و از شناسایی افشای بالقوه یا دستکاری که در خود شبکه عامل رخ میدهد، باز میمانند. مولتبوک خطر شخص ثالث را به یک سطح حمله تقریباً بینهایت تبدیل میکند، زیرا یک عامل با هزاران نهاد ناشناس از سازمانهایی با نیات و شیوههای امنیتی تأیید نشده تعامل دارد.
یکی از جنبههای به خصوص موذیانه خطرات امنیتی مولتبوک در قابلیتهای حافظه پایدار عوامل هوش مصنوعی نهفته است. چارچوبهایی مانند OpenClaw حافظه را در طول هفتهها تعامل حفظ میکنند و به دستورالعملهای مخرب جذب شده از مولتبوک اجازه میدهند تا زمانی که شرایط خاصی برای فعالسازی آنها فراهم شود، غیرفعال بمانند. این قابلیت اجازه میدهد تا آنچه محققان "تزریق دستور با زمانبندی شده" مینامند، که در آن یک اکسپلویت در طول جذب محتوا کاشته میشود اما روزها یا هفتهها بعد منفجر میشود. این امر تحقیقات پزشکی قانونی را به طور فزایندهای دشوار میکند، زیرا نقاط مبدأ و اجرای حمله به طور گستردهای در زمان جدا شدهاند. بسیاری از سازمانها با بازیابی دادهها پس از یک حادثه دست و پنجه نرم میکنند، به این معنی که آلودگی ناشی از تعاملات مولتبوک میتواند غیرقابل برگشت باشد. این مشکل اساسی در امنیت عوامل هوش مصنوعی با پلتفرمهایی مانند مولتبوک اجتنابناپذیر میشود و سوالات جدی در مورد اصالت و ایمنی ارتباط عامل به عامل در اکوسیستمهای هوش مصنوعی غیرمتمرکز ایجاد میکند.
مولتبوک همچنین نشان داده است که چگونه تاکتیکهای مهندسی اجتماعی برای هدف قرار دادن عوامل خودکار تکامل مییابند. محققان مشاهده کردهاند که عوامل به طور فعال در تلاش برای "فیشینگ" رباتهای دیگر برای اطلاعات حساس، مانند کلیدهای API و دادههای پیکربندی، هستند. این تغییر در تاکتیکهای خصمانه مستلزم طبقهبندی مجدد عوامل هوش مصنوعی است و آنها را در کنار زیرساختهای حیاتی مانند ارائهدهندگان هویت، ابزارهای مدیریتی و خطوط لوله اتوماسیون پیچیده قرار میدهد. هر سیستمی که در آن عوامل متن غیرقابل اعتماد را جذب میکنند و قابلیت اقدام بر روی آن را دارند، باید به طور ذاتی در معرض خطر تلقی شود. همگرایی مجوزهای گسترده، تعاملات با سرعت ماشین و مدل اعتماد ذاتی شبکههای عامل، زمینه حاصلخیزی را برای حملات جدید ایجاد میکند. شورش مولتبوک به عنوان یک هشدار جدی عمل میکند: چارچوبهای امنیتی طراحی شده برای محیطهای دیجیتال انسانمحور برای چشمانداز در حال ظهور تعامل عوامل هوش مصنوعی خودکار کافی نیستند.