هوش مصنوعی

معماری نوین هوش مصنوعی با سرعتی ۱۰۰ برابر بیشتر از مدل‌های زبانی فعالیت می‌کند

استارتاپ هوش مصنوعی Sapient Intelligence واقع در سنگاپور، یک نوع جدید از معماری هوش مصنوعی را طراحی کرده است که قادر به رقابت با مدل‌های زبان بزرگ (LLM) در انجام وظایف پیچیده استدلالی بوده و در بسیاری از موارد به‌طرز چشمگیری از آن‌ها پیشی می‌گیرد.

بر اساس گزارش ونچربیت، این معماری که به عنوان «مدل استدلال سلسله‌مراتبی» شناخته می‌شود، با الهام از نحوه عملکرد مغز انسان ایجاد شده است. این سیستم بر این باور است که مغز انسان چگونه از مجموعه‌های متمایز برای برنامه‌ریزی آگاهانه و کند در کنار پردازش‌های سریع و شهودی استفاده می‌کند.

این معماری جدید می‌تواند توسعه هوش مصنوعی را متحول کند

این مدل به طور چشمگیری با استفاده از تنها حجم کمی از داده‌ها و منابع حافظه‌ که مدل‌های زبان بزرگ امروزی نیاز دارند، به نتایج فوق‌العاده‌ای دست پیدا می‌کند. این سطح از کارایی می‌تواند مزایای قابل توجهی را برای کاربردهای واقع‌گرایانه هوش مصنوعی در سطح بنگاه به ارمغان آورد، بخصوص در شرایطی که داده‌ها محدود بوده و منابع محاسباتی اندک است.

مدل‌های زبان بزرگ عمدتاً برای تجزیه مسائل پیچیده به روشی به نام «زنجیره افکار» اتکا دارند. در این روش، مسئله به مراحل کوچکتر و مبتنی بر متن تقسیم می‌شود و مدل مجبور به تفکر بلندمدت یا بیان مراحل ذهنی خود به شکلی واضح در هنگام دستیابی به راه‌حل است.

محققان سنگاپوری اما در تحقیقات خود مطرح کردند که به کارگیری زنجیره افکار (CoT) برای استدلال یک روش موقتی و ناکافی است. این فرآیند به تجزیه‌هایی آسیب‌پذیر و از پیش‌تعریف شده وابسته است، به‌طوری که حتی یک اشتباه کوچک یا تغییر در ترتیب مراحل می‌تواند کل روند استدلال را به محلی نادرست هدایت کند.

برای عبور از این چالش، محققان به مفهوم «استدلال نهفته» پرداخته‌اند که در آن، مدل به‌جای تولید نشانه‌های واضح فکری، فرآیند استدلال را در قالب تصاویر درونی و انتزاعی از مسئله پردازش می‌کند. این روش با شیوه تفکر انسان بیشتر همخوانی دارد.

در نهایت، محققان موفق به توسعه معماری جدیدی شده‌اند که در انجام وظایف استدلالی تا ۱۰۰ برابر سریع‌تر از مدل‌های موجود عمل کرده و تنها با یک هزار نمونه آموزشی به این میزان از توانایی و سرعت رسیده است.

مقالات مرتبط

دکمه بازگشت به بالا