معماری نوین هوش مصنوعی با سرعتی ۱۰۰ برابر بیشتر از مدلهای زبانی فعالیت میکند
استارتاپ هوش مصنوعی Sapient Intelligence واقع در سنگاپور، یک نوع جدید از معماری هوش مصنوعی را طراحی کرده است که قادر به رقابت با مدلهای زبان بزرگ (LLM) در انجام وظایف پیچیده استدلالی بوده و در بسیاری از موارد بهطرز چشمگیری از آنها پیشی میگیرد.
بر اساس گزارش ونچربیت، این معماری که به عنوان «مدل استدلال سلسلهمراتبی» شناخته میشود، با الهام از نحوه عملکرد مغز انسان ایجاد شده است. این سیستم بر این باور است که مغز انسان چگونه از مجموعههای متمایز برای برنامهریزی آگاهانه و کند در کنار پردازشهای سریع و شهودی استفاده میکند.
این معماری جدید میتواند توسعه هوش مصنوعی را متحول کند
این مدل به طور چشمگیری با استفاده از تنها حجم کمی از دادهها و منابع حافظه که مدلهای زبان بزرگ امروزی نیاز دارند، به نتایج فوقالعادهای دست پیدا میکند. این سطح از کارایی میتواند مزایای قابل توجهی را برای کاربردهای واقعگرایانه هوش مصنوعی در سطح بنگاه به ارمغان آورد، بخصوص در شرایطی که دادهها محدود بوده و منابع محاسباتی اندک است.
مدلهای زبان بزرگ عمدتاً برای تجزیه مسائل پیچیده به روشی به نام «زنجیره افکار» اتکا دارند. در این روش، مسئله به مراحل کوچکتر و مبتنی بر متن تقسیم میشود و مدل مجبور به تفکر بلندمدت یا بیان مراحل ذهنی خود به شکلی واضح در هنگام دستیابی به راهحل است.
محققان سنگاپوری اما در تحقیقات خود مطرح کردند که به کارگیری زنجیره افکار (CoT) برای استدلال یک روش موقتی و ناکافی است. این فرآیند به تجزیههایی آسیبپذیر و از پیشتعریف شده وابسته است، بهطوری که حتی یک اشتباه کوچک یا تغییر در ترتیب مراحل میتواند کل روند استدلال را به محلی نادرست هدایت کند.
برای عبور از این چالش، محققان به مفهوم «استدلال نهفته» پرداختهاند که در آن، مدل بهجای تولید نشانههای واضح فکری، فرآیند استدلال را در قالب تصاویر درونی و انتزاعی از مسئله پردازش میکند. این روش با شیوه تفکر انسان بیشتر همخوانی دارد.
در نهایت، محققان موفق به توسعه معماری جدیدی شدهاند که در انجام وظایف استدلالی تا ۱۰۰ برابر سریعتر از مدلهای موجود عمل کرده و تنها با یک هزار نمونه آموزشی به این میزان از توانایی و سرعت رسیده است.