آزمایش ChatGPT Agent نواقص عجیبی را در این هوش مصنوعی نمایان کرد
به تازگی، شرکت OpenAI از أحدث ایجنت هوشمند خود با عنوان «ChatGPT Agent» پردهبرداری کرد؛ ابزاری که با ترکیب توانمندیهای پژوهشی و اجرایی، وعده انجام کارهای پیچیده را بهطور خودکار میدهد. اما این دستیار جدید با برخی مسائل عجیب و غریب مواجه است: برای هر اقدام جدی، به تأیید کاربر نیاز دارد و در مراحل آزمایشی، با ارتکاب خطاهای قابل توجه و عملکرد کند، نشان داده که هنوز تا دستیابی به استقلال واقعی فاصله دارد.
OpenAI با تجمیع دو عامل هوشمند قبلی خود، یعنی Operator (که وظایف را در مرورگر انجام میدهد) و Deep Research (برای انجام تحقیقات پیچیده) یک ابزار یکپارچه را بهطور مستقیم در محیط ChatGPT ایجاد کرده است. این ایجنت هوشمند میتواند از طریق یک «کامپیوتر مجازی»، اقداماتی نظیر بررسی تقویم، برنامهریزی سفر، خرید اینترنتی یا تهیه گزارشهای تحلیلی را به جای شما انجام دهد.
مسائل عجیب ChatGPT Agent
با اینکه این قابلیتها جذاب به نظر میرسند، یک محدودیت بنیادین، ارزش این ابزار را به چالش کشیده است. به گفته رسمی OpenAI، این عامل هوشمند «پیش از انجام هر اقدام مهم، از کاربر مجوز میگیرد.» این به این معناست که شما نمیتوانید به آن وظیفهای بسپارید و از پشت سیستم دور شوید. برای هر مرحله کلیدی، از رزرو بلیط تا خرید اینترنتی، حضور و تأیید نهایی شما ضروری است.
تحلیلهای وایرد نشان میدهد که این رویکرد دوگانه یک واقعیت مهم را نمایان میکند:
- از نظر ایمنی: این رویکرد منطقی به نظر میرسد. با توجه به احتمال بروز اشتباه از سوی هوش مصنوعی یا قرار گرفتن در معرض حملات سایبری (مانند تزریق پرامپت)، این نظارت انسانی میتواند از وقوع مشکلات مالی یا امنیتی جلوگیری نماید.
- از نظر کاربردی: این نیاز پیوسته به دخالت انسانی، هدف اصلی یک ابزار «اتوماسیون» را به چالش میکشد. این ایجنت هوشمند بین دو حالت متضاد گرفتار شده است: هم آنقدر قوی است که نمیتواند رها شود و هم آنقدر بیخبر است که نمیتواند به تنهایی وظایف را انجام دهد.
عملکرد این دستیار هوشمند در آزمایشهای اولیه نیز چندان نویدبخش نبوده است؛ کارشناسان بهطور خاص در یک آزمون، میگویند که سفارش چند کیک فنجانی از سوی این ایجنت هوشمند، نزدیک به یک ساعت به طول انجامید.
علاوه بر این، در ویدیوی معرفی این محصول، زمانی که از ChatGPT Agent خواسته میشود تا سفری برای بازدید از تمامی استادیومهای لیگ برتر بیسبال آمریکا برنامهریزی کند، نقشهای ارائه میدهد که یکی از ایستگاهها را در وسط خلیج مکزیک قرار میدهد. این اشتباهات جدی که حتی در ویدیو از سوی خود ارائهدهندگان نادیده گرفته میشوند، نشاندهنده این است که این فناوری هنوز تا دستیابی به سطح مطلوب اطمینان و کارایی فاصلهای قابل توجه دارد.
این قابلیت جدید در ابتدا برای کاربران اشتراک Pro با محدودیت ۴۰۰ پرامپت در ماه ارائه خواهد شد. کاربران اشتراکهای Plus و Team نیز بهزودی، اما با محدودیت بیشتری (فقط یک دهم کاربران پرو)، به آن دسترسی پیدا خواهند کرد. هنوز زمان معینی برای ارائه این ویژگی به کاربران رایگان مشخص نشده است.