هوش مصنوعی

آزمایش ChatGPT Agent نواقص عجیبی را در این هوش مصنوعی نمایان کرد

به تازگی، شرکت OpenAI از أحدث ایجنت هوشمند خود با عنوان «ChatGPT Agent» پرده‌برداری کرد؛ ابزاری که با ترکیب توانمندی‌های پژوهشی و اجرایی، وعده انجام کارهای پیچیده را به‌طور خودکار می‌دهد. اما این دستیار جدید با برخی مسائل عجیب و غریب مواجه است: برای هر اقدام جدی، به تأیید کاربر نیاز دارد و در مراحل آزمایشی، با ارتکاب خطاهای قابل توجه و عملکرد کند، نشان داده که هنوز تا دستیابی به استقلال واقعی فاصله دارد.

OpenAI با تجمیع دو عامل هوشمند قبلی خود، یعنی Operator (که وظایف را در مرورگر انجام می‌دهد) و Deep Research (برای انجام تحقیقات پیچیده) یک ابزار یکپارچه را به‌طور مستقیم در محیط ChatGPT ایجاد کرده است. این ایجنت هوشمند می‌تواند از طریق یک «کامپیوتر مجازی»، اقداماتی نظیر بررسی تقویم، برنامه‌ریزی سفر، خرید اینترنتی یا تهیه گزارش‌های تحلیلی را به جای شما انجام دهد.

مسائل عجیب ChatGPT Agent

با اینکه این قابلیت‌ها جذاب به نظر می‌رسند، یک محدودیت بنیادین، ارزش این ابزار را به چالش کشیده است. به گفته رسمی OpenAI، این عامل هوشمند «پیش از انجام هر اقدام مهم، از کاربر مجوز می‌گیرد.» این به این معناست که شما نمی‌توانید به آن وظیفه‌ای بسپارید و از پشت سیستم دور شوید. برای هر مرحله کلیدی، از رزرو بلیط تا خرید اینترنتی، حضور و تأیید نهایی شما ضروری است.

تحلیل‌های وایرد نشان می‌دهد که این رویکرد دوگانه یک واقعیت مهم را نمایان می‌کند:

  • از نظر ایمنی: این رویکرد منطقی به نظر می‌رسد. با توجه به احتمال بروز اشتباه از سوی هوش مصنوعی یا قرار گرفتن در معرض حملات سایبری (مانند تزریق پرامپت)، این نظارت انسانی می‌تواند از وقوع مشکلات مالی یا امنیتی جلوگیری نماید.
  • از نظر کاربردی: این نیاز پیوسته به دخالت انسانی، هدف اصلی یک ابزار «اتوماسیون» را به چالش می‌کشد. این ایجنت هوشمند بین دو حالت متضاد گرفتار شده است: هم آن‌قدر قوی است که نمی‌تواند رها شود و هم آن‌قدر بی‌خبر است که نمی‌تواند به تنهایی وظایف را انجام دهد.

عملکرد این دستیار هوشمند در آزمایش‌های اولیه نیز چندان نویدبخش نبوده است؛ کارشناسان به‌طور خاص در یک آزمون، می‌گویند که سفارش چند کیک فنجانی از سوی این ایجنت هوشمند، نزدیک به یک ساعت به طول انجامید.

علاوه بر این، در ویدیوی معرفی این محصول، زمانی که از ChatGPT Agent خواسته می‌شود تا سفری برای بازدید از تمامی استادیوم‌های لیگ برتر بیسبال آمریکا برنامه‌ریزی کند، نقشه‌ای ارائه می‌دهد که یکی از ایستگاه‌ها را در وسط خلیج مکزیک قرار می‌دهد. این اشتباهات جدی که حتی در ویدیو از سوی خود ارائه‌دهندگان نادیده گرفته می‌شوند، نشان‌دهنده این است که این فناوری هنوز تا دستیابی به سطح مطلوب اطمینان و کارایی فاصله‌ای قابل توجه دارد.

این قابلیت جدید در ابتدا برای کاربران اشتراک Pro با محدودیت ۴۰۰ پرامپت در ماه ارائه خواهد شد. کاربران اشتراک‌های Plus و Team نیز به‌زودی، اما با محدودیت بیشتری (فقط یک دهم کاربران پرو)، به آن دسترسی پیدا خواهند کرد. هنوز زمان معینی برای ارائه این ویژگی به کاربران رایگان مشخص نشده است.

مقالات مرتبط

دکمه بازگشت به بالا