مدل زبانی نوین اپل قادر است متون طولانی را با سرعتی بی‌نظیر خلق کند

مهر 22, 1404اخرین به روز رسانی: مهر 22, 1404

2 دقیقه خوانده شد

مدل زبانی جدید اپل می‌تواند با سرعتی خیره‌کننده متون طولانی تولید کند

مدل زبانی نوین اپل با اتکا به یک معماری پیشرفته، توانایی تولید متن‌های طولانی و پیچیده را با سرعت فوق‌العاده و دقت بالا دارد. طبق گزارش‌های منتشرشده، تیم تحقیقاتی این شرکت یک مدل مبتنی بر Diffusion را معرفی نموده که قادر است متن‌ها را با سرعتی تا 128 برابر بیشتر از مدل‌های مشابه خود تولید کند.

مدل‌های زبانی بزرگی مانند ChatGPT از نوع Autoregressive می‌باشند؛ این خورنده‌ها متنی را به‌طور توکن به توکن و به ترتیب تولید می‌کنند و هر توکن را با توجه به ورودی کاربر و تمامی توکن‌های قبلی شکل می‌دهند.

مدل زبانی جدید اپل از سرعت بسیار بالایی برخوردار است

از سوی دیگر، مدل‌های Diffusion می‌توانند چند توکن را به‌طور همزمان تولید کرده و در چند مرحله به اصلاح آن‌ها بپردازند تا پاسخ نهایی شکل گیرد. یکی از انواع پیشرفته این مدل‌ها، Flow-matching نام دارد که به دنبال حذف مراحل اصلاح چندگانه و دستیابی به نتیجه نهایی در یک مرحله است.

تحقیق جدید اپل تحت عنوان «FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models» مدلی جدید به نام Few-Step Discrete Flow-Matching (FS-DFM) را معرفی می‌کند. این مدل قادر است متن‌های طولانی را تنها با هشت مرحله اصلاح با سرعت بالایی تولید کند، در حالی که مدل‌های Diffusion معمولی به بیش از هزار مرحله نیاز دارند تا کیفیتی مشابه ارائه دهند.

برای دستیابی به این سرعت، پژوهشگران روش‌هایی را به کار گرفته‌اند: ابتدا مدل را آموزش می‌دهند تا بتواند چندین مرحله اصلاح متن را مدیریت کند، سپس از یک مدل «معلم» برای انجام به‌روزرسانی‌های دقیق و بزرگ‌تر در هر مرحله استفاده می‌شود و در نهایت، نحوه اجرای هر مرحله بهینه می‌گردد تا مدل بتواند با تعداد مراحل کمتر و پایداری بیشتر به نتیجه مطلوب برسد.

در مقایسه با مدل‌های بزرگ مشابه، FS-DFM در معیارهای «آنتروپی» و «سردرگمی» عملکردی درخشان از خود به نمایش گذاشته است. سردرگمی به اندازه‌گیری کیفیت متن پرداخته و هرچه عدد آن پایین‌تر باشد، متن تولیدی طبیعی‌تر و دقیق‌تر خواهد بود. آنتروپی نیز نشان‌دهنده سطح اطمینان مدل در هر کلمه است؛ مقدار پایین نشان‌دهنده تکراری بودن یا پیش‌بینی‌پذیری متن است و مقدار بالا به ایجاد متنی نامنظم و تصادفی منجر می‌شود.

مدل FS-DFM با پارامترهای 1.7، 1.3 و 0.17 میلیارد نسبت به مدل‌های Dream و LLaDA با 7 و 8 میلیارد پارامتر، در معیار سردرگمی عددی پایین‌تری و در آنتروپی عملکردی پایدارتر به‌دست آورده است.

با توجه به عملکرد برجسته و کمیاب بودن مدل‌های مشابه، پژوهشگران اعلام کرده‌اند که قصد دارند کد و چک‌پوینت‌های این مدل را منتشر کنند تا بستر تحقیقاتی و بازتولید آن امکان‌پذیر گردد. مطالعه کامل مقاله در arXiv شامل نمونه‌های عملی و نمودارهایی است که مراحل اصلاح هر توکن و تغییرات آن را تجسم می‌کند.

مهر 22, 1404اخرین به روز رسانی: مهر 22, 1404

2 دقیقه خوانده شد

مدل زبانی نوین اپل قادر است متون طولانی را با سرعتی بی‌نظیر خلق کند

مدل زبانی جدید اپل از سرعت بسیار بالایی برخوردار است

شتاب‌دهنده پارالاکس در حال تدوین «گزارش چالش‌های صنعت بازی ایران» است

آموزش مدیریت موجودی Apple ID Balance؛ چطور دقیق بفهمیم چقدر اعتبار داریم؟

خرید یوسی پابجی موبایل با بهترین قیمت و تحویل فوری از واریا شاپ

بازی های 2026 PS5؛ منتظر چه عناوینی باشیم؟

خرید قسطی پلی‌استیشن ۵؛ راهی منطقی برای ورود به نسل نهم بازی‌ها بدون فشار مالی

مایکروسافت قابلیت «Copilot Mode» را به مرورگر Edge اضافه کرد

مدیر عامل ناشر GTA: هوش مصنوعی صرفاً یک «تردستی» محسوب می‌شود

احتمال انتشار بسته الحاقی مورد نظر برای بازی Silent Hill 2 Remake تقویت شد

این استاد ژاپنی از یک بازی ترسناک برای تدریس زبان در کنسول PS4 بهره می‌برد

پیشرفت محققان چینی؛ شبیه‌سازی شیمی کوانتومی به کمک ابرکامپیوتر کلاسیک

مادربرد Z890 AORUS Tachyon Ice از گیگابایت به رکورد جهانی DDR5-13010 دست یافت

بازگشت پورشه به استفاده از پیشرانه‌های بنزینی؛ کناره‌گیری از آرزوی خودروهای الکتریکی

مدل زبانی جدید اپل از سرعت بسیار بالایی برخوردار است

خلق پارچه‌ای که پوشاک شما را به یک دستیار هوش مصنوعی مبدل می‌سازد

برملا شدن تمام جزئیات پردازنده‌های Panther Lake اینتل از سوی HWMonitor

مقالات مرتبط

پس از شکست AI Pin، استارتاپ Humane احتمالاً فروخته می شود

این مدل هوش مصنوعی می تواند سرطان را در مراحل اولیه تشخیص دهد

ایلان ماسک از متخصصان برای پیوستن به استودیو بازی سازی xAI دعوت کرد

چین برای 24 ساعت کنترل یک ماهواره در فضا را به هوش مصنوعی سپرد!