معرفی مدل چینی Kimi K2 Thinking؛ برتری آن بر GPT-5 در استدلال

استارتاپ چینی Moonshot AI از مدل نوآورانه خود به نام Kimi K2 Thinking پردهبرداری کرد؛ مدلی که نه تنها رقبای متنباز، بلکه مدلهای اختصاصی و تجاری همچون GPT-5 و Claude Sonnet 4.5 را در بنچمارکهای کلیدی استدلال و کدنویسی پشت سر گذاشته است.
به نقل از نتایج منتشرشده توسط Moonshot AI، مدل Kimi K2 Thinking به دستاوردهای بیسابقهای نائل آمده است: در بنچمارک BrowseComp (جستجوی ایجنتی وب) این مدل موفق به کسب امتیاز ۶۰.۲ درصد شد. این نتیجه به شکل قابلتوجهی فراتر از رقیب چینی Deepseek-V3.2 و مدلهای آمریکایی مانند GPT-5 (با امتیاز ۵۴.۹ درصد) و Claude Sonnet 4.5 (با امتیاز ۲۴.۱ درصد) است.
علاوه بر این، این مدل توانسته در آزمون استدلال HLE با کسب امتیاز ۴۴.۹ درصد یک رکورد جدید را به ثبت برساند. همچنین در بنچمارک کدنویسی SWE-Bench Verified با امتیاز ۷۱.۳ درصد، عملکردی بهتر از GPT-5 و Claude به نمایش گذاشته است.
Kimi K2 Thinking حتی در بنچمارکهای ریاضی پیشرفته نظیر AIME 2025 و HMMT 2025 نیز با GPT-5 رقابت میکند. این نخستین باری است که یک مدل متنباز بهطور کامل در زمینه استدلالهای پیچیده به سطح مدلهای اختصاصی و پولی میرسد یا آنها را پشت سر میگذارد.
معرفی مدل متنباز Kimi K2 Thinking
مدل Kimi K2 Thinking بر مبنای معماری ترکیبی از متخصصان (MoE) و با ۱ تریلیون پارامتر طراحی شده است. با این حال، به خاطر ساختار MoE، در هر لحظه فقط ۳۲ میلیارد پارامتر بهطور فعال کار میکنند که این ویژگی کارایی آن را بهطرز قابلتوجهی افزایش میدهد. همچنین این مدل دارای پنجره زمینهای بزرگ به اندازه ۲۵۶ هزار توکن میباشد.
اگرچه مدل Kimi K2 Thinking به دلیل مقیاس ۱ تریلیون پارامتریاش فشرده شده است، فرایند آموزشی به کار رفته در آن به نام Quantization، نیاز به حافظه را کاهش میدهد و سرعت تولید متن را در مقایسه با نسخه غیر فشرده، تقریباً دو برابر میکند.
مدل Kimi K2 Thinking هماکنون از طریق وبسایت kimi.com و همچنین بهوسیله API در دسترس قرار دارد. این مدل همچنین بر روی پلتفرم Hugging Face قابل استفاده است. هزینه استفاده از API آن (۰.۶۰ دلار برای هر ۱ میلیون توکن ورودی) به مراتب ارزانتر از GPT-5 (۱.۲۵ دلار) است و آن را به گزینهای رقابتی تبدیل کرده است.
Moonshot AI این مدل را تحت «مجوز MIT اصلاحشده» ارائه کرده است. این مجوز بهطور کامل اجازه استفاده تجاری را فراهم میآورد، اما یک شرط دارد: «اگر نرمافزار یا محصول حاصل از آن، بیش از ۱۰۰ میلیون کاربر فعال ماهانه داشته باشد یا بیش از ۲۰ میلیون دلار در ماه درآمد کسب کند، ارائهدهنده موظف است نام Kimi K2 را به وضوح در رابط کاربری محصول ارائه دهد.




