گوگل از هوش مصنوعی VaultGemma با محوریت حفظ حریم خصوصی پردهبرداری کرد

شرکتهای فعال در حوزه فناوری به منظور توسعه مدلهای بزرگتر هوش مصنوعی به دنبال جمعآوری دادههای آموزشی هستند و همین موضوع نگرانیهایی را در زمینه حریم خصوصی کاربران به وجود آورده است. به تازگی، گوگل از مدل VaultGemma رونمایی کرده که با بهرهگیری از تکنیکهای نوآورانه طراحی شده است تا حریم خصوصی را حفظ کند.
VaultGemma یک مدل آزمایشی به شمار میآید که نشان میدهد میتوان هوش مصنوعی قدرتمندی را ایجاد کرد که احتمال کمتری دارد دادههای حساس آموزشی خود را به خاطر سپرده و بهطور ناخواسته افشا کند. این نوآوری میتواند نگرش گوگل و دیگر شرکتها را نسبت به حریم خصوصی در محصولاتی که در آینده عرضه میشوند، بازتعریف کند.
هوش مصنوعی VaultGemma گوگل
یکی از بزرگترین چالشهای مدلهای زبانی عظیم این است که گاهی اوقات به جای تولید محتوای جدید، محتوایی را از دادههای آموزشی خود بهصورت حرف به حرف تکرار میکنند. اگر این دادهها حاوی اطلاعات شخصی کاربران یا محتوای تحت کپیرایت باشند، میتواند به نقض حریم خصوصی یا بروز مشکلات قانونی جدی منجر شود.
پیشنهاد گوگل برای حل این مشکل، به کارگیری تکنیک معروف Differential Privacy است. این روش با افزودن نویز یا اختلالات محاسباتی در طی فرآیند آموزش، از بهخاطرسپاری جزئیات دقیق توسط مدل جلوگیری میکند. اما این تکنیک معمولاً مشکلاتی را به همراه دارد؛ زیرا اضافه کردن نویز میتواند دقت مدل را کاهش داده و نیاز به قدرت پردازشی بیشتری را به دنبال داشته باشد.
موفقیت عمده تیم تحقیقاتی گوگل در کشف «قوانین مقیاسپذیری» برای این مدلهای حفاظتشده بوده است. آنها معادلهای را برای ایجاد توازن بهینه میان سه عامل کلیدی تعیین کردند: بودجه حریم خصوصی (میزان نویز)، بودجه محاسباتی (قدرت پردازش) و بودجه داده (حجم دادههای آموزشی). این دستاورد به توسعهدهندگان این امکان را میدهد که منابع خود را بهطور مؤثرتری برای ساخت مدلهای دارای حریم خصوصی تخصیص دهند.
گوگل اشاره کرده که احتمالاً از این تکنیک در مدلهای غولپیکر و عمومی که در آنها عملکرد حداکثری در اولویت قرار دارد، استفاده نخواهد کرد. بهجای آن، این روش برای مدلهای کوچکتر و هدفمند که قابلیتهای خاصی را در محصولات ارائه میدهند (مانند خلاصهسازی ایمیلها و ارائه پاسخهای بهینهتر) بسیار مناسبتر است.
VaultGemma یک مدل با وزن باز (open-weight) است که بر پایه مدل Gemma 2 بنا شده است. این مدل با وجود تنها ۱ میلیارد پارامتر، در مقایسه با مدلهای امروز، نسبتاً کوچک به حساب میآید. در حال حاضر، این مدل برای دانلود در پلتفرمهای Hugging Face و Kaggle در دسترس کاربران قرار دارد.




