مدل جدید هوش مصنوعی متا که قرار است به رقیب قدرتمندی برای مدل هایی مانند GPT-3 OpenAI تبدیل شود، فاش شد.
نسخه متا مدل زبان بزرگ (LLaMa) این شرکت که به انجمن اینترنتی بحثبرانگیز 4Chan راه یافت، برای استفاده عمومی در نظر گرفته نشده بود. این برنامه به عنوان یک نسخه بتا برای آزمایش توسط محققان و دولت ها طراحی شده است، به این معنی که شخصی که دسترسی زودهنگام داشته است، اطلاعات مربوط به مدل را درز کرده است.
ظاهرا این اولین باری است که جزئیات یک هوش مصنوعی اختصاصی قبل از انتشار رسمی آن در دسترس قرار می گیرد. متا مدل LLaMA را در اواخر فوریه معرفی کرد. این شرکت در بیانیه جدید خود افشای جزئیات مربوط به هوش مصنوعی خود را رد نکرد. البته با توجه به کلمنت دلونگمدیر شرکت هوش مصنوعی Huagging Face، متا در تلاش است تا از نشت جلوگیری کند و درخواست حذف جزئیات فاش شده را ارائه کرده است.
متا در اعلامیه معرفی مدل زبان بزرگ خود خاطرنشان کرد که دموکراتیک کردن دسترسی به چنین فناوریهایی تا حدی برای جلوگیری از انواع خروجیهای نامناسبی است که قبلاً در هوش مصنوعی مختلف دیدهایم.
به عنوان مثال، ربات چت هوش مصنوعی BlenderBot 3 Meta سال گذشته به سرعت رفتارهای نژادپرستانه را در عرض یک هفته پس از عرضه خود نشان داد. طبق گفته Futurism، این شرکت امیدوار است که آخرین هوش مصنوعی منبع باز خود را قدرتمندتر کند و از سرنوشتی مشابه BlenderBot 3 جلوگیری کند.
در اطلاعیه متا آمده است: «حتی با وجود همه پیشرفتهای اخیر در مدلهای زبان بزرگ، دسترسی کامل تحقیقاتی به آنها به دلیل منابع مورد نیاز برای آموزش و اجرای چنین مدلهای بزرگ محدود شده است. این دسترسی محدود، توانایی محققان را برای درک چگونگی و چرایی عملکرد مدلهای زبان کاهش میدهد و مانع از پیشرفت تلاشها برای بهبود استحکام آنها و رسیدگی به مسائل شناخته شده مانند سوگیری، پاسخهای سمی، و پتانسیل تولید اطلاعات نادرست میشود.»
با توجه به جزئیات فاش شده از مدل بزرگ متا زبان، برخی می گویند که اگرچه این روش راه حل ایده آلی برای تعمیم هوش مصنوعی مذکور نیست، اما استفاده گسترده تر از آن به رشد آن کمک می کند.
بنابراین افرادی که به هوش مصنوعی متا در 4Chan دسترسی پیدا کردند، ممکن است آن را با همان ترفندهای قدیمی آموزش دهند که سال هاست دیگر چت بات ها را آزار می دهد.