مدلهای جدید هوش مصنوعی Llama 4 با تمرکز بر تعامل چندرسانهای، عملکردی فراتر از رقبا ارائه میدهند و برای استفاده عموم آزاد شدهاند.
به گزارش تکراتو و به نقل از ai.meta، با معرفی مدلهای جدید Llama 4، شرکت Meta فصل تازهای از نوآوری در هوش مصنوعی را آغاز کرده است. این مدلها که طراحی آنها بر پایه معماری ترکیب متخصصان یا همان MoE انجام شده، امکانات پیشرفتهای برای تجربههای شخصیسازیشده در اختیار توسعهدهندگان قرار میدهند.
اولین مدل از این مجموعه، Llama 4 Scout، دارای ۱۷ میلیارد پارامتر فعال و ۱۶ ماژول تخصصی است. این مدل که تنها با یک کارت گرافیک NVIDIA H100 قابل اجراست، با ارائه عملکردی بهتر از مدلهایی مثل Gemma 3، Gemini 2.0 Flash-Lite و Mistral 3.1، در رده خود بهترین مدل چندرسانهای به شمار میرود. همچنین این مدل از پنجره متنی فوقالعادهای با ظرفیت ۱۰ میلیون پشتیبانی میکند.
مدل بعدی، Llama 4 Maverick، با همان ۱۷ میلیارد پارامتر فعال اما با ۱۲۸ متخصص، توانسته در بسیاری از آزمونهای مرجع، عملکرد بهتری نسبت به GPT-4o و Gemini 2.0 Flash از خود نشان دهد.
حتی در بخشهای استدلال و برنامهنویسی، نتایجی مشابه با DeepSeek v3 ثبت کرده، در حالی که از نصف پارامترهای آن استفاده میکند. این مدل از نظر نسبت هزینه به کارایی نیز بسیار بهینه طراحی شده و نسخه آزمایشی گفتوگوی آن امتیاز ۱۴۱۷ را در پلتفرم LMArena کسب کرده است.
پشت این دو مدل، یک مدل آموزشی قدرتمند به نام Llama 4 Behemoth قرار دارد که با ۲۸۸ میلیارد پارامتر فعال و ۱۶ ماژول تخصصی، قویترین مدل ساخته شده توسط Meta تا به امروز محسوب میشود.
این مدل در حال حاضر همچنان در مرحله آموزش قرار دارد اما طبق ارزیابیها، عملکرد آن از GPT-4.5، Claude Sonnet 3.7 و Gemini 2.0 Pro در آزمونهای حوزه علوم پایه و مهندسی بهتر است.
هوش مصنوعی Llama 4
هماکنون امکان دانلود مدلهای Llama 4 Scout و Llama 4 Maverick از سایت llama.com و همچنین Hugging Face فراهم شده است. همچنین میتوانید تجربه استفاده از Meta AI با این مدلها را در WhatsApp، Messenger، Instagram Direct و نسخه وب آغاز کنید.
هدف Meta از ارائه این مدلها با دسترسی آزاد، گسترش امکان ساخت تجربههای هوشمند و شخصیسازیشده برای کاربران، توسعهدهندگان و کسبوکارهاست. با Llama 4، دنیای جدیدی از تعاملهای هوشمند و حل مسائل پیچیده در دسترس قرار گرفته است.
قرار است جزئیات بیشتری از مسیر توسعه این مدلها و چشمانداز آینده در رویداد LlamaCon در تاریخ ۲۹ آوریل منتشر شود.
چه توسعهدهنده باشید، چه صاحب کسبوکار یا صرفاً فردی کنجکاو درباره هوش مصنوعی، مدلهای Llama 4 Scout و Llama 4 Maverick ابزارهایی هستند که میتوانند آیندهی محصولات هوشمند را متحول کنند. انتظار میرود جامعه کاربران با این مدلها تجربههایی خلاقانه و شگفتانگیز خلق کند.
هوش مصنوعی Llama 4
مدل Llama 4 Maverick بهعنوان یک مدل عمومی، شامل ۱۷ میلیارد پارامتر فعال، ۱۲۸ متخصص و ۴۰۰ میلیارد پارامتر کل است که کیفیتی بالا را با قیمتی کمتر از مدل Llama 3.3 70B ارائه میدهد.
این مدل چندحالته بهترین عملکرد را دارد و از مدلهایی مانند GPT-4o و Gemini 2.0 در آزمونهای کدنویسی، استدلال، چندزبانهبودن، متنهای طولانی و تحلیل تصویر بهتر عمل کرده و در حوزه کدنویسی و استدلال با مدل بسیار بزرگ DeepSeek v3.1 رقابت میکند.
مدل کوچکتر به نام Llama 4 Scout، یک مدل همهمنظوره با ۱۷ میلیارد پارامتر فعال، ۱۶ متخصص و در مجموع ۱۰۹ میلیارد پارامتر است که در کلاس خودش عملکردی پیشرفته و در سطح جهانی دارد. این مدل طول زمینه (context length) قابل پشتیبانی را به شکل چشمگیری از ۱۲۸ هزار توکن در Llama 3 به عدد بیسابقه ۱۰ میلیون توکن افزایش داده است.
این پیشرفت، امکانات تازهای را فراهم میکند؛ از جمله خلاصهسازی چندین سند به صورت همزمان، تحلیل دقیق فعالیتهای کاربر برای انجام کارهای شخصیسازیشده، و استدلال بر روی حجمهای بزرگ کد.
Llama 4 Scout هم در مرحله پیشپردازش و هم در آموزش نهایی، با طول زمینه ۲۵۶ هزار توکن آموزش دیده است. همین موضوع باعث شده تا مدل پایه، توانایی بالایی در تعمیمدادن به ورودیهای طولانی پیدا کند.
در آزمایشهای انجامشده، نتایج قابلتوجهی در کارهایی مانند بازیابی اطلاعات از دل متن (مثلاً یافتن یک جمله خاص در میان انبوهی از دادهها) و همچنین ارزیابی احتمال منفی تجمعی (NLL) در میان ۱۰ میلیون توکن کد به دست آمده است.
یکی از نوآوریهای کلیدی در معماری Llama 4 استفاده از لایههای توجه بهصورت درهمتنیده است که نیازی به جاسازی موقعیتی (positional embeddings) ندارند.
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید