تک فان

تک فان

مجله خبری تفریحی: دنیای سرگرمی و تفریح
امروز: دوشنبه , ۱۸ فروردین , ۱۴۰۴
X
معرفی هوش مصنوعی Llama 4 ؛ ورود نسل جدید AI

معرفی هوش مصنوعی Llama 4 ؛ ورود نسل جدید AI

مدل‌های جدید هوش مصنوعی Llama 4 با تمرکز بر تعامل چندرسانه‌ای، عملکردی فراتر از رقبا ارائه می‌دهند و برای استفاده عموم آزاد شده‌اند.

راهنمای خرید تکراتوراهنمای خرید تکراتو

به گزارش تکراتو و به نقل از ai.meta، با معرفی مدل‌های جدید Llama 4، شرکت Meta فصل تازه‌ای از نوآوری در هوش مصنوعی را آغاز کرده است. این مدل‌ها که طراحی آن‌ها بر پایه معماری ترکیب متخصصان یا همان MoE انجام شده، امکانات پیشرفته‌ای برای تجربه‌های شخصی‌سازی‌شده در اختیار توسعه‌دهندگان قرار می‌دهند.

معرفی هوش مصنوعی Llama 4

اولین مدل از این مجموعه، Llama 4 Scout، دارای ۱۷ میلیارد پارامتر فعال و ۱۶ ماژول تخصصی است. این مدل که تنها با یک کارت گرافیک NVIDIA H100 قابل اجراست، با ارائه عملکردی بهتر از مدل‌هایی مثل Gemma 3، Gemini 2.0 Flash-Lite و Mistral 3.1، در رده خود بهترین مدل چندرسانه‌ای به شمار می‌رود. همچنین این مدل از پنجره متنی فوق‌العاده‌ای با ظرفیت ۱۰ میلیون پشتیبانی می‌کند.

مدل بعدی، Llama 4 Maverick، با همان ۱۷ میلیارد پارامتر فعال اما با ۱۲۸ متخصص، توانسته در بسیاری از آزمون‌های مرجع، عملکرد بهتری نسبت به GPT-4o و Gemini 2.0 Flash از خود نشان دهد.

حتی در بخش‌های استدلال و برنامه‌نویسی، نتایجی مشابه با DeepSeek v3 ثبت کرده، در حالی که از نصف پارامترهای آن استفاده می‌کند. این مدل از نظر نسبت هزینه به کارایی نیز بسیار بهینه طراحی شده و نسخه آزمایشی گفت‌وگوی آن امتیاز ۱۴۱۷ را در پلتفرم LMArena کسب کرده است.

پشت این دو مدل، یک مدل آموزشی قدرتمند به نام Llama 4 Behemoth قرار دارد که با ۲۸۸ میلیارد پارامتر فعال و ۱۶ ماژول تخصصی، قوی‌ترین مدل ساخته شده توسط Meta تا به امروز محسوب می‌شود.

این مدل در حال حاضر همچنان در مرحله آموزش قرار دارد اما طبق ارزیابی‌ها، عملکرد آن از GPT-4.5، Claude Sonnet 3.7 و Gemini 2.0 Pro در آزمون‌های حوزه علوم پایه و مهندسی بهتر است.

هوش مصنوعی Llama 4هوش مصنوعی Llama 4هوش مصنوعی Llama 4

هم‌اکنون امکان دانلود مدل‌های Llama 4 Scout و Llama 4 Maverick از سایت llama.com و همچنین Hugging Face فراهم شده است. همچنین می‌توانید تجربه استفاده از Meta AI با این مدل‌ها را در WhatsApp، Messenger، Instagram Direct و نسخه وب آغاز کنید.

هدف Meta از ارائه این مدل‌ها با دسترسی آزاد، گسترش امکان ساخت تجربه‌های هوشمند و شخصی‌سازی‌شده برای کاربران، توسعه‌دهندگان و کسب‌وکارهاست. با Llama 4، دنیای جدیدی از تعامل‌های هوشمند و حل مسائل پیچیده در دسترس قرار گرفته است.

قرار است جزئیات بیشتری از مسیر توسعه این مدل‌ها و چشم‌انداز آینده در رویداد LlamaCon در تاریخ ۲۹ آوریل منتشر شود.

چه توسعه‌دهنده باشید، چه صاحب کسب‌وکار یا صرفاً فردی کنجکاو درباره هوش مصنوعی، مدل‌های Llama 4 Scout و Llama 4 Maverick ابزارهایی هستند که می‌توانند آینده‌ی محصولات هوشمند را متحول کنند. انتظار می‌رود جامعه کاربران با این مدل‌ها تجربه‌هایی خلاقانه و شگفت‌انگیز خلق کند.

هوش مصنوعی Llama 4هوش مصنوعی Llama 4هوش مصنوعی Llama 4

مدل Llama 4 Maverick به‌عنوان یک مدل عمومی، شامل ۱۷ میلیارد پارامتر فعال، ۱۲۸ متخصص و ۴۰۰ میلیارد پارامتر کل است که کیفیتی بالا را با قیمتی کمتر از مدل Llama 3.3 70B ارائه می‌دهد.

این مدل چندحالته بهترین عملکرد را دارد و از مدل‌هایی مانند GPT-4o و Gemini 2.0 در آزمون‌های کدنویسی، استدلال، چندزبانه‌بودن، متن‌های طولانی و تحلیل تصویر بهتر عمل کرده و در حوزه کدنویسی و استدلال با مدل بسیار بزرگ DeepSeek v3.1 رقابت می‌کند.

مدل کوچک‌تر به نام Llama 4 Scout، یک مدل همه‌منظوره با ۱۷ میلیارد پارامتر فعال، ۱۶ متخصص و در مجموع ۱۰۹ میلیارد پارامتر است که در کلاس خودش عملکردی پیشرفته و در سطح جهانی دارد. این مدل طول زمینه (context length) قابل پشتیبانی را به شکل چشمگیری از ۱۲۸ هزار توکن در Llama 3 به عدد بی‌سابقه ۱۰ میلیون توکن افزایش داده است.

این پیشرفت، امکانات تازه‌ای را فراهم می‌کند؛ از جمله خلاصه‌سازی چندین سند به صورت همزمان، تحلیل دقیق فعالیت‌های کاربر برای انجام کارهای شخصی‌سازی‌شده، و استدلال بر روی حجم‌های بزرگ کد.

Llama 4 Scout هم در مرحله پیش‌پردازش و هم در آموزش نهایی، با طول زمینه ۲۵۶ هزار توکن آموزش دیده است. همین موضوع باعث شده تا مدل پایه، توانایی بالایی در تعمیم‌دادن به ورودی‌های طولانی پیدا کند.

در آزمایش‌های انجام‌شده، نتایج قابل‌توجهی در کارهایی مانند بازیابی اطلاعات از دل متن (مثلاً یافتن یک جمله خاص در میان انبوهی از داده‌ها) و همچنین ارزیابی احتمال منفی تجمعی (NLL) در میان ۱۰ میلیون توکن کد به دست آمده است.

یکی از نوآوری‌های کلیدی در معماری Llama 4 استفاده از لایه‌های توجه به‌صورت درهم‌تنیده است که نیازی به جاسازی موقعیتی (positional embeddings) ندارند.

منبع





دانلود آهنگ
ارسال دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

طراحی و اجرا : وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است