بایگانی‌های Qwen 2.5-Max

هوش مصنوعی Qwen علی‌بابا از DeepSeek پیشی گرفت

- بدون نظر 5 فوریه 2025 مدیریت

علی‌بابا با معرفی مدل Qwen 2.5-Max به رقابت با DeepSeek پرداخته است. این مدل جدید با استفاده از معماری یادگیری ترکیب متخصصان (MoE) از بیش از ۲۰ تریلیون توکن در مرحله پیش‌آموزش بهره برده و با کمک تکنیک‌هایی مانند تنظیم دقیق نظارت‌شده (SFT) و یادگیری پیشرفته از بازخورد انسانی (RLHF) بهبود یافته است. با عرضه […]