اپل یک مدل زبانی بزرگ را آموزش داده تا بتواند ویدیوهای بلند را درک کند
- بدون نظر 23 آگوست 2025 مدیریتپژوهشگران اپل نسخهای اصلاحشده از مدل SlowFast-LLaVA را طراحی کردهاند که توانسته در حوزه تحلیل و درک ویدیوهای بلند عملکردی بهتر از مدلهای بسیار بزرگتر ارائه دهد. معنای این دستاورد در چند لایه فنی قابل بررسی است. در سادهترین توضیح، زمانی که یک مدل زبانی بزرگ برای درک ویدیو آموزش داده میشود، یاد میگیرد که […]








