گوگل نسخه جدید مدل ویدیویی هوش مصنوعی خود به نام Veo 3.1 را با واقعگرایی بیشتر، صدای طبیعیتر و دقت بالاتر معرفی کرد.
به گزارش تکراتو و به نقل از arstechnica، در دورانی که تشخیص واقعیت در اینترنت سختتر از همیشه شده، گوگل با معرفی Veo 3.1 کار را پیچیدهتر کرده است.
این نسخه جدید از مدل ویدیویی هوش مصنوعی گوگل با هدف بهبود کیفیت تصویر، افزایش دقت در اجرای دستورات متنی و ایجاد صداهای واقعیتر عرضه میشود.
Veo 3.1 در سراسر اکوسیستم گوگل، از جمله ابزار ساخت فیلم Flow، در دسترس خواهد بود و قابلیتهای تازهای را در اختیار کاربران قرار میدهد. همچنین نسخهای ارزانتر از این مدل با نام Veo Fast معرفی شده تا هزینه تولید ویدیوهای هوش مصنوعی کاهش یابد.
مدل Veo نخستین بار اوایل سال جاری میلادی معرفی شد و بهسرعت به دلیل جهش بزرگ در کیفیت ویدیوهای هوش مصنوعی مورد توجه قرار گرفت.
گوگل اکنون با استفاده از حجم عظیم دادههای ویدیویی موجود در یوتیوب، نسخه جدید Veo 3.1 را با مجموعهای از قابلیتهای پیشرفتهتر عرضه کرده است.
به گفته گوگل، Veo 3.1 از دقت بالاتری در اجرای دستورات متنی برخوردار است که نتیجه آن تولید ویدیوهای باکیفیتتر و صرفهجویی در منابع پردازشی است.
صدای تولیدی نیز نسبت به نسخه قبلی، طبیعیتر و هماهنگتر شده است. در حالی که Veo 3 فقط خروجی افقی با وضوح ۷۲۰p تولید میکرد، نسخه جدید اکنون قادر است ویدیوها را هم در قالب افقی و هم عمودی با نسبت تصویر ۱۶:۹ تولید کند.
گوگل پیشتر وعده داده بود که ابزارهای تولید ویدیوی Veo را به بخش YouTube Shorts اضافه کند که مشابه تیکتاک از ویدیوهای عمودی استفاده میکند. عرضه Veo 3.1 میتواند زمینه تحقق این وعده را فراهم کند.
این بهروزرسانی همچنین رقابت گوگل با شرکت OpenAI را داغتر میکند؛ چرا که OpenAI اخیراً اپلیکیشن Sora را برای آیفون منتشر کرده که نسخه جدیدی از مدل تولید ویدیوی هوش مصنوعی این شرکت است.
Veo 3.1 تمرکز ویژهای بر فیلمسازان دارد و در تمام ابزارهای هوش مصنوعی گوگل در دسترس قرار خواهد گرفت. کاربران میتوانند با استفاده از اپلیکیشن Gemini، نسخههای Veo 3.1 و Veo 3.1 Fast را اجرا کنند.
توسعهدهندگان نیز از طریق پلتفرم Vertex AI و رابط برنامهنویسی Gemini API به این مدل دسترسی خواهند داشت. نسخه Fast بهطور خاص برای کاهش هزینهها در مدل پرداخت بهازای توکن طراحی شده است.
Veo به عنوان مدل پایه در ابزار ساخت فیلم Flow گوگل عمل میکند و با نسخه جدید چند قابلیت تازه به این ابزار اضافه شده است. قابلیتهای Ingredients to Video، Frames to Video و Extend اکنون از صدای تولیدشده پشتیبانی میکنند.
این یعنی کاربران میتوانند چند تصویر را بهعنوان مرجع آپلود کنند یا از تصاویر برای آغاز یا پایان ویدیو استفاده کرده و همزمان صدای دلخواه خود را نیز به آن اضافه کنند.
همین قابلیتها از طریق API نیز در دسترس هستند و اپلیکیشن Gemini نیز همچنان از تصاویر مرجع برای تولید ویدیو پشتیبانی میکند، اگرچه همه امکانات Flow را ندارد.
Veo 3.1 همچنین ویژگیهای تازهای برای ویرایش دقیق ویدیوها ارائه میدهد. این مدل اکنون میتواند با حفظ ظاهر کلی صحنه، تغییرات جزئی مانند افزودن یا حذف اشیا را در ویدیو انجام دهد.
افزودن اشیا از همین حالا در ابزار Flow و API فعال است، اما امکان حذف اشیا هنوز به Flow اضافه نشده و به گفته گوگل، در آینده نزدیک ارائه خواهد شد.
گوگل اعلام کرده است که عرضه Veo 3.1 از امروز آغاز شده، بنابراین هنگام تماشای ویدیوهای عمودی جدید در شبکههای اجتماعی، بهتر است نگاهی دقیقتر و محتاطانهتر به آنها داشت.
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید