گوگل در رویداد I/O 2025 از دو مدل پیشرفته هوش مصنوعی برای تولید تصویر و ویدیو رونمایی کرد که البته رایگان نیستند.
به گزارش تکراتو و به نقل از lifehacker، گوگل در جدیدترین بهروزرسانیهای خود، دو مدل پیشرفته هوش مصنوعی معرفی کرده است: Veo 3 برای تولید ویدیو و Imagen 4 برای تولید تصویر. این دو مدل نسبت به نسخههای قبلی خود بهبودهای چشمگیری داشتهاند و در رویداد Google I/O 2025 معرفی شدند.
مدل Veo 3 نسخه جدیدتر Veo 2 است که ماه گذشته برای مشترکین پلن Gemini ارائه شده بود. گوگل اعلام کرده که Veo 3 از نظر درک فیزیک واقعی و همگامسازی لبها بسیار پیشرفتهتر شده و ویدیوهای تولیدشده با آن حالا واقعیتر از همیشه به نظر میرسند.
یکی از ویژگیهای مهمی که به Veo 3 اضافه شده، توانایی تولید صداهای محیطی مانند صدای ترافیک، طبیعت و حتی گفتوگوی بین شخصیتهاست؛ چیزی که در نسخههای قبلی وجود نداشت.
نمونه ویدیوهایی مانند Old Sailor نیز برای نمایش تواناییهای جدید این مدل ارائه شدهاند. این کلیپها از نظر ظاهری به سطح بالایی از واقعگرایی رسیدهاند، هرچند همچنان حال و هوای کلیشهای و غیرشخصی در آنها دیده میشود، چون در اصل حاصل ترکیب صدها نمونه مشابه هستند.
دسترسی به Veo 3 فعلاً فقط برای کاربرانی فراهم است که اشتراک ماهانه ۲۵۰ دلاری پلن AI Ultra گوگل را دارند. با این حال، کاربران پلن ارزانتر AI Pro نیز میتوانند از بهروزرسانیهایی در Veo 2 بهرهمند شوند. طبق گفته گوگل، این نسخه حالا در زمینه کنترل، حرکات دوربین و افزودن یا حذف عناصر از ویدیوها بهتر عمل میکند.
در بخش تولید تصویر، گوگل مدل Imagen 4 را معرفی کرده که جایگزین Imagen 3 شده است. این مدل جزئیاتی مانند بافتهای پیچیده، قطرات آب و موی حیوانات را با وضوح بالا نشان میدهد و از رزولوشنهای بالا (تا ۲K) و نسبتهای تصویر مختلف پشتیبانی میکند. چه در سبک واقعگرایانه و چه در سبک انتزاعی، خروجیها از کیفیت بالایی برخوردارند.
یکی از مشکلات مهمی که Imagen 4 برطرف کرده، مربوط به تایپوگرافی است. مدلهای قبلی در نمایش حروف و کلمات دچار خطا میشدند، اما گوگل میگوید Imagen 4 حالا متنها را بسیار دقیقتر و بدون اشتباههای عجیب تولید میکند.
Imagen 4 هماکنون از طریق اپلیکیشن Gemini برای همه کاربران قابل استفاده است. گوگل هنوز محدودیتی برای استفاده اعلام نکرده، اما کاربران بدون اشتراک ممکن است زودتر با محدودیت مواجه شوند؛ مشابه آنچه در Imagen 3 دیده شد. گوگل همچنین اعلام کرده که نسخهای از Imagen 4 با سرعت ۱۰ برابر بیشتر نسبت به Imagen 3 بهزودی عرضه خواهد شد.
در کنار این مدلها، ابزار جدیدی به نام Flow نیز معرفی شده که برای ساخت فیلم با استفاده از هوش مصنوعی طراحی شده است. این ابزار ترکیبی از مدلهای متنی، تصویری و ویدیویی گوگل را بهکار میگیرد تا صحنههایی پیوسته و منسجم با شخصیتها و مکانهای ثابت تولید کند.
استفاده از Flow برای مشترکین پلنهای AI Pro و AI Ultra امکانپذیر است و البته کاربران پلن گرانتر، از مدلهای بهتر و محدودیتهای کمتر بهرهمند میشوند. این حرکت جدید گوگل نشان میدهد رقابت در زمینه تولید محتوای هوش مصنوعی نهتنها ادامه دارد، بلکه روزبهروز حرفهایتر میشود.
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید