تک فان

مجله خبری تفریحی: دنیای سرگرمی و تفریح

امروز: پنج شنبه , ۱۳ آذر , ۱۴۰۴

صفحه اصلی

مدل‌های هوش مصنوعی جدید گوگل برای تصویر و ویدیو معرفی شدند

پیوند کوتاه

گوگل در رویداد I/O 2025 از دو مدل پیشرفته هوش مصنوعی برای تولید تصویر و ویدیو رونمایی کرد که البته رایگان نیستند.

به گزارش تکراتو و به نقل از lifehacker، گوگل در جدیدترین به‌روزرسانی‌های خود، دو مدل پیشرفته هوش مصنوعی معرفی کرده است: Veo 3 برای تولید ویدیو و Imagen 4 برای تولید تصویر. این دو مدل نسبت به نسخه‌های قبلی خود بهبودهای چشمگیری داشته‌اند و در رویداد Google I/O 2025 معرفی شدند.

هوش مصنوعی جدید گوگل

مدل Veo 3 نسخه جدیدتر Veo 2 است که ماه گذشته برای مشترکین پلن Gemini ارائه شده بود. گوگل اعلام کرده که Veo 3 از نظر درک فیزیک واقعی و همگام‌سازی لب‌ها بسیار پیشرفته‌تر شده و ویدیوهای تولیدشده با آن حالا واقعی‌تر از همیشه به نظر می‌رسند.

افزودن صدا و جزئیات واقعی‌تر

یکی از ویژگی‌های مهمی که به Veo 3 اضافه شده، توانایی تولید صداهای محیطی مانند صدای ترافیک، طبیعت و حتی گفت‌وگوی بین شخصیت‌هاست؛ چیزی که در نسخه‌های قبلی وجود نداشت.

نمونه ویدیوهایی مانند Old Sailor نیز برای نمایش توانایی‌های جدید این مدل ارائه شده‌اند. این کلیپ‌ها از نظر ظاهری به سطح بالایی از واقع‌گرایی رسیده‌اند، هرچند همچنان حال و هوای کلیشه‌ای و غیرشخصی در آن‌ها دیده می‌شود، چون در اصل حاصل ترکیب صدها نمونه مشابه هستند.

محدودیت دسترسی و ارتقاء Veo 2

دسترسی به Veo 3 فعلاً فقط برای کاربرانی فراهم است که اشتراک ماهانه ۲۵۰ دلاری پلن AI Ultra گوگل را دارند. با این حال، کاربران پلن ارزان‌تر AI Pro نیز می‌توانند از به‌روزرسانی‌هایی در Veo 2 بهره‌مند شوند. طبق گفته گوگل، این نسخه حالا در زمینه کنترل، حرکات دوربین و افزودن یا حذف عناصر از ویدیوها بهتر عمل می‌کند.

Imagen 4؛ مدل جدید تولید تصویر

در بخش تولید تصویر، گوگل مدل Imagen 4 را معرفی کرده که جایگزین Imagen 3 شده است. این مدل جزئیاتی مانند بافت‌های پیچیده، قطرات آب و موی حیوانات را با وضوح بالا نشان می‌دهد و از رزولوشن‌های بالا (تا ۲K) و نسبت‌های تصویر مختلف پشتیبانی می‌کند. چه در سبک واقع‌گرایانه و چه در سبک انتزاعی، خروجی‌ها از کیفیت بالایی برخوردارند.

یکی از مشکلات مهمی که Imagen 4 برطرف کرده، مربوط به تایپوگرافی است. مدل‌های قبلی در نمایش حروف و کلمات دچار خطا می‌شدند، اما گوگل می‌گوید Imagen 4 حالا متن‌ها را بسیار دقیق‌تر و بدون اشتباه‌های عجیب تولید می‌کند.

دسترسی به Imagen 4 و سرعت بالاتر

Imagen 4 هم‌اکنون از طریق اپلیکیشن Gemini برای همه کاربران قابل استفاده است. گوگل هنوز محدودیتی برای استفاده اعلام نکرده، اما کاربران بدون اشتراک ممکن است زودتر با محدودیت مواجه شوند؛ مشابه آنچه در Imagen 3 دیده شد. گوگل همچنین اعلام کرده که نسخه‌ای از Imagen 4 با سرعت ۱۰ برابر بیشتر نسبت به Imagen 3 به‌زودی عرضه خواهد شد.

Flow؛ ابزار هوش مصنوعی برای فیلم‌سازی

در کنار این مدل‌ها، ابزار جدیدی به نام Flow نیز معرفی شده که برای ساخت فیلم با استفاده از هوش مصنوعی طراحی شده است. این ابزار ترکیبی از مدل‌های متنی، تصویری و ویدیویی گوگل را به‌کار می‌گیرد تا صحنه‌هایی پیوسته و منسجم با شخصیت‌ها و مکان‌های ثابت تولید کند.

استفاده از Flow برای مشترکین پلن‌های AI Pro و AI Ultra امکان‌پذیر است و البته کاربران پلن گران‌تر، از مدل‌های بهتر و محدودیت‌های کمتر بهره‌مند می‌شوند. این حرکت جدید گوگل نشان می‌دهد رقابت در زمینه تولید محتوای هوش مصنوعی نه‌تنها ادامه دارد، بلکه روز‌به‌روز حرفه‌ای‌تر می‌شود.

منبع

دانلود آهنگ

23 می 2025 takfun

شرکت ها

ارسال دیدگاه