دنیای هوش مصنوعی به سرعت در حال تحول است. گوگل در سال ۲۰۲۴ با توسعهی جمینی، معرفی NotebookLM و گسترش ادغام هوش مصنوعی در سرویسهای Workspace، روند رو به رشدی را آغاز کرد. اما برای اینکه بتواند در سال ۲۰۲۵ رهبری این حوزه را به دست بگیرد، باید به وعدههای خود عمل کند.
در این مقاله بررسی میکنیم که چگونه گوگل میتواند با پیشی گرفتن از سورا (Sora – مدل مولد ویدیوی OpenAI) از طریق فناوری لومیر (Lumiere)، بهبود Imagen و ارتقای NotebookLM با آواتارهای ویدیویی هوش مصنوعی، به این هدف برسد.
گوگل باید فراتر از تبلیغات پر زرق و برق پیرامون «هوش مصنوعی عاملمحور» حرکت کند و به جای آن، پیشرفتهای واقعی و ملموسی را در بهرهوری کاربران در سراسر اکوسیستم محصولات خود ارائه دهد. این شرکت میتواند با ترکیب پردازندههای تنسور و دستگاههای پیکسل، تواناییهای هوش مصنوعی دروندستگاهی را به نمایش بگذارد و قدرت خود را در عرصهی گوشیهای اندرویدی اثبات کند.
Lumiere باید غوغا به پا کند
مدل ویدیوسازی Sora از OpenAI توجه زیادی را به خود جلب کرده است، زیرا میتواند ویدیوهایی تا ۶۰ ثانیه بسازد. در حالی که بسیاری از مدلهای قبلی در ایجاد صحنههای پیچیده و حرکات واقعی مشکل داشتند، Sora نشان داده که در این زمینه امیدبخش است. اگرچه این مدل فقط در دسترس کاربران پولی GPT-4 قرار دارد، اما بدون شک تاثیرگذار و هیجانانگیز است و برای OpenAI اعتبار زیادی به همراه داشته است.
گوگل برای رقابت باید تلاشهای خود در حوزهی ویدیوسازی با هوش مصنوعی را سرعت ببخشد و از سورا جلو بزند. Lumiere که پاسخ گوگل به Sora محسوب میشود، باید شاهکار باشد. این مدل میتواند با ارائهی روایتی بصری و جذاب از طریق ورودیهای متنی ساده، خود را متمایز کند. گوگل همچنین میتواند از تخصص خود در جستجوی هوشمند برای بهبود زمینه و انسجام محتوای تولیدشده استفاده کند. حالا اگر Lumiere بتواند ویدیوهای طولانیتری نیز بسازد، آنوقت برگ برندهی گوگل در این رقابت خواهد بود.
بیشتر بخوانید: آموزش استفاده از جمینای گوگل؛ راهنمای جامع کار با هوش مصنوعی گوگل برای تازهکارها
رقابت با DALL-E میتواند منتقدان را ساکت کند
محافظت از این سیستم در برابر تهدیدات مخرب مانند دیپفیک قابل درک است، اما این که این مدل در گذشته به دلیل تعصبات الگوریتمی مورد انتقاد قرار گرفته، پذیرش آن را دشوار کرده است. با این حال، نشانههایی وجود دارد که Imagen در حال بهتر شدن است.
چند ماه پیش، نسخهی جدیدی از Imagen منتشر شد، اما نتایج آن متفاوت بود. بسیاری از تصاویر تولید شده بیش از حد محتاطانه، معمولی یا غیرجذاب بودند. البته استثناهایی هم وجود داشت؛ به عنوان مثال، وقتی از این مدل خواسته شد: «یک تصویر شگفتانگیز از یک اکوسیستم کامل بساز»، نتیجهی آن یک تصویر سورئال زیبا بود. این تجربه نشان میدهد که گوگل به بهبود Imagen ادامه خواهد داد.
اگر گوگل بتواند یاد بگیرد که چگونه تصاویر جذاب و واقعی از افراد ایجاد کند، بدون اینکه در دام مشکلات اخلاقی و تعصبات بیفتد، Imagen میتواند همسطح DALL-E شود و برگ برندهی گوگل در رقابتهای هوش مصنوعی ۲۰۲۵ باشد.
NotebookLM میتواند با ارائهدهندگان ویدیویی بهتر شود
NotebookLM تاثیر زیادی روی بهرهوری شخصی و کاری کاربران داشته است. این یک دفترچهی یادداشت هوش مصنوعی است که میتوان آن را با دادههای شخصی آموزش داد. مزیت اصلیاش این است که بدون سر و صدای اینترنت کار میکند و به یک دستیار تحقیقاتی فوقالعاده سریع تبدیل شده است.
یکی از قابلیتهای جالب آن، ایجاد پادکستهای مجازی جذاب بر اساس یادداشتها، لینکها و منابع مختلف است. مکالماتی که ایجاد میکند، طبیعی و تعاملی به نظر میرسند و سطحی از واقعگرایی پویا را ارائه میدهد که مشابهی ندارد.
اما یک ویژگی مهم در آن کم است: امکان تولید پادکستهای ویدیویی با مجریهای مجازی. اگر گوگل بتواند قابلیتی مشابه Synthesia به NotebookLM اضافه کند، محتوای تولیدشده را بسیار جذابتر و مفیدتر خواهد کرد. این ویژگی میتواند به تولیدکنندگان محتوا و بازاریابان کمک کند تا سریعتر ویدیوهای باکیفیت بسازند.
NotebookLM در حال حاضر هم ارزش زیادی دارد، اما اگر گوگل ویژگی خروجی ویدیویی را به آن اضافه کند، سطح جدیدی از تجربهی کاربری را رقم خواهد زد.
بیشتر بخوانید: آموزش حذف فعالیت های اخیر در جمینای ؛ چگونه فعالیتهای اخیر خود را از Google Gemini پاک کنیم؟
هوش مصنوعی عاملمحور ایدهی جذابی است، اما گوگل باید آن را به واقعیت تبدیل کند
«عصر عاملمحور» (Agentic Era) در هوش مصنوعی که شامل سیستمهای هوش مصنوعی پیشرفته و تعاملی است، نویدبخش تحولاتی مانند مدیریت زنجیرههای تامین پیچیده است. اما تا این لحظه، راهکارهای عاملمحور بیشتر شبیه به نسخهی تقویتشدهی گوگل اسیستنت به نظر میرسند تا یک انقلاب واقعی.
گوگل با داشتن مالکیت کامل بر زیرساختهای نرمافزاری و سختافزاری خود و دسترسی به حجم عظیمی از دادهها برای درک زمینه و هدف کاربران، در موقعیتی منحصربهفرد قرار دارد تا ثابت کند که «عصر عاملمحور» فقط یک اصطلاح جذاب یا روشی جدید برای کنترل اسپیکرهای هوشمند نیست.
در آینده، هوش مصنوعی عاملمحور باید بتواند وظایف پیچیدهتری را بهطور پیشگیرانه انجام دهد و فراتر از اکوسیستم Workspace گسترش یابد. به عنوان مثال، باید قابلیتهایی مانند پیشنویس خودکار ایمیلها، پیشنهاد زمان مناسب برای جلسات و همکاری در آمادهسازی اسناد را بهصورت هوشمند ارائه دهد.
جمینی سرعت بالایی در اسکن اطلاعات از ورکاسپیس دارد و سعی میکند بهصورت مستقل زمینهی درخواستها درک کند. این یک پیشرفت جالب است، زیرا به نظر میرسد که گوگل در حال ترکیب دانش عمومی اینترنتی جمینی با قابلیتهای تحلیل دادهی شخصی در NotebookLM است. البته، تا این لحظه، نتایج این جستجوهای خودکار چندان چشمگیر نبوده است.
امیدوارم گوگل به زودی به یک لحظهی طلایی در زمینهی هوش مصنوعی عاملمحور برسد و نشان دهد که این فناوری واقعا چه تواناییهایی دارد.
مالکیت کامل اکوسیستم، یک مزیت رقابتی بزرگ است
تراشهی Tensor و گوشیهای Pixel به آن مجهز میشوند، مزیتی بزرگ برای گوگل محسوب میشوند. مالکیت کامل اکوسیستم، از نرمافزار تا سختافزار، به گوگل این امکان را میدهد که بهینهسازیهای عمیقی انجام دهد، دادههای منحصربهفردی را تحلیل کند و قابلیتهای هوش مصنوعی خود را در سطح بالاتری ارائه دهد.
ترکیب سختافزار و نرمافزار در پردازندهی Tensor باعث ایجاد قابلیتهای نوآورانهای مانند ترجمهی زنده، پردازش پیشرفتهی تصاویر و تجربههای شخصیسازیشدهی کاربر شده است. اکنون، گوگل باید از این پردازنده و گوشیهای هوشمندش برای ارائهی یک اکوسیستم کامل هوش مصنوعی استفاده کند.
یکی از چالشهای اساسی، کاهش وابستگی به پردازش ابری است. گوگل باید نشان دهد که چگونه پردازشهای هوش مصنوعی را میتوان مستقیما روی دستگاه انجام داد تا مشکلاتی مانند تاخیر، حریم خصوصی و اتصال به اینترنت بهبود یابند.
با این حال، تراشهی Tensor تاکنون نتوانسته انتظارات را برآورده کند. برخی کاربران از عملکرد پایینتر آن نسبت به رقبا و کمبود ویژگیهای انقلابی مبتنی بر هوش مصنوعی انتقاد کردهاند.
دوست دارم ببینم که گوگل در پیکسل ۱۰، تمرکز بیشتری روی قابلیتهای هوش مصنوعی تنسور داشته باشد. این یعنی بهبود سرعت و کارایی پردازشها، همراه با ویژگیهای نوآورانهای که قدرت واقعی هوش مصنوعی دروندستگاهی را به نمایش بگذارد.
بیشتر بخوانید: آموزش استفاده از قابلیت Task در چت جی پی تی [آموزش تصویری]
برای اینکه گوگل بتواند در دنیای پرشتاب هوش مصنوعی به رهبر بیرقیب تبدیل شود، باید در سال ۲۰۲۵ از نقاط قوت خود بیشترین استفاده را ببرد:
✅ با Lumiere از Sora پیشی بگیرد و استانداردهای جدیدی در تولید ویدیو با هوش مصنوعی تعریف کند.
✅ پتانسیل کامل Imagen را محقق کند تا در رقابت با DALL-E، نامی درخشان در دنیای هوش مصنوعی تصویرسازی داشته باشد.
✅ NotebookLM را با آواتارهای ویدیویی هوش مصنوعی ارتقا دهد تا به ابزاری بینظیر برای تولیدکنندگان محتوا و بازاریابان تبدیل شود.
✅ فراتر از تبلیغات «عصر عاملمحور» حرکت کند و بهجای وعدههای بزرگ، پیشرفتهای واقعی و ملموس را در بهرهوری کاربران ارائه دهد.
✅ همکاری بین Tensor و دستگاههای Pixel را به حداکثر برساند تا نشان دهد که هوش مصنوعی دروندستگاهی میتواند چقدر قدرتمند باشد.
اگر گوگل این مسیر را به درستی طی کند، در سال ۲۰۲۵ میتواند جایگاه خود را به عنوان پیشگام بیچونوچرای هوش مصنوعی تثبیت کند.
Lumiere فناوری جدید تولید ویدیو با هوش مصنوعی گوگل است که قرار است رقیب سورا باشد. لومیر برای پیشی گرفتن از Sora باید ویدیوهای طولانیتر، باکیفیتتر و داستانسرایی بهتری ارائه دهد. همچنین، ترکیب آن با تخصص گوگل در جستجو میتواند باعث تولید ویدیوهای منسجمتر و با زمینهی دقیقتر شود.
NotebookLM در حال حاضر یک دستیار تحقیقاتی سریع و هوشمند است که میتواند اطلاعات را خلاصه کند و حتی پادکستهای مجازی تعاملی ایجاد کند. اما با افزودن آواتارهای ویدیویی مجازی (مانند آنچه در Synthesia دیده میشود)، میتواند محتوای جذابتری برای تولیدکنندگان محتوا و بازاریابان ایجاد کند و تجربهی کاربری را به سطح جدیدی ببرد.
تراشهی تنسور به گوگل امکان کنترل کامل سختافزار و نرمافزار را میدهد. اگر گوگل سرعت، کارایی و ویژگیهای هوش مصنوعی را در Tensor بهبود دهد، میتواند تجربههایی مانند ترجمهی زنده، پردازش تصویر پیشرفته و تعاملات عاملمحور هوشمندتر را بهبود بخشد. همچنین، کاهش وابستگی به پردازش ابری میتواند امنیت و سرعت اجرای وظایف هوش مصنوعی روی دستگاه را افزایش دهد.
منبع: androidpolice
نظر شما درباره سلطهی گوگل بر دنیای هوش مصنوعی چیست؟ آیا چنین چیزی محقق میشود؟ دیدگاه خود را در بخش کامنتها با تکراتو به اشتراک بگذارید و اخبار تکنولوژی را با ما دنبال کنید.
تکنولوژی
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید