تک فان

تک فان

مجله خبری تفریحی: دنیای سرگرمی و تفریح
امروز: شنبه , ۴ اسفند , ۱۴۰۳
X
۵ گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

۵ گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

دنیای هوش مصنوعی به سرعت در حال تحول است. گوگل در سال ۲۰۲۴ با توسعه‌ی جمینی، معرفی NotebookLM و گسترش ادغام هوش مصنوعی در سرویس‌های Workspace، روند رو به رشدی را آغاز کرد. اما برای اینکه بتواند در سال ۲۰۲۵ رهبری این حوزه را به دست بگیرد، باید به وعده‌های خود عمل کند.

در این مقاله بررسی می‌کنیم که چگونه گوگل می‌تواند با پیشی گرفتن از سورا (Sora – مدل مولد ویدیوی OpenAI) از طریق فناوری لومیر (Lumiere)، بهبود Imagen و ارتقای NotebookLM با آواتارهای ویدیویی هوش مصنوعی، به این هدف برسد.

راهنمای خرید تکراتوراهنمای خرید تکراتو

گوگل باید فراتر از تبلیغات پر زرق و برق پیرامون «هوش مصنوعی عامل‌محور» حرکت کند و به جای آن، پیشرفت‌های واقعی و ملموسی را در بهره‌وری کاربران در سراسر اکوسیستم محصولات خود ارائه دهد. این شرکت می‌تواند با ترکیب پردازنده‌های تنسور و دستگاه‌های پیکسل، توانایی‌های هوش مصنوعی درون‌دستگاهی را به نمایش بگذارد و قدرت خود را در عرصه‌ی گوشی‌های اندرویدی اثبات کند.

۱٫ پیشی گرفتن از Sora

Lumiere باید غوغا به پا کند 

5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

مدل ویدیوسازی Sora از OpenAI توجه زیادی را به خود جلب کرده است، زیرا می‌تواند ویدیوهایی تا ۶۰ ثانیه بسازد. در حالی که بسیاری از مدل‌های قبلی در ایجاد صحنه‌های پیچیده و حرکات واقعی مشکل داشتند، Sora نشان داده که در این زمینه امیدبخش است. اگرچه این مدل فقط در دسترس کاربران پولی GPT-4 قرار دارد، اما بدون شک تاثیرگذار و هیجان‌انگیز است و برای OpenAI اعتبار زیادی به همراه داشته است.

گوگل برای رقابت باید تلاش‌های خود در حوزه‌ی ویدیوسازی با هوش مصنوعی را سرعت ببخشد و از سورا جلو بزند. Lumiere که پاسخ گوگل به Sora محسوب می‌شود، باید شاهکار باشد. این مدل می‌تواند با ارائه‌ی روایتی بصری و جذاب از طریق ورودی‌های متنی ساده، خود را متمایز کند. گوگل همچنین می‌تواند از تخصص خود در جستجوی هوشمند برای بهبود زمینه و انسجام محتوای تولیدشده استفاده کند. حالا اگر Lumiere بتواند ویدیوهای طولانی‌تری نیز بسازد، آن‌وقت برگ برنده‌ی گوگل در این رقابت خواهد بود.

بیشتر بخوانید: آموزش استفاده از جمینای گوگل؛ راهنمای جامع کار با هوش مصنوعی گوگل برای تازه‌کارها

۲٫ بازطراحی دوباره‌ی Imagen

رقابت با DALL-E می‌تواند منتقدان را ساکت کند 

5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

محافظت از این سیستم در برابر تهدیدات مخرب مانند دیپ‌فیک قابل درک است، اما این که این مدل در گذشته به دلیل تعصبات الگوریتمی مورد انتقاد قرار گرفته، پذیرش آن را دشوار کرده است. با این حال، نشانه‌هایی وجود دارد که Imagen در حال بهتر شدن است.

چند ماه پیش، نسخه‌ی جدیدی از Imagen منتشر شد، اما نتایج آن متفاوت بود. بسیاری از تصاویر تولید شده بیش از حد محتاطانه، معمولی یا غیرجذاب بودند. البته استثناهایی هم وجود داشت؛ به عنوان مثال، وقتی از این مدل خواسته شد: «یک تصویر شگفت‌انگیز از یک اکوسیستم کامل بساز»، نتیجه‌ی آن یک تصویر سورئال زیبا بود. این تجربه نشان می‌دهد که گوگل به بهبود Imagen ادامه خواهد داد.

اگر گوگل بتواند یاد بگیرد که چگونه تصاویر جذاب و واقعی از افراد ایجاد کند، بدون اینکه در دام مشکلات اخلاقی و تعصبات بیفتد، Imagen می‌تواند هم‌سطح DALL-E شود و برگ برنده‌ی گوگل در رقابت‌های هوش مصنوعی ۲۰۲۵ باشد.

۳٫ ارتقای NotebookLM با میزبان‌های ویدیویی هوش مصنوعی

NotebookLM می‌تواند با ارائه‌دهندگان ویدیویی بهتر شود 

5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

NotebookLM تاثیر زیادی روی بهره‌وری شخصی و کاری کاربران داشته است. این یک دفترچه‌ی یادداشت هوش مصنوعی است که می‌توان آن را با داده‌های شخصی آموزش داد. مزیت اصلی‌اش این است که بدون سر و صدای اینترنت کار می‌کند و به یک دستیار تحقیقاتی فوق‌العاده سریع تبدیل شده است.

یکی از قابلیت‌های جالب آن، ایجاد پادکست‌های مجازی جذاب بر اساس یادداشت‌ها، لینک‌ها و منابع مختلف است. مکالماتی که ایجاد می‌کند، طبیعی و تعاملی به نظر می‌رسند و سطحی از واقع‌گرایی پویا را ارائه می‌دهد که مشابهی ندارد.

اما یک ویژگی مهم در آن کم است: امکان تولید پادکست‌های ویدیویی با مجری‌های مجازی. اگر گوگل بتواند قابلیتی مشابه Synthesia به NotebookLM اضافه کند، محتوای تولیدشده را بسیار جذاب‌تر و مفیدتر خواهد کرد. این ویژگی می‌تواند به تولیدکنندگان محتوا و بازاریابان کمک کند تا سریع‌تر ویدیوهای باکیفیت بسازند.

NotebookLM در حال حاضر هم ارزش زیادی دارد، اما اگر گوگل ویژگی خروجی ویدیویی را به آن اضافه کند، سطح جدیدی از تجربه‌ی کاربری را رقم خواهد زد.

بیشتر بخوانید: آموزش حذف فعالیت های اخیر در جمینای ؛ چگونه فعالیت‌های اخیر خود را از Google Gemini پاک کنیم؟

۴٫ گوگل باید ثابت کند که «عصر عامل‌محور» فقط یک شعار تبلیغاتی نیست

هوش مصنوعی عامل‌محور ایده‌ی جذابی است، اما گوگل باید آن را به واقعیت تبدیل کند 

5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

«عصر عامل‌محور» (Agentic Era) در هوش مصنوعی که شامل سیستم‌های هوش مصنوعی پیشرفته و تعاملی است، نویدبخش تحولاتی مانند مدیریت زنجیره‌های تامین پیچیده است. اما تا این لحظه، راهکارهای عامل‌محور بیشتر شبیه به نسخه‌ی تقویت‌شده‌ی گوگل اسیستنت به نظر می‌رسند تا یک انقلاب واقعی.

گوگل با داشتن مالکیت کامل بر زیرساخت‌های نرم‌افزاری و سخت‌افزاری خود و دسترسی به حجم عظیمی از داده‌ها برای درک زمینه و هدف کاربران، در موقعیتی منحصربه‌فرد قرار دارد تا ثابت کند که «عصر عامل‌محور» فقط یک اصطلاح جذاب یا روشی جدید برای کنترل اسپیکرهای هوشمند نیست.

در آینده، هوش مصنوعی عامل‌محور باید بتواند وظایف پیچیده‌تری را به‌طور پیشگیرانه انجام دهد و فراتر از اکوسیستم Workspace گسترش یابد. به عنوان مثال، باید قابلیت‌هایی مانند پیش‌نویس خودکار ایمیل‌ها، پیشنهاد زمان مناسب برای جلسات و همکاری در آماده‌سازی اسناد را به‌صورت هوشمند ارائه دهد.

جمینی سرعت بالایی در اسکن اطلاعات از ورک‌اسپیس دارد و سعی می‌کند به‌صورت مستقل زمینه‌ی درخواست‌ها درک کند. این یک پیشرفت جالب است، زیرا به نظر می‌رسد که گوگل در حال ترکیب دانش عمومی اینترنتی جمینی با قابلیت‌های تحلیل داده‌ی شخصی در NotebookLM است. البته، تا این لحظه، نتایج این جستجوهای خودکار چندان چشمگیر نبوده است.

امیدوارم گوگل به زودی به یک لحظه‌ی طلایی در زمینه‌ی هوش مصنوعی عامل‌محور برسد و نشان دهد که این فناوری واقعا چه توانایی‌هایی دارد.

۵٫ قدرت واقعی تنسور و پیکسل ۱۰ را به ما نشان دهید

مالکیت کامل اکوسیستم، یک مزیت رقابتی بزرگ است 

5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد5 گام اساسی که گوگل باید برای سلطه‌ی جمینی بر دنیای هوش مصنوعی بردارد

تراشه‌ی Tensor و گوشی‌های Pixel به آن مجهز می‌شوند، مزیتی بزرگ برای گوگل محسوب می‌شوند. مالکیت کامل اکوسیستم، از نرم‌افزار تا سخت‌افزار، به گوگل این امکان را می‌دهد که بهینه‌سازی‌های عمیقی انجام دهد، داده‌های منحصر‌به‌فردی را تحلیل کند و قابلیت‌های هوش مصنوعی خود را در سطح بالاتری ارائه دهد.

ترکیب سخت‌افزار و نرم‌افزار در پردازنده‌ی Tensor باعث ایجاد قابلیت‌های نوآورانه‌ای مانند ترجمه‌ی زنده، پردازش پیشرفته‌ی تصاویر و تجربه‌های شخصی‌سازی‌شده‌ی کاربر شده است. اکنون، گوگل باید از این پردازنده و گوشی‌های هوشمندش برای ارائه‌ی یک اکوسیستم کامل هوش مصنوعی استفاده کند.

یکی از چالش‌های اساسی، کاهش وابستگی به پردازش ابری است. گوگل باید نشان دهد که چگونه پردازش‌های هوش مصنوعی را می‌توان مستقیما روی دستگاه انجام داد تا مشکلاتی مانند تاخیر، حریم خصوصی و اتصال به اینترنت بهبود یابند.

با این حال، تراشه‌ی Tensor تاکنون نتوانسته انتظارات را برآورده کند. برخی کاربران از عملکرد پایین‌تر آن نسبت به رقبا و کمبود ویژگی‌های انقلابی مبتنی بر هوش مصنوعی انتقاد کرده‌اند.

دوست دارم ببینم که گوگل در پیکسل ۱۰، تمرکز بیشتری روی قابلیت‌های هوش مصنوعی تنسور داشته باشد. این یعنی بهبود سرعت و کارایی پردازش‌ها، همراه با ویژگی‌های نوآورانه‌ای که قدرت واقعی هوش مصنوعی درون‌دستگاهی را به نمایش بگذارد.

بیشتر بخوانید: آموزش استفاده از قابلیت Task در چت جی پی تی [آموزش تصویری]

آینده‌ی هوش مصنوعی گوگل چه خواهد شد؟

برای اینکه گوگل بتواند در دنیای پرشتاب هوش مصنوعی به رهبر بی‌رقیب تبدیل شود، باید در سال ۲۰۲۵ از نقاط قوت خود بیشترین استفاده را ببرد:

✅ با Lumiere از Sora پیشی بگیرد و استانداردهای جدیدی در تولید ویدیو با هوش مصنوعی تعریف کند.

✅ پتانسیل کامل Imagen را محقق کند تا در رقابت با DALL-E، نامی درخشان در دنیای هوش مصنوعی تصویرسازی داشته باشد.

✅ NotebookLM را با آواتارهای ویدیویی هوش مصنوعی ارتقا دهد تا به ابزاری بی‌نظیر برای تولیدکنندگان محتوا و بازاریابان تبدیل شود.

✅ فراتر از تبلیغات «عصر عامل‌محور» حرکت کند و به‌جای وعده‌های بزرگ، پیشرفت‌های واقعی و ملموس را در بهره‌وری کاربران ارائه دهد.

✅ همکاری بین Tensor و دستگاه‌های Pixel را به حداکثر برساند تا نشان دهد که هوش مصنوعی درون‌دستگاهی می‌تواند چقدر قدرتمند باشد.

اگر گوگل این مسیر را به درستی طی کند، در سال ۲۰۲۵ می‌تواند جایگاه خود را به عنوان پیشگام بی‌چون‌وچرای هوش مصنوعی تثبیت کند.

سوالات متداول

لومیر (Lumiere) چیست و چگونه می‌تواند از مدل هوش مصنوعی مولد ویدیوی سورا از OpenAI پیشی بگیرد؟

Lumiere فناوری جدید تولید ویدیو با هوش مصنوعی گوگل است که قرار است رقیب سورا باشد. لومیر برای پیشی گرفتن از Sora باید ویدیوهای طولانی‌تر، باکیفیت‌تر و داستان‌سرایی بهتری ارائه دهد. همچنین، ترکیب آن با تخصص گوگل در جستجو می‌تواند باعث تولید ویدیوهای منسجم‌تر و با زمینه‌ی دقیق‌تر شود.

چگونه Google NotebookLM می‌تواند با آواتارهای ویدیویی بهبود یابد؟

NotebookLM در حال حاضر یک دستیار تحقیقاتی سریع و هوشمند است که می‌تواند اطلاعات را خلاصه کند و حتی پادکست‌های مجازی تعاملی ایجاد کند. اما با افزودن آواتارهای ویدیویی مجازی (مانند آنچه در Synthesia دیده می‌شود)، می‌تواند محتوای جذاب‌تری برای تولیدکنندگان محتوا و بازاریابان ایجاد کند و تجربه‌ی کاربری را به سطح جدیدی ببرد.

گوگل چگونه می‌تواند از پردازنده‌ی تنسور برای تقویت هوش مصنوعی روی گوشی‌های پیکسل استفاده کند؟

تراشه‌ی تنسور به گوگل امکان کنترل کامل سخت‌افزار و نرم‌افزار را می‌دهد. اگر گوگل سرعت، کارایی و ویژگی‌های هوش مصنوعی را در Tensor بهبود دهد، می‌تواند تجربه‌هایی مانند ترجمه‌ی زنده، پردازش تصویر پیشرفته و تعاملات عامل‌محور هوشمندتر را بهبود بخشد. همچنین، کاهش وابستگی به پردازش ابری می‌تواند امنیت و سرعت اجرای وظایف هوش مصنوعی روی دستگاه را افزایش دهد.

منبع: androidpolice

نظر شما درباره سلطه‌ی گوگل بر دنیای هوش مصنوعی چیست؟ آیا چنین چیزی محقق می‌شود؟ دیدگاه خود را در بخش کامنت‌ها با تکراتو به اشتراک بگذارید و اخبار تکنولوژی را با ما دنبال کنید.

منبع

ارسال دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

طراحی و اجرا : وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است