شرکت اپل یکی از پیشرفتهترین پروژههای تحقیقاتی خود در حوزه هوش مصنوعی را معرفی کرده است. این مدل که با نام شارپ (SHARP) شناخته میشود، قادر است تنها با یک تصویر دوبعدی، صحنهای سهبعدی و زنده بسازد. انتشار متنباز این فناوری میتواند تجربههای واقعیت افزوده (AR) و واقعیت مجازی (VR) را متحول کند و زمینه همکاری گسترده توسعهدهندگان را فراهم آورد.
در اصل، شارپ (SHARP) به کاربران این امکان را میدهد که یک تصویر معمولی را از زاویههای مختلف مشاهده کنند؛ گویی خودشان درون صحنه حضور دارند. این فناوری تنها با فیلترهای عمق مصنوعی کار نمیکند، بلکه یک بازنمایی سهبعدی واقعی از تصویر میسازد که هنگام مشاهده از چند زاویه متفاوت، طبیعی و زنده به نظر میرسد. برای اپل، این پروژه نمونهای تازه از تواناییهای روبهرشد در زمینه بینایی رایانهای و تحقیقات هوش مصنوعی است؛ حوزههایی که از عکاسی آیفون گرفته تا توسعه قابلیتهای واقعیت افزوده و واقعیت مجازی در محصولات این شرکت نقش کلیدی دارند.
بر اساس توضیحات تیم تحقیقاتی اپل، مدل شارپ (SHARP) یک تصویر را تحلیل کرده و پیشبینی میکند که عکس در حالت سه بعدی چگونه خواهد بود. سپس یک نقشه سهبعدی سبک ایجاد میکند که از میلیونها نقطه داده کوچک به نام «گوسی» تشکیل شده است. هر گوسی مانند حبابی رنگی و نورانی در فضا قرار میگیرد و در کنار هم صحنهای پویا و واقعی میسازند. این بازسازی باعث میشود هنگام حرکت دوربین مجازی به سمت چپ یا راست، پسزمینه بهطور طبیعی تغییر کند؛ مشابه زمانی که سر خود را در دنیای واقعی کمی کج میکنید.

برخلاف روشهای سنتی بازسازی سهبعدی که نیازمند دهها یا صدها عکس از زوایای مختلف هستند، شارپ (SHARP) کل فرآیند را تنها با یک تصویر آن هم در کمتر از یک ثانیه با استفاده از یک GPU استاندارد انجام میدهد. پژوهشگران اپل تأکید کردهاند که این سیستم تکمرحلهای، تفاوت اصلی شارپ (SHARP) با روشهای قدیمی است که به پردازش طولانی و سختافزار ویژه نیاز داشتند.
البته شارپ (SHARP) برای ساخت جهانهای سهبعدی کامل یا پر کردن بخشهایی از تصویر که وجود ندارند طراحی نشده است. این مدل تنها تغییر زاویههای محدود را ممکن میکند و نمیتوان بهطور کامل در صحنه حرکت کرد. اپل در مقاله پژوهشی خود این محدودیت را پذیرفته و توضیح داده که هدف اصلی حفظ واقعگرایی است، نه افزودن جزئیات خیالی.
با وجود این محدودیت، کاربردهای شارپ (SHARP) بسیار گستردهاند. این فناوری میتواند پایهای برای عکسهای فضایی جدید، تجربههای AR و VR یا جلوههای بصری پیشرفته باشد که تصاویر روزمره را زندهتر و پویاتر نشان میدهند. اپل پیشتر قابلیتهایی مشابه را در آیفون ۱۵ پرو مانند ثبت عکسهای فضایی یا اعمال افکتهای عمیق روی تصاویر معمولی اعمال کرده بود. شارپ (SHARP) میتواند این تجربهها را سریعتر، دقیقتر و در دسترستر کند.
شاید شگفتانگیزترین بخش این معرفی آن باشد که اپل تصمیم گرفته شارپ (SHARP) را متنباز کند. با انتشار کد و مقاله پژوهشی بهصورت عمومی، اپل از توسعهدهندگان و پژوهشگران دعوت کرده تا این فناوری را آزمایش، توسعه و بر پایه آن پروژههای جدید بسازند. این اقدام برای شرکتی مانند اپل که معمولاً پروژههای پیشرفته خود را محرمانه نگه میدارد، حرکتی کمسابقه محسوب میشود.
دیدگاهتان را بنویسید