شرکت DeepSeek با ارائه مدل R1 سر و صدای زیادی در صنعت هوش مصنوعی به پا کرده است. مدلهای هوش مصنوعی این شرکت در بسیاری از معیارها عملکردی برابر یا حتی بهتر از رقبا دارند. اما آنچه بیش از همه توجهها را جلب کرده، ادعای شرکت دربارهی هزینهی پایین آموزش مدلهایش است. با این حال، برخی کارشناسان به این ادعا شک دارند؛ بطوریکه یکی از تحلیلگران هزینه پایین آموزش هوش دیپسیک یک داستان ساختگی مینامد.
بهگزارش تکراتو به نقل از androidheadlines، شرکتهای غربی که در زمینهی هوش مصنوعی فعالیت میکنند، معمولا صدها میلیون دلار را صرف آموزش مدلهای خود میکنند. حتی برآورد شده که نسل جدید مدلهای پیشرفته به میلیاردها دلار سرمایهگذاری نیاز دارند.
اما DeepSeek AI مدعی شده که پیشرفتهترین مدل خود به نام R1 را تنها با ۶ میلیون دلار آموزش داده و این کار را ظرف چند ماه انجام داده است.
این شرکت میگوید که برای کاهش هزینهی آموزش، بهجای استفاده از سختافزارهای مدرن، به تراشههای قدیمیتر انویدیا H800 روی آورده است. همچنین، همکاری نزدیک شرکتهای هوش مصنوعی در چین را عاملی برای کاهش هزینه میداند.
اما دن آیوز، تحلیلگر مؤسسهی Wedbush، این ادعا را «احتمالا داستانی ساختگی» خوانده است. برای مقایسه، آموزش مدل GPT-4 شرکت OpenAI حدود ۱۰۰ میلیون دلار هزینه داشته است.
علاوه بر این، OpenAI گمان میکند که DeepSeek در فرآیند آموزش مدل خود از یک «میانبر» استفاده کرده است. احتمال دارد این شرکت چینی دادههای مدلهای GPT را با استفاده از تکنیک تقطیر دانش (Distillation) در سیستم خود ادغام کرده باشد.
این روش میتواند منابع زیادی را برای دیپسیک صرفهجویی کند، اما قوانین استفادهی OpenAI چنین کاری را ممنوع کرده است. این شرکت به توسعهدهندگان اجازه میدهد که اپلیکیشنهایی بر پایهی API آن بسازند، اما استخراج داده از مدلهایش برای آموزش دیگر مدلهای زبانی را مجاز نمیداند.
در کنار هزینهی آموزش، سختافزاری که دیپسیک برای این کار استفاده کرده نیز مورد بحث است. الکساندر وانگ، مدیرعامل شرکت Scale AI، گفته که دیپ سیک حدود ۵۰ هزار تراشهی انویدیا H100 دارد، اما نمیتواند دربارهی آن صحبت کند، چراکه قوانین تجاری ایالات متحده، خرید این تراشهها را برای شرکتهای چینی ممنوع کرده است. ایلان ماسک نیز در واکنش به این ادعا، در پلتفرم X (توییتر) تنها یک کلمه نوشت: «بدیهی است».
جاش کوشنر، بنیانگذار Thrive Capital و از سرمایهگذاران اصلی OpenAI، نیز معتقد است که دیپسیک احتمالا قوانین تجاری آمریکا را نقض کرده است. همچنین، پالمر لاکی، بنیانگذار Oculus، یکی دیگر از چهرههای سرشناسی است که نسبت به هزینهی اعلامشدهی کمتر از ۶ میلیون دلار از سوی DeepSeek ابراز تردید کرده است. علاوه بر این، یکی از مقامات آمریکایی اخیراً ادعا کرده که دیپسیک از فناوری دزدیدهشدهی آمریکا استفاده کرده است.
نکتهی قابل توجه این است که دیپسیک از نظر مالی پشتوانهی قدرتمندی دارد. این شرکت تحت حمایت صندوق سرمایهگذاری High-Flyer چین قرار دارد که ارزشی ۸ میلیارد دلاری دارد. بیل آکمن، میلیاردر معروف، احتمال داده است که ادعای هزینهی پایین دیپسیک یک استراتژی High-Flyer برای ایجاد سقوط در سهام شرکتهایی مانند انویدیا باشد.
هوش مصنوعی
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید