به تازگی گزارشهایی منتشر شده که نشان میدهد OpenAI، شرکت چینی DeepSeek را به استفاده از دادههای ChatGPT متهم کرده است.
به گزارش تکراتو به نقل از bgr، پیش از آنکه مدل هوش مصنوعی DeepSeek R1 به شهرت برسد و بازار بورس آمریکا را دچار آشفتگی کند، نسخههای اولیه این فناوری، خود را بهعنوان نسخههایی از ChatGPT معرفی کرده بودند.
پس از آنکه تیم تحقیقاتی چینی مقالهای منتشر کرد که روشهای پیشرفته آموزش این مدل را توضیح میداد، OpenAI ادعا کرد که شرکت چینی DeepSeek از اطلاعات ChatGPT برای آموزش مدلهای خود استفاده کرده است. این اقدام، در تضاد با قوانین استفاده از ChatGPT است.
نکته جالب توجه اینجاست که OpenAI، که خود برای آموزش ChatGPT از حجم عظیمی از دادههای اینترنتی، شامل محتوای دارای کپیرایت، استفاده کرده است، اکنون دیگران را به سرقت اطلاعاتش متهم میکند!
چندی بعد، پژوهشگران امنیتی یک نقص امنیتی بزرگ در DeepSeek کشف کردند که منجر به اولین حمله سایبری گسترده علیه این مدل شد. آنها همچنین شباهتهای بسیاری بین OpenAI و سیستمهای DeepSeek پیدا کردند، حتی در جزئیاتی مانند قالب کلیدهای API که نشان میدهد این شرکت چینی احتمالا از OpenAI الهام زیادی گرفته است.
با ادامه تحقیقات، یک شرکت دیگر نیز اعلام کرده که DeepSeek ممکن است نسخهای تقطیرشده (distilled) از ChatGPT باشد.
شرکت Originality.ai، که در زمینه شناسایی محتوای تولیدشده توسط هوش مصنوعی فعالیت دارد، مقالهای منتشر کرد با عنوان «آیا DeepSeek از ChatGPT کپی کرده و آیا این موضوع قابل شناسایی است؟»
این شرکت برای بررسی این موضوع، آزمایشهایی انجام داد. در این تست، ۱۵۰ ورودی مختلف شامل ۵۰ متن بازنویسیشده، ۵۰ متن انسانی بازنویسیشده، و ۵۰ مقاله تولیدشده از صفر مورد بررسی قرار گرفتند.
نتایج این آزمایش تعجبآور بود؛ مدلهای هوش مصنوعی Originality AI توانستند محتوای تولیدشده توسط DeepSeek را با دقت ۹۹.۳٪ شناسایی کنند.
این نتیجه خبر خوبی برای کسانی است که میخواهند متون را از نظر استفاده از هوش مصنوعی بررسی کنند. با وجود پیشرفتهای DeepSeek، این مدل هنوز نمیتواند این سیستمهای شناسایی را فریب دهد.
آنچه این آزمایش را جالبتر میکند این است که دقت سیستم Originality AI در شناسایی متنهای تولیدشده توسط DeepSeek، از همان ابتدا بسیار بالا بود.
پژوهشگران در مقاله خود نوشتهاند:
هر بار که یک مدل زبانی بزرگ (LLM) جدید عرضه میشود، ما آزمایشی برای ارزیابی عملکرد ابزار شناسایی خود انجام میدهیم. معمولاً دقت اولیه سیستم ما اندکی کاهش مییابد، اما این بار چنین اتفاقی نیفتاد.
در نتیجه، این یافتهها احتمال تقطیر شدن (کپیبرداری) DeepSeek از ChatGPT را افزایش میدهد.
اگر شرکت چینی DeepSeek از اطلاعات ChatGPT برای آموزش مدلهای خود استفاده کرده باشد، بهطور طبیعی متون تولیدی آن از نظر سبک و فرمت، شباهت زیادی به ChatGPT خواهند داشت. از آنجایی که Originality AI بهخوبی قادر به تشخیص متنهای تولیدشده توسط OpenAI است، دقت بالای آن در شناسایی محتوای DeepSeek نشان میدهد که این شرکت چینی احتمالا از ChatGPT برای توسعه مدلهای خود بهره برده است.
هوش مصنوعی
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید