آیا ChatGPT سرقت ادبی می کند؟ بررسی منابع چت بات

ChatGPT به دلیل روش های آموزشی بدنام است، اما آیا این بدان معناست که در واقع کار را کپی می کند؟

خلاصه عناوین

سرقت ادبی دقیقاً چیست و LLM چگونه کار می کند؟

آیا ChatGPT مقالات را سرقت ادبی می کند؟

آیا ChatGPT کد سرقت ادبی می کند؟

آیا ChatGPT راه حل های ریاضی را سرقت می کند؟

آیا ChatGPT از محتوای وبلاگ ها استفاده می کند؟

آیا باید از ChatGPT برای محل کار یا مدرسه استفاده کنید؟

نکات کلیدی

سرقت ادبی شناسایی شده در یک مقاله و یک کد برنامه‌نویسی تولید شده توسط ChatGPT نسبتاً کم بود، که نشان می‌دهد معمولاً چنین محتوایی را از منابع آنلاین کپی نمی‌کند.
میزان سرقت ادبی هنگام محاسبه یک راه حل ریاضی کمی بیشتر بود. این ممکن است به این دلیل باشد که استدلال ریاضی معمولاً در منابع مشابه است، بنابراین پاسخ ها می توانند با مواد دیگر مطابقت داشته باشند.
پاسخ‌های ChatGPT به سؤالات مربوط به اطلاعات عمومی در دسترس در وبلاگ‌ها، درصد سرقت ادبی بالاتری را نشان داد.

در حالی که ChatGPT می تواند به هر سؤالی که ممکن است داشته باشید پاسخ دهد، برخی از کاربران تعجب می کنند که آیا پاسخ های آن حاوی سرقت ادبی است یا خیر. برای بررسی این موضوع، ما چهار نوع متن مختلف را با استفاده از ChatGPT تولید کردیم و سپس اصالت آنها را با استفاده از ابزارهای مختلف تشخیص سرقت ادبی ارزیابی کردیم.

سرقت ادبی دقیقاً چیست و LLM چگونه کار می کند؟

برای تعیین اینکه آیا ChatGPT مقصر سرقت ادبی است، ابتدا باید بفهمید که چه چیزی سرقت ادبی است. سرقت ادبی شامل استفاده از کلمات، ایده ها یا آثار شخص دیگری بدون ذکر منبع مناسب است. این شامل کپی مستقیم متن از یک منبع بدون ذکر منبع یا بازنویسی دقیق ایده های دیگران بدون تایید است.

ChatGPT، مانند دیگر مدل‌های زبان بزرگ (LLM)، بر روی مجموعه داده‌های بزرگ، عمدتاً از محتوای در دسترس عموم، آموزش داده می‌شود. با این حال، جمع‌آوری چنین حجم وسیعی از داده‌ها سؤالات اخلاقی را ایجاد می‌کند، زیرا سازندگان اصلی موافقت نکرده‌اند که کارشان در آموزش LLM استفاده شود. این منجر به بحث هایی در مورد اخلاق و قانونی بودن چنین اعمالی می شود.

اگرچه ChatGPT بر اساس اعلان‌هایی که دریافت می‌کند، پاسخ‌ها را تولید می‌کند، اما مسئله در زمینه گسترده‌تر اینکه چگونه OpenAI (توسعه‌دهنده ChatGPT) داده‌های مورد استفاده برای آموزش آن را به‌دست آورده است، که شامل استفاده از محتوا بدون رضایت مناسب است. بسیاری این را سرقت ادبی و برای بسیاری از وب سایت ها سرقت محتوا می دانند. با این حال، تعیین منابع دقیق سرقت ادبی دشوار است.

مطلب مرتبط: توکن های اجتماعی چیست؟ چطورکار می کنند؟

در ادامه این مقاله، ما بر روی این موضوع تمرکز خواهیم کرد که آیا ChatGPT خروجی خود را از منابع دیگر سرقت می‌کند، بدون اینکه به جزئیات پاسخ‌هایش بپردازیم. بیایید اصالت پاسخ‌های ChatGPT را با استفاده از ابزارهای مختلف تشخیص سرقت ادبی بررسی کنیم تا ببینیم آیا چت بات مستقیماً از متن منابع آنلاین استفاده می‌کند یا خیر.

آیا ChatGPT مقالات را سرقت ادبی می کند؟

در این مثال اول، ما به ChatGPT وظیفه داشتیم تا یک مقاله 300 کلمه ای در مورد مسائل مربوط به سلامت روان بنویسد.

به دنبال آن، ما از ابزارهای مختلف تشخیص سرقت ادبی برای ارزیابی اصالت مقاله تولید شده توسط چت بات استفاده کردیم. این ابزارها شامل جستجوگر سرقت ادبی Quetext، جستجوگر سرقت ادبی داخلی مایکروسافت ورد، جستجوگر سرقت ادبی Grammarly و اسکنر سرقت ادبی Duplichecker بود.

بررسی کننده تشابه داخلی مایکروسافت، شباهت صفر درصدی را با منابع آنلاین گزارش کرده است. سطوح سرقت ادبی شناسایی شده توسط ابزارهای دیگر نیز حداقل بود: آشکارساز سرقت ادبی Grammarly چهار درصد، آشکارساز سرقت ادبی QueText پنج درصد، و اسکنر سرقت ادبی Duplichecker صفر درصد را نشان داد.

با توجه به درصد کمی از سرقت ادبی شناسایی شده، به نظر می رسد که ChatGPT مستقیماً مقالات را از منابع موجود کپی نمی کند.

آیا ChatGPT کد سرقت ادبی می کند؟

برای ارزیابی اینکه آیا ChatGPT سرقت کد را سرقت می کند یا خیر، ما به chatbot وظیفه نوشتن کد برای یک ماشین حساب در پایتون را دادیم.

به دنبال آن، ما یک بررسی سرقت ادبی روی کد با استفاده از یک برنامه نویسی تخصصی بررسی سرقت ادبی به نام Dolos انجام دادیم که شباهت صفر درصد را تشخیص داد. همچنین، زمانی که کد را با استفاده از ابزارهای تشخیص سرقت ادبی متنی که در بالا ذکر شد بررسی کردیم، نتایج یکسان بود و تقریباً هیچ یک از برنامه‌ها بیش از چهار درصد سرقت ادبی را شناسایی نکردند.

هنگامی که از ChatGPT خواستیم یک کد برای یک ماشین حساب از حساب های مختلف ایجاد کند، پاسخ ها متفاوت به نظر می رسید. این مشاهدات و نتایج بررسی‌های سرقت ادبی نشان می‌دهد که ChatGPT به سادگی کدها را از منابع آنلاین تکرار نمی‌کند. در عوض، از مجموعه داده‌ای استفاده می‌کند که روی آن آموزش داده شده است تا به طور مستقل کد تولید کند.

مطلب مرتبط: NFT های هنری مولد چیست؟

آیا ChatGPT راه حل های ریاضی را سرقت می کند؟

در طول آزمون سوم، ما به چت بات وظیفه دادیم تا یک مسئله ریاضی را حل کند و برای هر مرحله استدلال دقیق ارائه دهد.

برای بررسی اصالت پاسخ، خروجی آن را با استفاده از چندین ابزار تشخیص سرقت علمی خاص دانشگاهی، از جمله جستجوگر سرقت ادبی PapersOwl، اسکنر سرقت ادبی Trinka مبتنی بر هوش مصنوعی، و همچنین ابزارهای بررسی سرقت علمی عمومی مانند Grammarly، Duplichecker، و QueText، آزمایش کردیم.

آشکارساز سرقت ادبی PapersOwl شباهت تقریباً 46 درصدی را بین استدلال تولید شده چت بات و منابع آنلاین نشان داد. به طور مشابه، آشکارساز سرقت ادبی Trinka بیش از 10 درصد شباهت را گزارش کرد. علاوه بر این، آشکارساز سرقت ادبی Grammarly 14 درصد شباهت، QueText 17 درصد، و Duplichecker هفت درصد را نشان داد.

تشخیص سرقت ادبی بالا در پاسخ تولید شده نشان نمی‌دهد که چت بات مستقیماً استدلال سؤالات ریاضی را از منابع آنلاین کپی می‌کند. این عمدتاً به این دلیل است که راه‌حل‌ها و استدلال‌ها برای مسائل ریاضی اغلب استاندارد هستند و به طور گسترده به صورت آنلاین در دسترس هستند.

بنابراین، اگرچه ChatGPT پاسخ‌های خاص خود را ارائه می‌کند، یافتن پاسخ‌ها و استدلال‌های مشابه به صورت آنلاین امکان‌پذیر است، که ممکن است به درصد سرقت ادبی بالا اضافه شود.

آیا ChatGPT از محتوای وبلاگ ها استفاده می کند؟

برای بررسی اینکه آیا ChatGPT از محتوای وبلاگ‌های آنلاین استفاده می‌کند، از ربات چت خواستیم نکاتی را برای حفظ سلامت باتری لپ‌تاپ ارائه دهد.

مایکروسافت ورد 10 درصد سرقت ادبی را در متن تولید شده شناسایی کرد. Duplichecker چهار درصد را نشان داد، جستجوگر Grammarly’s Plagiarism نشان داد 14 درصد، اما Quetext 58 درصد سرقت ادبی را در متن یافت. پس از حفاری بیشتر، برخی از متن در پاسخ ربات چت با محتوای برخی از وبلاگ ها مطابقت داشت.

برای اینکه دوباره بررسی کنم که آیا تشخیص سرقت علمی زیاد تصادفی نبوده است، از چت بات چند سؤال دیگر درباره اطلاعاتی که به راحتی آنلاین در دسترس است پرسیدم. درصد سرقت ادبی در پاسخ های ایجاد شده بسیار بیشتر بود. بر اساس آزمایش ما، به نظر می رسد که ربات چت گاهی از عبارات و متن از منابع آنلاین استفاده می کند، که بسیار تعجب آور است.

مطلب مرتبط: راهنمای والدین برای ChatGPT و هوش مصنوعی مولد

آیا باید از ChatGPT برای محل کار یا مدرسه استفاده کنید؟

اگرچه بسیاری از بررسی‌کننده‌های سرقت علمی رایگان آنلاین، سرقت ادبی عمده را در پاسخ‌های ChatGPT شناسایی نکرده‌اند، شما نباید از آن برای اهداف آکادمیک یا حرفه‌ای استفاده کنید.

اگر دانش آموز هستید، از ChatGPT برای تکالیف مدرسه خود استفاده نکنید. مربیان می توانند از ابزارهایی مانند GPTZero و آشکارساز نوشتن هوش مصنوعی Turnitin برای شناسایی محتوای تولید شده توسط هوش مصنوعی استفاده کنند. اگر کار شما به‌عنوان AI تولید شده توسط چنین ابزارهایی علامت‌گذاری شود، ممکن است در انجام تکلیف شکست بخورید یا حتی از مدرسه اخراج شوید. اگرچه بسیاری از ابزارهای تشخیص GPT به طور خاص بیان می‌کنند که نباید برای این منظور استفاده شوند، اما می‌توانند شما را به دردسر بیاندازند. ناگفته نماند، شما واقعاً با مطالعه نکردن درست موضوع، خود را فریب می دهید.

آیا می توانید از چت بات برای بهبود عملکرد کاری خود استفاده کنید؟ بستگی دارد. اگر می‌خواهید جریان نوشتار خود را در ایمیل‌ها یا سایر فرم‌های متنی بهبود ببخشید، استفاده از هوش مصنوعی می‌تواند در وقت و تلاش شما صرفه‌جویی کند. با این حال، شما فقط باید از آن به عنوان ابزاری برای کمک به شما در کارهایتان استفاده کنید نه اینکه به آن تکیه کنید تا کل کار را برای شما انجام دهد.

در مقابل، اگر شغل شما، مانند نوشتن حرفه ای، استفاده از چنین ابزارهایی را ممنوع می کند، باید از ChatGPT یا هر ابزار دیگری به طور کامل اجتناب کنید.

امیدواریم، آزمایش ما به شما بینشی در مورد میزان استفاده از ChatGPT از منابع موجود در وب داده باشد. با این حال، مهم است که توجه داشته باشید که ما از ابزار سرقت ادبی رایگان استفاده کرده‌ایم و تنها مجموعه داده محدودی را آزمایش کرده‌ایم. بنابراین، اگرچه یافته‌های ما ممکن است مفید باشد، نباید آنها را به عنوان حقایق مطلق در نظر گرفت.

Tags: چت جی پی تی کپی رایت هوش مصنوعی