خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

چگونه می توان خزنده های OpenAI را از خراش دادن وب سایت خود مسدود کرد

با کمک این راهنما از خراشیدن وب سایت خود توسط خزنده های OpenAI جلوگیری کنید.

در حالی که کاربران ChatGPT را به خاطر حجم انبوهی از اطلاعاتی که در حال حاضر در اختیار دارد دوست دارند، در مورد صاحبان وب سایت نمی توان همین را گفت.

ChatGPT OpenAI از خزنده‌ها برای خراش دادن وب‌سایت‌ها استفاده می‌کند، اما اگر صاحب وب‌سایت هستید و نمی‌خواهید خزنده OpenAI به وب‌سایت شما دسترسی داشته باشد، در اینجا چند کار وجود دارد که می‌توانید برای جلوگیری از آن انجام دهید.

خزیدن OpenAI چگونه کار می کند؟

خزنده وب (همچنین به عنوان عنکبوت یا ربات موتور جستجو شناخته می شود) یک برنامه خودکار است که اینترنت را برای اطلاعات اسکن می کند. سپس آن اطلاعات را به گونه‌ای جمع‌آوری می‌کند که دسترسی موتور جستجوی شما به آن آسان باشد.

خزنده های وب هر صفحه از هر URL مرتبط را ایندکس می کنند، معمولاً بر روی وب سایت هایی تمرکز می کنند که بیشتر به سؤالات جستجوی شما مرتبط هستند. به عنوان مثال، فرض کنید در حال گوگل کردن یک خطای خاص ویندوز هستید. خزنده وب در موتور جستجوی شما، تمام URL های وب سایت هایی را که به نظرش معتبرتر در مورد خطاهای ویندوز می دانند، اسکن می کند.

خزنده وب OpenAI GPTBot نام دارد و طبق اسناد OpenAI، دسترسی GPTBot به وب سایت شما می تواند به آموزش مدل AI برای ایمن تر و دقیق تر کمک کند و حتی می تواند به گسترش قابلیت های مدل AI کمک کند.

چگونه از خزیدن OpenAI در وب سایت خود جلوگیری کنیم

مانند بسیاری از خزنده های وب دیگر، GPTBot را می توان با تغییر پروتکل robots.txt وب سایت (که به عنوان پروتکل حذف ربات نیز شناخته می شود) از دسترسی به وب سایت شما مسدود کرد. این فایل txt. روی سرور وب سایت میزبانی می شود و نحوه رفتار خزنده های وب و سایر برنامه های خودکار در وب سایت شما را کنترل می کند.

مطلب مرتبط:   پیاده سازی یک Layout با ماژول چند ستونی CSS

در اینجا لیست کوتاهی از کارهایی که فایل robot.txt می تواند انجام دهد آورده شده است:

  • می تواند به طور کامل دسترسی GPTBot را به وب سایت مسدود کند.
  • این می تواند تنها صفحات خاصی از URL را از دسترسی GPTBot مسدود کند.
  • می تواند به GPTBot بگوید کدام پیوندها را می تواند دنبال کند و کدام را نمی تواند.

در اینجا نحوه کنترل آنچه GPTBot می تواند در وب سایت شما انجام دهد آورده شده است:

GPTBot را به طور کامل از دسترسی به وب سایت خود مسدود کنید

  1. فایل robot.txt را تنظیم کنید و سپس آن را با هر ابزار ویرایش متنی ویرایش کنید.
  2. GPTBot را به صورت زیر به robots.txt سایت خود اضافه کنید:

User-agent: GPTBot
Disallow: /

فقط برخی از صفحات را از دسترسی GPTBot مسدود کنید

  1. فایل robot.txt را تنظیم کنید و سپس آن را با ابزار ویرایش متن دلخواه خود ویرایش کنید.
  2. GPTBot را به صورت زیر به robots.txt سایت خود اضافه کنید:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

با این حال، به خاطر داشته باشید که تغییر فایل robot.txt یک راه حل عطف به ماسبق نیست و هرگونه اطلاعاتی که GPTBot ممکن است قبلاً از وب سایت شما جمع آوری کرده باشد قابل بازیابی نخواهد بود.

OpenAI به صاحبان وب سایت اجازه می دهد از خزیدن انصراف دهند

از زمانی که از خزنده ها برای آموزش مدل های هوش مصنوعی استفاده می شود، صاحبان وب سایت ها به دنبال راه هایی برای حفظ خصوصی اطلاعات خود هستند.

برخی می ترسند که مدل های هوش مصنوعی اساساً کار آنها را می دزدند، حتی بازدیدهای کمتر از وب سایت را به این واقعیت نسبت می دهند که اکنون کاربران اطلاعات خود را بدون نیاز به بازدید از وب سایت های خود به دست می آورند.

مطلب مرتبط:   نحوه خواندن و نوشتن فایل های XML با جاوا

در مجموع، اینکه آیا می خواهید چت ربات های هوش مصنوعی را به طور کامل از اسکن وب سایت های خود مسدود کنید، کاملاً انتخاب شماست.