آیا آزمون تورینگ منسوخ شده است؟ 5 جایگزین آزمون تورینگ

آیا آزمون تورینگ اکنون قدیمی شده است؟ اگر هست، چه جایگزین هایی وجود دارد؟

بیش از 70 سال پیش، زمانی که هوش مصنوعی مفهوم‌سازی شد، آلن تورینگ مقاله‌ای منتشر کرد که نحوه شناسایی آن را شرح داد. بعدها به عنوان تست تورینگ شناخته شد و برای چندین دهه برای تمایز بین انسان و هوش مصنوعی مورد استفاده قرار گرفت.

با این حال، با معرفی چت ربات‌های پیشرفته هوش مصنوعی مانند ChatGPT و Google Bard، تشخیص اینکه آیا با یک هوش مصنوعی صحبت می‌کنید دشوارتر می‌شود. این سوال پیش می آید؛ آیا آزمون تورینگ قدیمی است؟ و اگر هست، چه جایگزین هایی وجود دارد؟

آیا آزمون تورینگ منسوخ شده است؟

برای تعیین اینکه آیا آزمون تورینگ قدیمی است، ابتدا باید نحوه کارکرد آن را بدانید. برای اینکه یک هوش مصنوعی آزمون تورینگ را پشت سر بگذارد، باید بازجوی انسانی را متقاعد کند که یک انسان است. اما یک نکته وجود دارد – هوش مصنوعی در کنار یک انسان ارزیابی می شود و باید با استفاده از متن پاسخ دهد.

اینجوری فکر کن؛ اگر شما بازجو هستید و از دو شرکت کننده به صورت آنلاین با استفاده از متن سؤال می کنید، اما یکی از آنها مدل هوش مصنوعی است – آیا بعد از پنج دقیقه آنها را از هم جدا می کنید؟ به خاطر داشته باشید که هدف آزمون تورینگ شناسایی مدل هوش مصنوعی بر اساس پاسخ های صحیح نیست، بلکه ارزیابی این است که آیا هوش مصنوعی می تواند مانند یک انسان فکر کند یا رفتار کند.

مشکل رویکرد تست تورینگ که تنها پاسخ‌های شبیه به انسان را شناسایی می‌کند این است که عوامل دیگر را در نظر نمی‌گیرد. به عنوان مثال، هوش مدل هوش مصنوعی یا دانش بازجو. علاوه بر این، تست تورینگ فقط به متن محدود می‌شود و شناسایی هوش مصنوعی که صدای انسان یا ویدیوهای جعلی را تقلید می‌کند، دشوارتر می‌شود.

با این حال، مدل‌های فعلی هوش مصنوعی مانند ChatGPT-4 و Google Bard هنوز به جایی نرسیده‌اند که بتوانند به طور مداوم آزمون تورینگ را پشت سر بگذارند. در واقع، اگر با هوش مصنوعی آشنایی داشته باشید، می توانید متن های تولید شده توسط هوش مصنوعی را تشخیص دهید.

مطلب مرتبط: 9 بهترین ویژگی تلفن بازی که همه گوشی های هوشمند باید داشته باشند

5 بهترین جایگزین تست تورینگ

این امکان وجود دارد که مدل‌های آینده هوش مصنوعی مانند ChatGPT-5 بتوانند آزمون تورینگ را پشت سر بگذارند. اگر این اتفاق بیفتد، به آزمایش‌های مختلف همراه با تست تورینگ نیاز داریم تا تشخیص دهیم که آیا با هوش مصنوعی صحبت می‌کنیم یا یک انسان. در اینجا بهترین گزینه های تست تورینگ آورده شده است:

1. تست مارکوس

گری مارکوس، دانشمند شناختی و محقق مشهور هوش مصنوعی، جایگزینی برای تست تورینگ ارائه کرد که در نیویورکر منتشر شد تا توانایی شناختی یک هوش مصنوعی را شناسایی کند. تست ساده است—شما یک مدل هوش مصنوعی را بر اساس توانایی آن در تماشا و درک ویدیوها و برنامه های تلویزیونی YouTube بدون زیرنویس یا متن قضاوت می کنید. برای اینکه هوش مصنوعی تست مارکوس را پشت سر بگذارد، باید طعنه، طنز، کنایه و خط داستانی را هنگام تماشای ویدیوها درک کند و مانند یک انسان آن را توضیح دهد.

در حال حاضر، GPT-4 می تواند تصاویر را توصیف کند، اما تاکنون هیچ مدل هوش مصنوعی وجود ندارد که بتواند ویدیوها را مانند یک انسان درک کند. وسایل نقلیه خودران نزدیک می شوند، اما کاملاً مستقل نیستند و به حسگر نیاز دارند زیرا نمی توانند همه چیز را در محیط اطراف خود درک کنند.

2. آزمون تورینگ ویژوال

بر اساس یک مقاله تحقیقاتی منتشر شده در PNAS، تست تورینگ بصری می تواند برای تشخیص اینکه با استفاده از پرسشنامه های تصویری با یک انسان صحبت می کنید یا یک هوش مصنوعی استفاده می شود. این تست مانند آزمون تورینگ کار می کند، اما به جای پاسخ دادن به سوالات با استفاده از متون، به شرکت کنندگان تصاویر نشان داده می شود و انتظار می رود در حالی که مانند یک انسان فکر می کنند به سوالات ساده پاسخ دهند. با این حال، تست تورینگ بصری با CAPTCHA متفاوت است، زیرا همه پاسخ‌ها صحیح هستند – اما برای قبولی در این آزمون، هوش مصنوعی باید تصاویر را مشابه انسان پردازش کند.

مطلب مرتبط: نحوه نصب و استفاده از افزونه های ChatGPT

فراتر از آن، اگر چندین تصویر در کنار هم به یک هوش مصنوعی و یک انسان نشان داده شود و از آنها خواسته شود تصاویر واقعی را شناسایی کنند، انسان توانایی شناختی برای قبولی در آزمون را خواهد داشت. این به این دلیل است که مدل‌های هوش مصنوعی تشخیص تصاویری که به نظر نمی‌آیند در دنیای واقعی گرفته شده‌اند، دشوار باشد. در واقع، به همین دلیل است که می توانید تصاویر تولید شده توسط هوش مصنوعی را با استفاده از ناهنجاری هایی که منطقی نیستند شناسایی کنید.

3. تست Lovelace 2.0

این نظریه که یک کامپیوتر نمی تواند ایده های اصلی را فراتر از آنچه برای انجام آن برنامه ریزی شده بود ایجاد کند، ابتدا توسط آدا لاولیس قبل از آزمون تورینگ مفهوم سازی شد. با این حال، آلن تورینگ با این نظریه مخالفت کرد و استدلال کرد که هوش مصنوعی هنوز هم می تواند انسان را شگفت زده کند. تنها در سال 2001 بود که دستورالعمل‌های آزمایش لاولیس برای تشخیص هوش مصنوعی از انسان ایجاد شد – و طبق کتابخانه thekurzweillary قوانین بعداً در سال 2014 مورد بازنگری قرار گرفتند.

برای اینکه یک هوش مصنوعی در آزمون لاولیس موفق شود، باید نشان دهد که می‌تواند ایده‌های اصلی و فراتر از آموزش تولید کند. مدل‌های فعلی هوش مصنوعی مانند GPT-4 توانایی ارائه اختراعات جدید فراتر از دانش موجود را ندارند. با این حال، هوش عمومی مصنوعی می تواند به آن قابلیت دست یابد و در آزمون لاولیس موفق شود.

4. تست تورینگ معکوس

تست تورینگ چطور، اما برعکس انجام شد؟ هدف از تست تورینگ معکوس به جای تلاش برای کشف اینکه آیا با یک انسان صحبت می‌کنید این است که هوش مصنوعی را فریب دهد تا باور کند شما یک هوش مصنوعی هستید. با این حال، شما همچنین به یک مدل هوش مصنوعی دیگر نیاز دارید تا به همان سوالات با استفاده از متن پاسخ دهید.

مطلب مرتبط: Ghost Touchs روی کامپیوتر صفحه لمسی ویندوز شما؟ در اینجا چه باید کرد

به عنوان مثال، اگر ChatGPT-4 بازجو است، می توانید Google Bard و یک انسان دیگر را به عنوان شرکت کننده ثبت نام کنید. اگر مدل هوش مصنوعی بتواند بر اساس پاسخ‌ها، شرکت‌کننده انسانی را به درستی شناسایی کند، آزمون را پس داده است.

نقطه ضعف تست تورینگ معکوس این است که قابل اعتماد نیست، به خصوص با توجه به اینکه گاهی اوقات هوش مصنوعی نمی تواند محتوای تولید شده توسط هوش مصنوعی و نوشته شده توسط انسان را متمایز کند.

5. چارچوب طبقه بندی هوش مصنوعی

بر اساس چارچوب طبقه بندی هوش مصنوعی که توسط کریس سعد ایجاد شده است، آزمون تورینگ تنها یکی از روش های ارزیابی برای دانستن اینکه آیا با یک هوش مصنوعی صحبت می کنید یا خیر است. به طور خلاصه، چارچوب طبقه‌بندی هوش مصنوعی مبتنی بر تئوری هوش چندگانه است که به هوش انسانی نیاز دارد که حداقل هشت معیار مختلف را برآورده کند که عبارتند از: موسیقی-ریتم، هوش منطقی-ریاضی، شناسایی بصری، هوش هیجانی، هوش بازتابی. ، توانایی تفکر وجودی و حرکت بدن.

از آنجایی که هوش مصنوعی بر اساس هشت پارامتر مختلف ارزیابی می‌شود، بعید است که برای یک انسان حتی اگر در معیارهای معینی بهتر از حد متوسط عمل کند. به عنوان مثال، ChatGPT می‌تواند مسائل ریاضی را حل کند، تصاویر را توصیف کند و به زبان طبیعی مانند انسان مکالمه کند، اما در سایر دسته‌های تعریف‌شده در چارچوب طبقه‌بندی هوش مصنوعی شکست خورده است.

آزمون تورینگ قطعی نیست

آزمایش تورینگ بیشتر یک آزمایش فکری بود تا یک آزمایش قطعی برای تمایز بین انسان و هوش مصنوعی. هنگامی که در ابتدا پیشنهاد شد، معیار اصلی برای اندازه گیری هوش ماشینی بود.

با این حال، با توسعه اخیر مدل‌های هوش مصنوعی با قابلیت‌های تعاملی گفتاری، دیداری و شنیداری، آزمون تورینگ از آنجایی که محدود به مکالمه متنی است، کوتاهی می‌کند. موثرترین راه حل، معرفی جایگزین های تست تورینگ است که مدل های هوش مصنوعی را از انسان متمایز می کند.

Tags: چت بات چت جی پی تی هوش مصنوعی