آیا آزمون تورینگ اکنون قدیمی شده است؟ اگر هست، چه جایگزین هایی وجود دارد؟
بیش از 70 سال پیش، زمانی که هوش مصنوعی مفهومسازی شد، آلن تورینگ مقالهای منتشر کرد که نحوه شناسایی آن را شرح داد. بعدها به عنوان تست تورینگ شناخته شد و برای چندین دهه برای تمایز بین انسان و هوش مصنوعی مورد استفاده قرار گرفت.
با این حال، با معرفی چت رباتهای پیشرفته هوش مصنوعی مانند ChatGPT و Google Bard، تشخیص اینکه آیا با یک هوش مصنوعی صحبت میکنید دشوارتر میشود. این سوال پیش می آید؛ آیا آزمون تورینگ قدیمی است؟ و اگر هست، چه جایگزین هایی وجود دارد؟
آیا آزمون تورینگ منسوخ شده است؟
برای تعیین اینکه آیا آزمون تورینگ قدیمی است، ابتدا باید نحوه کارکرد آن را بدانید. برای اینکه یک هوش مصنوعی آزمون تورینگ را پشت سر بگذارد، باید بازجوی انسانی را متقاعد کند که یک انسان است. اما یک نکته وجود دارد – هوش مصنوعی در کنار یک انسان ارزیابی می شود و باید با استفاده از متن پاسخ دهد.
اینجوری فکر کن؛ اگر شما بازجو هستید و از دو شرکت کننده به صورت آنلاین با استفاده از متن سؤال می کنید، اما یکی از آنها مدل هوش مصنوعی است – آیا بعد از پنج دقیقه آنها را از هم جدا می کنید؟ به خاطر داشته باشید که هدف آزمون تورینگ شناسایی مدل هوش مصنوعی بر اساس پاسخ های صحیح نیست، بلکه ارزیابی این است که آیا هوش مصنوعی می تواند مانند یک انسان فکر کند یا رفتار کند.
مشکل رویکرد تست تورینگ که تنها پاسخهای شبیه به انسان را شناسایی میکند این است که عوامل دیگر را در نظر نمیگیرد. به عنوان مثال، هوش مدل هوش مصنوعی یا دانش بازجو. علاوه بر این، تست تورینگ فقط به متن محدود میشود و شناسایی هوش مصنوعی که صدای انسان یا ویدیوهای جعلی را تقلید میکند، دشوارتر میشود.
با این حال، مدلهای فعلی هوش مصنوعی مانند ChatGPT-4 و Google Bard هنوز به جایی نرسیدهاند که بتوانند به طور مداوم آزمون تورینگ را پشت سر بگذارند. در واقع، اگر با هوش مصنوعی آشنایی داشته باشید، می توانید متن های تولید شده توسط هوش مصنوعی را تشخیص دهید.
5 بهترین جایگزین تست تورینگ
این امکان وجود دارد که مدلهای آینده هوش مصنوعی مانند ChatGPT-5 بتوانند آزمون تورینگ را پشت سر بگذارند. اگر این اتفاق بیفتد، به آزمایشهای مختلف همراه با تست تورینگ نیاز داریم تا تشخیص دهیم که آیا با هوش مصنوعی صحبت میکنیم یا یک انسان. در اینجا بهترین گزینه های تست تورینگ آورده شده است:
1. تست مارکوس
گری مارکوس، دانشمند شناختی و محقق مشهور هوش مصنوعی، جایگزینی برای تست تورینگ ارائه کرد که در نیویورکر منتشر شد تا توانایی شناختی یک هوش مصنوعی را شناسایی کند. تست ساده است—شما یک مدل هوش مصنوعی را بر اساس توانایی آن در تماشا و درک ویدیوها و برنامه های تلویزیونی YouTube بدون زیرنویس یا متن قضاوت می کنید. برای اینکه هوش مصنوعی تست مارکوس را پشت سر بگذارد، باید طعنه، طنز، کنایه و خط داستانی را هنگام تماشای ویدیوها درک کند و مانند یک انسان آن را توضیح دهد.
در حال حاضر، GPT-4 می تواند تصاویر را توصیف کند، اما تاکنون هیچ مدل هوش مصنوعی وجود ندارد که بتواند ویدیوها را مانند یک انسان درک کند. وسایل نقلیه خودران نزدیک می شوند، اما کاملاً مستقل نیستند و به حسگر نیاز دارند زیرا نمی توانند همه چیز را در محیط اطراف خود درک کنند.
2. آزمون تورینگ ویژوال
بر اساس یک مقاله تحقیقاتی منتشر شده در PNAS، تست تورینگ بصری می تواند برای تشخیص اینکه با استفاده از پرسشنامه های تصویری با یک انسان صحبت می کنید یا یک هوش مصنوعی استفاده می شود. این تست مانند آزمون تورینگ کار می کند، اما به جای پاسخ دادن به سوالات با استفاده از متون، به شرکت کنندگان تصاویر نشان داده می شود و انتظار می رود در حالی که مانند یک انسان فکر می کنند به سوالات ساده پاسخ دهند. با این حال، تست تورینگ بصری با CAPTCHA متفاوت است، زیرا همه پاسخها صحیح هستند – اما برای قبولی در این آزمون، هوش مصنوعی باید تصاویر را مشابه انسان پردازش کند.
فراتر از آن، اگر چندین تصویر در کنار هم به یک هوش مصنوعی و یک انسان نشان داده شود و از آنها خواسته شود تصاویر واقعی را شناسایی کنند، انسان توانایی شناختی برای قبولی در آزمون را خواهد داشت. این به این دلیل است که مدلهای هوش مصنوعی تشخیص تصاویری که به نظر نمیآیند در دنیای واقعی گرفته شدهاند، دشوار باشد. در واقع، به همین دلیل است که می توانید تصاویر تولید شده توسط هوش مصنوعی را با استفاده از ناهنجاری هایی که منطقی نیستند شناسایی کنید.
3. تست Lovelace 2.0
این نظریه که یک کامپیوتر نمی تواند ایده های اصلی را فراتر از آنچه برای انجام آن برنامه ریزی شده بود ایجاد کند، ابتدا توسط آدا لاولیس قبل از آزمون تورینگ مفهوم سازی شد. با این حال، آلن تورینگ با این نظریه مخالفت کرد و استدلال کرد که هوش مصنوعی هنوز هم می تواند انسان را شگفت زده کند. تنها در سال 2001 بود که دستورالعملهای آزمایش لاولیس برای تشخیص هوش مصنوعی از انسان ایجاد شد – و طبق کتابخانه thekurzweillary قوانین بعداً در سال 2014 مورد بازنگری قرار گرفتند.
برای اینکه یک هوش مصنوعی در آزمون لاولیس موفق شود، باید نشان دهد که میتواند ایدههای اصلی و فراتر از آموزش تولید کند. مدلهای فعلی هوش مصنوعی مانند GPT-4 توانایی ارائه اختراعات جدید فراتر از دانش موجود را ندارند. با این حال، هوش عمومی مصنوعی می تواند به آن قابلیت دست یابد و در آزمون لاولیس موفق شود.
4. تست تورینگ معکوس
تست تورینگ چطور، اما برعکس انجام شد؟ هدف از تست تورینگ معکوس به جای تلاش برای کشف اینکه آیا با یک انسان صحبت میکنید این است که هوش مصنوعی را فریب دهد تا باور کند شما یک هوش مصنوعی هستید. با این حال، شما همچنین به یک مدل هوش مصنوعی دیگر نیاز دارید تا به همان سوالات با استفاده از متن پاسخ دهید.
به عنوان مثال، اگر ChatGPT-4 بازجو است، می توانید Google Bard و یک انسان دیگر را به عنوان شرکت کننده ثبت نام کنید. اگر مدل هوش مصنوعی بتواند بر اساس پاسخها، شرکتکننده انسانی را به درستی شناسایی کند، آزمون را پس داده است.
نقطه ضعف تست تورینگ معکوس این است که قابل اعتماد نیست، به خصوص با توجه به اینکه گاهی اوقات هوش مصنوعی نمی تواند محتوای تولید شده توسط هوش مصنوعی و نوشته شده توسط انسان را متمایز کند.
5. چارچوب طبقه بندی هوش مصنوعی
بر اساس چارچوب طبقه بندی هوش مصنوعی که توسط کریس سعد ایجاد شده است، آزمون تورینگ تنها یکی از روش های ارزیابی برای دانستن اینکه آیا با یک هوش مصنوعی صحبت می کنید یا خیر است. به طور خلاصه، چارچوب طبقهبندی هوش مصنوعی مبتنی بر تئوری هوش چندگانه است که به هوش انسانی نیاز دارد که حداقل هشت معیار مختلف را برآورده کند که عبارتند از: موسیقی-ریتم، هوش منطقی-ریاضی، شناسایی بصری، هوش هیجانی، هوش بازتابی. ، توانایی تفکر وجودی و حرکت بدن.
از آنجایی که هوش مصنوعی بر اساس هشت پارامتر مختلف ارزیابی میشود، بعید است که برای یک انسان حتی اگر در معیارهای معینی بهتر از حد متوسط عمل کند. به عنوان مثال، ChatGPT میتواند مسائل ریاضی را حل کند، تصاویر را توصیف کند و به زبان طبیعی مانند انسان مکالمه کند، اما در سایر دستههای تعریفشده در چارچوب طبقهبندی هوش مصنوعی شکست خورده است.
آزمون تورینگ قطعی نیست
آزمایش تورینگ بیشتر یک آزمایش فکری بود تا یک آزمایش قطعی برای تمایز بین انسان و هوش مصنوعی. هنگامی که در ابتدا پیشنهاد شد، معیار اصلی برای اندازه گیری هوش ماشینی بود.
با این حال، با توسعه اخیر مدلهای هوش مصنوعی با قابلیتهای تعاملی گفتاری، دیداری و شنیداری، آزمون تورینگ از آنجایی که محدود به مکالمه متنی است، کوتاهی میکند. موثرترین راه حل، معرفی جایگزین های تست تورینگ است که مدل های هوش مصنوعی را از انسان متمایز می کند.