احتمالاً از ChatGPT برای پاسخ دادن به سؤالی استفاده کردهاید، اما چگونه به آنچه میپرسید پاسخ میدهد؟
ChatGPT چت ربات هوش مصنوعی OpenAI است که بازی را تغییر می دهد و اینترنت را شگفت زده نگه می دارد. برخلاف تمام گرایشهای تکنولوژیک، مدت زیادی طول نکشید که ChatGPT راه خود را تقریباً در همه حوزههای زندگی دیجیتالی ما پیدا کرد.
تعداد بسیار کمی از نوآوریهای فناوری به اندازهای که ChatGPT در چنین مدت کوتاهی به آن دست یافته است، مورد توجه قرار گرفته است. به نظر میرسد هیچ وقت از ترفندهای جالب آن خالی نمیشود—هر روز، چیزهای هیجانانگیز جدیدی را یاد میگیریم که نمیدانستیم میتواند انجام دهد.
اما ChatGPT چگونه می تواند کارهایی را که می تواند انجام دهد انجام دهد؟ ChatGPT چگونه کار می کند؟
ChatGPT چگونه ساخته شد؟
برای درک نحوه عملکرد ChatGPT، ارزش آن را دارد که به منشأ آن و مغز پشت چت ربات پیشرفته هوش مصنوعی نگاه کنید.
اولاً، همانطور که ChatGPT ممکن است جادویی به نظر برسد، درست مانند هر فناوری نرم افزاری ارزشمندی که وجود دارد، توسط نابغه انسان ها ساخته شده است. OpenAI ChatGPT، شرکت تحقیق و توسعه هوش مصنوعی انقلابی را ایجاد کرد که در پشت ابزارهای قدرتمند هوش مصنوعی مانند DALL-E، InstructGPT و Codex قرار دارد. ما قبلاً به سؤالاتی که ممکن است در مورد ChatGPT داشته باشید پاسخ داده ایم، پس نگاهی بیندازید.
در حالی که ChatGPT در اواخر سال 2022 ویروسی شد، بسیاری از فناوریهای اساسی که ChatGPT را تقویت میکند مدت طولانیتری وجود داشته است، هرچند با تبلیغات بسیار کمتر. مدل ChatGPT بر روی GPT-3 (یا، به طور خاص، GPT-3.5) ساخته شده است. GPT مخفف “Generative Pre-trained Transformer 3” است.
GPT-3 سومین تکرار از خط GPT از مدل های AI است و قبل از GPT-2 و GPT بود. تکرارهای قبلی مدل های GPT به همان اندازه مفید هستند، اما GPT-3 و تکرار GPT-3.5 با تنظیم دقیق بسیار قوی تر هستند. بیشتر کارهایی که ChatGPT می تواند انجام دهد به دلیل فناوری GPT-3 است.
GPT چیست؟
بنابراین ما مشخص کردیم که ChatGPT بر اساس نسل سوم مدل GPT ساخته شده است. اما به هر حال GPT چیست؟
بیایید با باز کردن کلمات اختصاری به روشی آسان برای هضم و غیر فنی شروع کنیم.
- “Generative” در GPT نشان دهنده توانایی آن در تولید متن زبان طبیعی انسان است.
- “Pre-trained” نشان دهنده این واقعیت است که مدل قبلاً بر روی برخی از داده های محدود آموزش داده شده است. بسیار شبیه به اینکه قبل از اینکه از شما خواسته شود به سؤالاتی در مورد آن پاسخ دهید، یک کتاب یا چندین کتاب خوانده باشید.
- “Transformer” معماری زیربنایی یادگیری ماشینی را نشان می دهد که GPT را تقویت می کند.
اکنون، با کنار هم قرار دادن همه اینها، Generative Pre-trained Transformer (GPT) یک مدل زبانی است که با استفاده از داده های اینترنت با هدف تولید متن زبان انسانی در صورت ارائه با یک اعلان آموزش داده شده است. بنابراین، ما بارها گفته ایم که GPT آموزش داده شده است، اما چگونه آموزش داده شده است؟
ChatGPT چگونه آموزش داده شد؟
خود ChatGPT از ابتدا آموزش ندیده بود. در عوض، این یک نسخه تنظیم شده از GPT-3.5 است که خود نسخه تنظیم شده GPT-3 است. مدل GPT-3 با حجم عظیمی از داده های جمع آوری شده از اینترنت آموزش داده شد. به ویکیپدیا، توییتر و ردیت فکر کنید – دادهها و متنهای انسانی که از همه گوشههای اینترنت خراشیده شده بود، تغذیه میشد.
اگر تعجب می کنید که آموزش GPT چگونه کار می کند، GPT-3 با استفاده از ترکیبی از یادگیری نظارت شده و یادگیری تقویتی از طریق بازخورد انسانی (RLHF) آموزش داده شده است. یادگیری نظارت شده مرحله ای است که مدل بر روی مجموعه داده بزرگی از متن خراشیده شده از اینترنت آموزش می بیند. مرحله یادگیری تقویتی جایی است که آموزش داده میشود تا پاسخهای بهتری تولید کند که با آنچه انسانها به عنوان انسانمانند و درست میپذیرند همسو باشد.
آموزش با یادگیری نظارت شده
برای درک بهتر اینکه چگونه یادگیری تحت نظارت و تقویتی در ChatGPT اعمال می شود، سناریویی را تصور کنید که در آن یک دانش آموز نوشتن یک مقاله توسط یک معلم آموزش داده می شود. یادگیری تحت نظارت معادل این است که معلم صدها مقاله به دانش آموز بدهد تا بخواند. هدف در اینجا این است که دانش آموز با عادت کردن به لحن، واژگان و ساختار صدها مقاله یاد بگیرد که چگونه یک مقاله باید نوشته شود.
با این حال، در میان آن صدها مقاله، خوب و بد وجود خواهد داشت. از آنجایی که دانش آموز در مورد نسخه های خوب و بد آموزش دیده است، گاهی اوقات ممکن است دانش آموز یک مقاله بد بنویسد زیرا در مقطعی به دانش آموز انشاهای بد داده شده است. این بدان معناست که وقتی از دانشآموز خواسته میشود مقاله بنویسد، ممکن است نسخهای بنویسد که برای معلم قابل قبول یا خوب نباشد. اینجاست که یادگیری تقویتی وارد می شود.
آموزش با یادگیری تقویتی
هنگامی که معلم ثابت کرد که دانش آموز با خواندن صدها مقاله قوانین کلی مقاله نویسی را درک می کند، معلم به دانش آموز تکالیف مکرر انشا نویسی می دهد. متعاقباً، معلم در مورد تکالیف انشائی بازخورد ارائه میکند و به دانشآموزان میگوید که چه کارهایی را خوب انجام دادهاند و چه چیزی را میتوانند بهبود بخشند. دانش آموز از بازخوردها برای هدایت تکالیف انشا بعدی استفاده می کند و به دانش آموز کمک می کند در طول زمان پیشرفت کند.
این شبیه به مرحله یادگیری تقویتی آموزش مدل GPT است. پس از تغذیه حجم عظیمی از متن خراشیده شده از اینترنت، این مدل می تواند به سوالات پاسخ دهد. با این حال، دقت آن به اندازه کافی خوب نیست. مربیان انسانی از مدل سوالی می پرسند و بازخوردی ارائه می دهند که کدام پاسخ برای هر سوال مناسب تر است.
این مدل از بازخورد برای بهبود توانایی خود در پاسخگویی دقیق تر به سوالات و بیشتر شبیه نحوه پاسخگویی یک انسان استفاده می کند. اینگونه است که ChatGPT میتواند پاسخهای انسانی را تولید کند که هم منسجم، هم جذاب و هم به طور کلی دقیق هستند.
ChatGPT چگونه می تواند به سوالات پاسخ دهد؟
بنابراین، از وب سایت ChatGPT بازدید می کنید و وارد سیستم می شوید. از ChatGPT می گویید: “یک آهنگ رپ به سبک اسنوپ داگ بنویس.” این آهنگ با اشعاری به آهنگ رپ پاسخ می دهد که به طور شگفت انگیزی شبیه به آنچه اسنوپ داگ می نوشت، پاسخ می دهد. چه طور ممکنه؟
خوب، “جادو” پشت ChatGPT همه به خوبی با آموزش آن مرتبط است.
پس از پرداختن به هر اینچ از کتاب درسی فیزیک 101، این احتمال وجود دارد که بتوانید به هر سؤالی که از آن به شما میشود پاسخ دهید. چرا؟ زیرا شما آن را خوانده اید و آن را یاد گرفته اید. این موضوع در مورد ChatGPT یکسان است – یاد می گیرد. و همانطور که تمدن بشری نشان داده است، با آموزش کافی، حل تقریباً هر مشکلی امکان پذیر است.
در حالی که احتمالاً می توانید صدها کتاب را در طول زندگی خود مدیریت کنید، ChatGPT یا GPT قبلاً بخش عظیمی از اینترنت را مصرف کرده است. این حجم عظیمی از اطلاعات است. در آنجا، جایی، احتمالاً اشعار آهنگ های متعدد اسنوپ داگ وجود دارد. بنابراین، البته، ChatGPT باید آن را مصرف کرده باشد (به یاد داشته باشید، از قبل آموزش داده شده است) و الگوهای موجود در اشعار اسنوپ داگ را تشخیص داده باشد. سپس از “دانش” این الگو برای “پیشبینی” اشعار آهنگی مشابه آنچه اسنوپ داگ مینویسد استفاده میکند.
در اینجا تاکید بر “پیش بینی” است. ChatGPT به سوالات مانند انسان ها پاسخ نمی دهد. به عنوان مثال، وقتی با سوالی مانند “پایتخت پرتغال چیست؟” مواجه می شوید؟ شما می توانید لیسبون را بگویید و آن را برای یک “واقعیت” بگویید. با این حال، ChatGPT به سوالات با اطمینان 100٪ پاسخ نمی دهد. در عوض، سعی می کند با توجه به داده هایی که در مجموعه داده های آموزشی خود مصرف کرده است، پاسخ درست را پیش بینی کند.
رویکرد ChatGPT برای پاسخ دادن به سوالات
برای درک بهتر مفهوم پیشبینی پاسخها، ChatGPT را به عنوان کارآگاهی که وظیفه حل یک قتل را بر عهده دارد، تصور کنید. به کارآگاه شواهدی ارائه می شود، اما آنها نمی دانند چه کسی قتل را انجام داده و چگونه اتفاق افتاده است. با این حال، با وجود شواهد کافی، کارآگاه می تواند با دقت زیادی “پیش بینی” کند که چه کسی مسئول قتل است و چگونه جنایت انجام شده است.
پس از مصرف دادهها از اینترنت، ChatGPT دادههای اصلی را دور میاندازد و اتصالات عصبی یا الگوهایی را که از دادهها آموخته است ذخیره میکند. این اتصالات یا الگوها مانند شواهدی هستند که ChatGPT زمانی که سعی می کند به هر درخواستی پاسخ دهد آن را تجزیه و تحلیل می کند.
بنابراین، در تئوری، ChatGPT مانند یک کارآگاه بسیار خوب است. به طور قطع نمیداند که حقایق یک پاسخ باید چه باشد، اما سعی میکند، با دقتی چشمگیر، دنبالهای منطقی از متن زبان انسانی را پیشبینی کند که به بهترین وجه به سؤال پاسخ دهد. به این ترتیب شما پاسخ سوالات خود را دریافت می کنید.
و همچنین به همین دلیل است که برخی از این پاسخ ها بسیار قانع کننده به نظر می رسند اما به شدت اشتباه هستند.
ChatGPT: مانند یک انسان پاسخ می دهد، مانند یک ماشین فکر می کند
جزئیات فنی زیربنایی ChatGPT پیچیده است. با این حال، از یک دیدگاه ابتدایی، با یادگیری و بازتولید آنچه که آموخته است، درست مانند ما به عنوان انسان عمل می کند.
همانطور که ChatGPT از طریق تحقیقات تکامل می یابد، روش کار ممکن است تغییر کند. با این حال، اصول کار اساسی آن برای مدتی ثابت خواهد ماند، حداقل تا زمانی که یک فناوری جدید مخرب از راه برسد.