همه در مورد ChatGPT شنیدهاند، اما فناوری زیربنایی آن چطور؟
ChatGPT، Bing AI و Google Bard برخی از شناخته شده ترین نام ها در دنیای هوش مصنوعی مصرف کننده هستند. هر سه محصول یک چیز مشترک دارند – همه آنها محصولات هوش مصنوعی مولد هستند.
اما دقیقاً هوش مصنوعی مولد چیست و چه چیزی باعث جذابیت اخیر نسبت به این فضای احیا شده هوش مصنوعی شده است؟
هوش مصنوعی مولد چیست؟
هوش مصنوعی مولد، مخفف «هوش مصنوعی مولد»، نوعی سیستم هوش مصنوعی است که میتواند محتوای منحصربهفرد یا اصلی مانند متن، صدا، ویدیو یا تصاویر را در صورت تقاضا تولید کند. برخلاف برخی از سیستمهای هوش مصنوعی سنتی که برای کارهایی مانند طبقهبندی یا تجزیه و تحلیل دادهها طراحی شدهاند، مدلهای هوش مصنوعی مولد بیشتر به تولید خروجیهای جدید یا خلاقانه بر اساس دستورالعملهایی که داده میشوند، توجه دارند.
در حالی که ممکن است هوش مصنوعی مولد یک فناوری جدید به نظر برسد، در واقع برای دههها وجود داشته است. چندین تکرار و اشکال حداقل در اوایل دهه 1960 وجود داشته است. هوش مصنوعی یک حوزه وسیع است و هوش مصنوعی مولد فقط یک بخش فرعی است.
یکی از جذابترین جنبههای استفاده از ابزار هوش مصنوعی مولد مانند ChatGPT یا Bard AI گوگل، توانایی این ابزارها برای تولید محتوای مطابق با درخواست شما است. شما از ChatGPT می خواهید که شعری به سبک ویلیام شکسپیر بنویسد، و چیزی شبیه به کار شکسپیر دریافت می کنید. شما از آن میخواهید که یک سخنرانی به سبک دونالد ترامپ ایجاد کند، و چیزی دریافت میکنید که به طرز چشمگیری از لحن رئیسجمهور سابق ایالات متحده تقلید میکند. بنابراین، چگونه این ممکن است؟ چگونه هوش مصنوعی مولد قادر است چنین شاهکار جذابی را انجام دهد؟
هوش مصنوعی مولد چگونه کار می کند
مکانیسم کار یک مدل هوش مصنوعی مولد شامل تعامل پیچیده ای از تکنیک ها و الگوریتم های مختلف یادگیری عمیق است. جزئیات دقیق نحوه عملکرد یک مدل مولد به اهداف و معماری زیربنایی آن بستگی دارد. به عنوان مثال، یک مدل تولیدی برای تولید قطعههای صوتی، مکانیسم کاری متفاوتی با مدلی که برای تولید ویدیو یا متن ساخته شده است، خواهد داشت.
با این حال، در هسته خود، اغلب، اگر نه همه، مدل های مولد به طور مشابه در سطح پایه خود کار می کنند. آنها از مقدار زیادی داده یاد می گیرند، الگوها و سبک های داده را می گیرند و سپس از این الگوهای گرفته شده برای بازتولید نمونه هایی مشابه آنچه در داده های آموزشی خود یاد گرفته اند استفاده می کنند.
می توانید به ابزارهای مولد هوش مصنوعی به عنوان یک آهنگساز موسیقی فکر کنید. تصور کنید این آهنگساز به آهنگ های بی شماری گوش داده و هارمونی ها، ملودی ها، ریتم ها و ساختار تعدادی از ژانرهای موسیقی را مطالعه کرده است. به عبارت دیگر، این آهنگساز شناخت گسترده ای از ژانرهای موسیقی دارد. با این دانش، آهنگساز می تواند موسیقی اصیل یا منحصر به فردی را با الهام از آموخته های خود خلق کند.
بنابراین اگر آنها چیزهای زیادی در مورد موسیقی پاپ یاد گرفته اند، می توانید از آنها بخواهید که یک آهنگ پاپ بسازند و آنها برای انجام این کار مشکلی نخواهند داشت. سپس موسیقی ساخته شده بیانی از درک آهنگساز از این است که موسیقی پاپ بر اساس آنچه که آموخته است چگونه باشد. به طور مشابه، محصول هوش مصنوعی مولد بیانی از درک مدل هوش مصنوعی از مفاهیم اساسی است که از دادههای آموزشی آن آموخته میشود.
بنابراین اگر میخواهید یک مدل هوش مصنوعی مولد ایجاد کنید که تصاویر ماشینها را تولید کند، باید مجموعه داده عظیمی از تصاویر ماشین را به مدل بدهید. برای ایجاد یک مدل چشمگیر، باید تصاویر برندها و مدل های زیادی را که فکرش را می کنید به آن بدهید. با آموزش کافی، الگوریتم یاد میگیرد که هر برند یا مدل خودرو چگونه به نظر میرسد، و ما میتوانیم تصاویری از تقریباً هر خودرویی که در صورت نیاز به آن فکر کنید ایجاد کنیم.
مدل های مولد AI محبوب
صدها مدل هوش مصنوعی مولد در حال حاضر در حال توسعه یا در حال استقرار در بازار هوش مصنوعی مصرف کننده هستند. برخی از محبوبهایی که باید بدانید عبارتند از:
1. ترانسفورماتور از پیش آموزش دیده (GPT)
GPT که توسط OpenAI توسعه یافته است، یکی از شناخته شده ترین نام ها در فضای مولد هوش مصنوعی است. محبوبیت آن به اثربخشی آن به عنوان یک مدل هوش مصنوعی محاوره ای و موفقیت ویروسی چت ربات ChatGPT بستگی دارد که از GPT به عنوان فناوری زیربنایی خود استفاده می کند. این یک مدل زبان بزرگ است که برای تولید متنی شبیه انسان در صورت درخواست طراحی شده است. به طور معمول برای هر مدل هوش مصنوعی مولد، تمام تکرارهای مدل GPT بر روی حجم عظیمی از داده های متنی متنوع آموزش داده شده است.
2. مدل زبان مسیرها (PaLM)
PaLM، یک مدل آزمایشی زبان بزرگ توسط گوگل، یک مدل هوش مصنوعی مولد قدرتمند است که قادر به انجام طیف وسیعی از وظایف مانند نوشتن خلاق، تولید کد، ترجمه زبان، و تعدادی دیگر از وظایف زبان طبیعی مبتنی بر متن است. مانند GPT، PALM بر روی مجموعه بزرگی از دادههای متنی که از طیف گستردهای از منابع در سراسر وب منشأ میگرفت، آموزش دید. این مدل هوش مصنوعی است که هوش مصنوعی Bard گوگل را تقویت می کند.
3. مدل زبان موسیقی (MusicLM)
MusicLM یکی دیگر از مدل های مولد هوش مصنوعی گوگل است. این برای تولید موسیقی “با وفاداری بالا” از پیام های متنی ساده طراحی شده است. این مدل مولد که بر روی هزاران ساعت موسیقی در ژانرهای مختلف آموزش دیده است، میتواند با استفاده از توضیحات ساده موسیقی مورد نیاز شما به عنوان ورودی، موسیقی منحصربهفردی ایجاد کند. اگر میپرسید چقدر خوب است، در اینجا بررسی ما از مدل MusicLM است.
4. DALL-E
DALL-E مدل تولید تصویر هوش مصنوعی OpenAI است که برای ایجاد چندین سبک از تصاویر منحصر به فرد از پیام های متنی طراحی شده است. این یک پیاده سازی چندوجهی از مدل GPT است که بر روی جفت های متن-تصویر متعدد از منابع مختلف در سراسر اینترنت آموزش داده شده است.
فراتر از مدلهای هوش مصنوعی مولد، محصولات هوش مصنوعی مولد مانند Midjourney، مولد تصویر DALL-E، تولیدکننده تصویر Stable Diffusion، Hugging Chat و چندین محصول چشمگیر دیگر هوش مصنوعی را خواهید یافت که با مدلهای هوش مصنوعی تولید میشوند.
چرا هوش مصنوعی مولد محبوبیت خود را افزایش داده است؟
در 30 نوامبر 2022، سام آلتمن، مدیر عامل OpenAI، راه اندازی ChatGPT را در توییتی اعلام کرد. علیرغم اینکه آلتمن مدیرعامل OpenAI بود، در جامعه اینترنتی بزرگتر نسبتاً ناشناخته بود و توییت او با هیاهوی کمی همراه بود.
پنج روز بعد، ChatGPT اولین یک میلیون کاربر خود را جمع آوری کرد. این کار را با سرعتی انجام داد که توسط هیچ اپلیکیشنی شنیده نشده بود. چندین میلیون دیگر جمع آوری کرد و در نهایت ChatGPT را به سریع ترین برنامه در حال رشد در تمام دوران تبدیل کرد. در حالی که ChatGPT اولین محصول مولد هوش مصنوعی نیست، ورود آن به صحنه محصول هوش مصنوعی بیش از هر محصول فناوری دیگری قبل از آن، هوش مصنوعی مولد را به آگاهی عمومی رساند.
در حالی که ChatGPT نوک نیزه در به حرکت درآوردن تبلیغات در مورد هوش مصنوعی مولد بوده است، اما به تنهایی این کار را انجام نداد. سال 2022 به عنوان سالی که ابزارهای مولد هوش مصنوعی به جریان اصلی تبدیل شدند، در خاطره خواهد ماند. از چت رباتهای مکالمه هوش مصنوعی گرفته تا تولیدکنندگان کد و هنر، نیمه دوم سال 2022 اولین باری بود که ابزارهای هوش مصنوعی متعددی که هم جذابیت انبوه و هم کاربردهای روزمره کاربردی داشتند به بازار آمدند. با این ابزارها به محبوبیت فناوری زیربنایی آن یعنی هوش مصنوعی مولد رسید.
ابزارهای مولد هوش مصنوعی مانند Bing AI، Bard Google، DALL-E، ChatGPT و Midjourney به طور یکپارچه خود را در تار و پود زندگی روزمره ما بافته اند و دائماً خلاقیت های قابل توجه خود را به ما ارائه می دهند. چه نوشتههای جذابی که توسط ChatGPT ایجاد شده است و چه تصاویر واقعی شگفتآوری که توسط Midjourney ساخته شدهاند، هوش مصنوعی مولد به همراهی همیشه حاضر تبدیل شده است و روز به روز ما را همراهی میکند. این پیدایش محبوبیت اخیر هوش مصنوعی مولد است.
هوش مصنوعی مولد را در آغوش بگیرید
محبوبیت ابزارهای مولد هوش مصنوعی یک مد نیست. برخلاف برخی از روندهای اخیر فناوری که محبوبیت پیدا کردند و با گذشت زمان از بین رفتند، هوش مصنوعی مولد فناوری است که دارای مزایای عملی واقعی است. از آنجایی که این طاقچه فناوری نوظهور راه خود را تقریباً در تمام جنبه های زندگی دیجیتالی ما باز می کند، بهتر است به جای اینکه در مورد آن متحیر باشیم، به دنبال راه هایی برای بهترین استفاده از فناوری باشیم.