آموزش انتقال هوش مصنوعی چیست و چگونه کار می کند؟

به دنبال راهی برای آموزش یک هوش مصنوعی قدرتمند برای برنامه های خاص خود هستید؟ یادگیری انتقالی را امتحان کنید!

اگر علاقه مند به آموزش مدل هوش مصنوعی خود برای پردازش زبان طبیعی (NLP) یا بینایی کامپیوتری هستید، باید با یادگیری انتقال و نحوه استفاده از مدل های از پیش آموزش دیده آشنا شوید.

بدون یادگیری انتقالی، آموزش یک مدل موثر و قابل اعتماد اغلب یک تلاش غیرقابل استفاده از منابع خواهد بود، که به پول، زمان و تخصص زیادی نیاز دارد، با توسعه دهنده ChatGPT OpenAI تخمین زده می شود که میلیون ها دلار برای آموزش GPT-3، GPT-3.5 و GPT- هزینه کرده است. 4. با قدرت یادگیری انتقال، می توانید مدل خود را به قدرتمندی آخرین مدل GPT با منابع کم در مدت کوتاهی آموزش دهید.

یادگیری انتقال هوش مصنوعی چیست؟

یادگیری انتقالی، ایده گرفتن یک مدل از پیش آموزش‌دیده‌شده مانند BERT یا یکی از مدل‌های مختلف GPT و آموزش آن بر روی یک مجموعه داده سفارشی برای کار بر روی وظایفی است که لزوماً برای مقابله با آن آموزش ندیده‌اند.

به عنوان مثال، می توانید یک مدل از قبل آموزش دیده برای طبقه بندی گونه های مختلف گربه تهیه کنید و آن را برای طبقه بندی سگ ها آموزش دهید. از طریق یادگیری انتقال، آموزش مدل طبقه بندی سگ شما باید زمان و منابع کمتری را صرف کند تا به اندازه مدل اصلی طبقه بندی گربه قابل اعتماد شود.

این کار از آنجایی کار می کند که گربه ها و سگ ها دارای ویژگی های بسیاری هستند که مدل از قبل آموزش دیده می تواند شناسایی کند. از آنجایی که مدل طبقه‌بندی گربه می‌تواند ویژگی‌های مختلف یک گربه مانند داشتن چهار پا، کت خزدار و پوزه‌های برجسته را شناسایی کند، مدل طبقه‌بندی سگ می‌تواند تمام آموزش‌ها را برای شناسایی این ویژگی‌ها نادیده بگیرد و آنها را از مدل اصلی به ارث ببرد. پس از به ارث بردن همه آن شبکه‌های عصبی، آخرین لایه‌های مدل آموزش‌دیده را که برای شناسایی ویژگی‌های خاص‌تر یک گربه استفاده می‌شود، جدا می‌کنید و آنها را با مجموعه داده‌ای مخصوص سگ‌ها جایگزین می‌کنید.

از چه مدل های هوش مصنوعی می توانید برای آموزش انتقال استفاده کنید؟

برای استفاده از آموزش انتقالی، به یک مدل از پیش آموزش دیده نیاز دارید. یک مدل از پیش آموزش دیده معمولاً به عنوان یک مدل هوش مصنوعی شناخته می شود که به منظور کسب دانش عمومی در مورد یک موضوع یا ایده خاص آموزش داده شده است. این نوع از مدل های از پیش آموزش دیده به طور عمدی برای افراد ساخته شده اند تا بتوانند مدل های کاربردی بیشتری را تنظیم کنند و بسازند. برخی از محبوب ترین مدل های از پیش آموزش دیده برای NLP، مانند BERT و GPT، و بینایی کامپیوتر، مانند VGG19 و Inceptionv3 هستند.

مطلب مرتبط: چگونه لبه های ناهموار و هاله را با استفاده از Generative Fill در فتوشاپ رفع کنیم

اگرچه محبوب هستند، اما این مدل‌هایی که به راحتی تنظیم می‌شوند، تنها مدل‌هایی نیستند که می‌توانید برای یادگیری انتقال استفاده کنید. همچنین می‌توانید از مدل‌هایی استفاده کنید که بر روی وظایف خاص‌تر از تشخیص عمومی شی یا زبان آموزش داده شده‌اند. تا زمانی که مدل شبکه‌های عصبی قابل استفاده برای مدلی را که می‌خواهید آموزش دهید توسعه داده باشد، می‌توانید تقریباً از هر مدلی برای یادگیری انتقال استفاده کنید.

می‌توانید مدل‌های از قبل آموزش‌دیده‌شده در دسترس عموم را از مکان‌هایی مانند TensorFlow Hub، Hugging Face و بازار مدل OpenAI دریافت کنید.

مزایای استفاده از آموزش انتقال هوش مصنوعی

یادگیری انتقال مزایای متعددی نسبت به آموزش یک مدل هوش مصنوعی از ابتدا دارد.

کاهش زمان آموزش: هنگام آموزش یک مدل از ابتدا، بخش بزرگی از فرآیند آموزش صرف دانش پایه عمومی می شود. از طریق یادگیری انتقالی، مدل شما به طور خودکار تمام این دانش پایه را به ارث می برد، بنابراین زمان آموزش را به میزان قابل توجهی کاهش می دهد.
منابع مورد نیاز کمتر: از آنجایی که تمام دانش پایه در حال حاضر وجود دارد، تنها کاری که باید انجام دهید این است که مدل را برای ویژگی های برنامه خود آموزش دهید. این اغلب تنها به یک مجموعه داده نسبتاً کوچک نیاز دارد که بتواند با قدرت محاسباتی کمتری پردازش شود.
عملکرد بهبود یافته: مگر اینکه میلیون ها دلار برای ساخت مدل خود از ابتدا خرج کنید، نمی توانید از یک شرکت غول پیکر فناوری انتظار مدلی به خوبی یا قابل اعتماد بودن یک مدل زبان بزرگ (LLM) داشته باشید. با استفاده از یادگیری انتقال، می توانید از قابلیت های قدرتمند این LLM های از پیش آموزش دیده، مانند GPT، برای افزایش عملکرد مدل خود استفاده کنید.

مطلب مرتبط: نحوه استفاده از GPT-3 در بازی OpenAI

آموزش یک مدل هوش مصنوعی از ابتدا امکان پذیر است، اما برای انجام این کار به منابع بیشتری نیاز دارید.

آموزش انتقالی چگونه کار می کند؟

در اصل، سه مرحله برای انتقال یادگیری وجود دارد.

انتخاب یک مدل از پیش آموزش دیده: یک مدل از پیش آموزش دیده با استفاده از مجموعه داده های قابل توجهی از یک کار منبع، مانند ImageNet، یا مجموعه بزرگی از متن، تحت آموزش اولیه قرار می گیرد. این مرحله آموزش اولیه، مدل را قادر می سازد تا دانشی از ویژگی ها و الگوهای کلی موجود در مجموعه داده کسب کند. مقدار زمان و منابعی که از یادگیری انتقالی صرفه‌جویی می‌کنید به شباهت‌های بین مدل از پیش آموزش‌دیده و مدلی که می‌خواهید بسازید بستگی دارد.
استخراج ویژگی: هنگامی که یک مدل از پیش آموزش دیده برای تنظیم دقیق انتخاب شد، لایه های اولیه مدل از پیش آموزش دیده (نزدیک ترین به ورودی) منجمد می شوند. این بدان معناست که وزن آنها در طول تنظیم دقیق ثابت نگه داشته می شود. انجماد این لایه‌ها، دانش عمومی آموخته‌شده در مرحله پیش‌آموزشی را حفظ می‌کند و از تحت‌تاثیر قرار گرفتن آن‌ها توسط مجموعه داده‌های ویژه وظایف مدل هدف جلوگیری می‌کند. برای مدل‌هایی که به طور کامل برای کاربردهای خاص آموزش داده شده‌اند، لایه‌های نهایی مدل‌ها حذف می‌شوند یا یاد نمی‌گیرند تا مدل هدف در برنامه‌های خاص دیگر آموزش داده شود.
تنظیم دقیق: پس از اینکه مدل از پیش آموزش‌دیده منجمد شد و لایه‌های بالایی حذف شد، یک مجموعه داده جدید به الگوریتم یادگیری وارد می‌شود که سپس برای آموزش مدل جدید و ویژگی‌های کاربرد آن استفاده می‌شود.

چیزهای بیشتری از سه مرحله برای آن وجود دارد، اما این طرح کلی به طور تقریبی نحوه عملکرد فرآیند یادگیری انتقال هوش مصنوعی را با کمی تنظیم دقیق توضیح می دهد.

محدودیت‌های یادگیری انتقال هوش مصنوعی

اگرچه یادگیری انتقالی یک مفهوم ارزشمند در آموزش مدل های موثر و قابل اعتماد است، اما محدودیت های زیادی وجود دارد که هنگام استفاده از یادگیری انتقالی برای آموزش یک مدل باید بدانید.

عدم تطابق وظایف: هنگام انتخاب یک مدل پایه برای یادگیری انتقالی، باید تا حد امکان با مشکلاتی که مدل جدید حل می کند مرتبط باشد. استفاده از مدلی که گربه‌ها را برای ایجاد مدل طبقه‌بندی سگ طبقه‌بندی می‌کند، به احتمال زیاد نتایج بهتری نسبت به استفاده از مدل طبقه‌بندی خودرو برای ایجاد مدلی برای گیاهان دارد. هرچه مدل پایه با مدلی که می‌خواهید بسازید مرتبط‌تر باشد، در زمان و منابع بیشتری در طول فرآیند یادگیری انتقال صرفه‌جویی خواهید کرد.
تعصب مجموعه داده ها: اگرچه مدل های از پیش آموزش دیده اغلب در مجموعه داده های بزرگ آموزش داده می شوند، اما هنوز این احتمال وجود دارد که در طول آموزش خود سوگیری خاصی ایجاد کنند. استفاده از مدل پایه با سوگیری بالا همچنین باعث می شود که مدل تعصبات خود را به ارث ببرد، بنابراین دقت و قابلیت اطمینان مدل شما کاهش می یابد. متأسفانه، به دلیل ماهیت جعبه سیاه یادگیری عمیق، تعیین منشأ این سوگیری ها دشوار است.
تطبیق بیش از حد: یکی از مزایای اصلی یادگیری انتقال این است که می توانید از مجموعه داده نسبتاً کوچکی برای آموزش بیشتر مدل استفاده کنید. با این حال، آموزش مدل بر روی یک مجموعه داده که خیلی کوچک است ممکن است باعث بیش از حد برازش شود، که به طور قابل توجهی قابلیت اطمینان مدل را در صورت ارائه داده‌های جدید کاهش می‌دهد.

مطلب مرتبط: آنچه باید در مورد Data Binding در Vue بدانید در اینجا آمده است

بنابراین در حالی که یادگیری انتقالی یک تکنیک یادگیری هوش مصنوعی مفید است، محدودیت‌هایی وجود دارد و این یک گلوله نقره‌ای نیست.

آیا باید از آموزش انتقال استفاده کنید؟

از زمان در دسترس بودن مدل های از پیش آموزش دیده، یادگیری انتقالی همیشه برای ساخت مدل های تخصصی تر مورد استفاده قرار گرفته است. اگر یک مدل از قبل آموزش دیده مرتبط با مشکلاتی که مدل شما حل می کند، واقعاً دلیلی برای استفاده نکردن از یادگیری انتقالی وجود ندارد.

اگرچه آموزش یک مدل یادگیری ماشینی ساده از ابتدا امکان پذیر است، اما انجام این کار در یک مدل یادگیری عمیق به داده ها، زمان و مهارت زیادی نیاز دارد که اگر بتوانید یک مدل موجود مشابه مدل خود را تغییر دهید، منطقی نخواهد بود. برنامه ریزی برای آموزش بنابراین، اگر می خواهید زمان و هزینه کمتری برای آموزش یک مدل صرف کنید، سعی کنید مدل خود را از طریق آموزش انتقالی آموزش دهید.

Tags: چت بات چت جی پی تی هوش مصنوعی