مدلهای GPT OpenAI انقلابی در پردازش زبان طبیعی (NLP) ایجاد کردهاند، اما تا زمانی که برای دسترسی ممتاز به خدمات OpenAI پولی پرداخت نکنید، نمیتوانید مدلهای GPT آنها را در برنامههای خود تنظیم و ادغام کنید. علاوه بر این، OpenAI به تمام مکالمات شما دسترسی خواهد داشت، که اگر از ChatGPT برای تجارت و سایر زمینه های حساس تر زندگی خود استفاده کنید، ممکن است یک مشکل امنیتی باشد. اگر علاقه ای به این کار ندارید، ممکن است بخواهید GPT4All را امتحان کنید.
مدلهای GPT OpenAI انقلابی در پردازش زبان طبیعی (NLP) ایجاد کردهاند، اما تا زمانی که برای دسترسی ممتاز به خدمات OpenAI پولی پرداخت نکنید، نمیتوانید مدلهای GPT آنها را در برنامههای خود تنظیم و ادغام کنید. علاوه بر این، OpenAI به تمام مکالمات شما دسترسی خواهد داشت، که اگر از ChatGPT برای تجارت و سایر زمینه های حساس تر زندگی خود استفاده کنید، ممکن است یک مشکل امنیتی باشد. اگر علاقه ای به این کار ندارید، ممکن است بخواهید GPT4All را امتحان کنید.
بنابراین GPT4All دقیقا چیست؟ چگونه کار می کند، و چرا از آن در ChatGPT استفاده کنیم؟
GPT4All چیست؟
GPT4All یک اکوسیستم منبع باز است که برای ادغام LLM ها در برنامه ها بدون پرداخت هزینه اشتراک پلتفرم یا سخت افزار استفاده می شود. این توسط Nomic AI، یک شرکت نقشهبرداری اطلاعات که هدف آن بهبود دسترسی به منابع هوش مصنوعی است، ایجاد شده است.
GPT4All طوری طراحی شده است که روی رایانه های شخصی مدرن تا نسبتاً مدرن بدون نیاز به اتصال به اینترنت یا حتی GPU اجرا شود! این امکان پذیر است زیرا اکثر مدل های ارائه شده توسط GPT4All به اندازه چند گیگابایت کوچک شده اند و برای اجرا فقط به 4 تا 16 گیگابایت رم نیاز دارند.
این به کسب و کارهای کوچکتر، سازمان ها و محققان مستقل اجازه می دهد تا از یک LLM برای برنامه های کاربردی خاص استفاده و ادغام کنند. و با GPT4All که به راحتی از طریق یک نصب کننده با یک کلیک قابل نصب است، مردم اکنون می توانند از GPT4All و بسیاری از LLM های آن برای ایجاد محتوا، نوشتن کد، درک اسناد و جمع آوری اطلاعات استفاده کنند.
چرا از GPT4ALL از طریق ChatGPT استفاده کنیم؟
دلایل مختلفی وجود دارد که ممکن است بخواهید از GPT4All در ChatGPT استفاده کنید.
- قابل حمل بودن: مدل های ارائه شده توسط GPT4All تنها به چهار تا هشت گیگابایت حافظه نیاز دارند، برای اجرا نیازی به GPU ندارند و به راحتی می توانند با نصب کننده GPT4All با یک کلیک بر روی یک درایو فلش USB ذخیره شوند. این باعث میشود که GPT4All و مدلهای آن واقعاً قابل حمل و قابل استفاده در تقریباً هر رایانه مدرن موجود باشد.
- حریم خصوصی و امنیت: همانطور که قبلاً توضیح داده شد، مگر اینکه به ChatGPT Plus دسترسی داشته باشید، همه تبدیلهای ChatGPT شما توسط OpenAI قابل دسترسی هستند. GPT4All بر شفافیت داده ها و حفظ حریم خصوصی متمرکز است. اطلاعات شما فقط در سخت افزار محلی شما ذخیره می شود مگر اینکه عمداً آن را با GPT4All به اشتراک بگذارید تا به رشد مدل های آنها کمک کنید.
- حالت آفلاین: GPT یک مدل اختصاصی است که برای جستجو یا دسترسی به مدل نیاز به دسترسی API و اتصال اینترنت ثابت دارد. اگر اتصال اینترنت را قطع کنید یا مشکل سرور داشته باشید، به ChatGPT دسترسی نخواهید داشت. این مورد در مورد GPT4All نیست. از آنجایی که تمام داده ها قبلاً در یک بسته چهار تا هشت گیگابایتی ذخیره شده است و استنباط به صورت محلی انجام می شود، برای دسترسی به هیچ مدلی در GPT4All نیازی به اتصال اینترنت ندارید. حتی بدون اتصال به اینترنت می توانید به چت و تنظیم دقیق مدل خود ادامه دهید.
- رایگان و منبع باز: چندین LLM ارائه شده توسط GPT4All تحت مجوز GPL-2 هستند. این به هر کسی اجازه میدهد تا مدلهای خود را برای استفاده تجاری بدون نیاز به پرداخت هزینهای برای مجوز تنظیم و ادغام کند.
چگونه GPT4All کار می کند
همانطور که قبلاً گفته شد، GPT4All یک اکوسیستم است که برای آموزش و استقرار LLM ها به صورت محلی روی رایانه شما استفاده می شود، که یک شاهکار باورنکردنی است! به طور معمول، بارگیری یک LLM استاندارد 25-30 گیگابایتی به 32 گیگابایت رم و یک GPU درجه یک سازمانی نیاز دارد.
برای مقایسه، LLM هایی که می توانید با GPT4All استفاده کنید فقط به 3 تا 8 گیگابایت فضای ذخیره سازی نیاز دارند و می توانند با 4 تا 16 گیگابایت رم کار کنند. این امر اجرای کل LLM را بر روی یک دستگاه لبه بدون نیاز به GPU یا کمک ابری خارجی امکان پذیر می کند.
نیازهای سخت افزاری برای اجرای LLM در GPT4All به لطف کوانتیزه کردن شبکه عصبی به میزان قابل توجهی کاهش یافته است. با کاهش وزن دقیق و فعال سازی در یک شبکه عصبی، بسیاری از مدل های ارائه شده توسط GPT4All را می توان بر روی اکثر رایانه های نسبتاً مدرن اجرا کرد.
دادههای آموزشی مورد استفاده در برخی از مدلهای موجود، از طریق «شمع» جمعآوری شدهاند، که فقط دادههای خراشیده شده از محتوای منتشر شده عمومی در اینترنت است. سپس دادهها به پایگاه داده Atlas AI Nomic AI فرستاده میشود، که میتوان آن را بر اساس همبستگیها در یک نقشه برداری دوبعدی که به راحتی قابل مشاهده است (همچنین به عنوان پایگاه داده برداری هوش مصنوعی شناخته میشود) مشاهده کرد.
با آموزش Nomic AI مدل Groovy و با استفاده از دادههای در دسترس عموم، Nomic AI توانست این مدل را با مجوز GPL آزاد منتشر کند که به همه اجازه میدهد از آن استفاده کنند، حتی برای برنامههای تجاری.
نحوه نصب GPT4All
نصب GPT4All ساده است و اکنون که GPT4All نسخه 2 منتشر شده است، حتی ساده تر است! بهترین راه برای نصب GPT4All 2 دانلود نصب کننده با یک کلیک است:
دانلود:GPT4All برای Windows، macOS یا Linux (رایگان)
دستورالعمل های زیر برای ویندوز است، اما می توانید GPT4All را روی هر سیستم عامل اصلی نصب کنید.
پس از دانلود، بر روی نصب کننده دوبار کلیک کرده و Install را انتخاب کنید. Windows Defender ممکن است نصب را مخرب ببیند زیرا فرآیند ارائه امضای معتبر برای برنامههای شخص ثالث توسط مایکروسافت ممکن است طولانی شود. با این حال، این باید به زودی برطرف شود. در زمان نوشتن، تا زمانی که برنامه GPT4All را از وب سایت رسمی دانلود کرده اید، باید در امان باشید. برای نصب GPT4All بر روی Install Anyway کلیک کنید.
پس از باز کردن برنامه، باید مدلی را برای استفاده انتخاب کنید. GPT4ALL چندین مدل را در اختیار شما قرار می دهد که همگی نقاط قوت و ضعف خود را دارند. برای اینکه بدانید کدام مدل را دانلود کنید، در اینجا جدولی وجود دارد که نقاط قوت و ضعف آنها را نشان می دهد.
مدل
اندازه
توجه داشته باشید
پارامترها
تایپ کنید
کوانتیزاسیون
هرمس
7.58 گیگابایت
- مبتنی بر دستورالعمل
- پاسخ های طولانی می دهد
- با 300000 دستورالعمل بدون سانسور انتخاب شده است
- قابل استفاده تجاری نیست
13 میلیارد
LLaMA
q4_0
GPT4All Falcon
3.78 گیگابایت
- پاسخ های سریع
- مبتنی بر دستورالعمل
- دارای مجوز برای استفاده تجاری
7 میلیارد
شاهین
q4_0
شیار
8 گیگابایت
- پاسخ های سریع
- -پاسخ های خلاقانه
- مبتنی بر دستورالعمل
- دارای مجوز برای استفاده تجاری
7 میلیارد
GPT-J
q4_0
ChatGPT-3.5 توربو
حداقل
- به API شخصی نیاز دارد
- چت های شما را به OpenAI ارسال می کند
- GPT4All فقط برای برقراری ارتباط با OpenAI استفاده می شود
GPT
NA
ChatGPT-4
حداقل
- به API شخصی نیاز دارد
- چت های شما را به OpenAI ارسال می کند
- GPT4All فقط برای برقراری ارتباط با OpenAI استفاده می شود
GPT
NA
چرت و پرت
7.58 گیگابایت
- مبتنی بر دستورالعمل
- کندتر از Groovy اما با پاسخ های با کیفیت بالاتر
- قابل استفاده تجاری نیست
13 میلیارد
LLaMA
q4_0
MPT Chat
4.52 گیگابایت
- پاسخ های سریع
- چت مبتنی بر
- قابل استفاده تجاری نیست
7 میلیارد
MPT
q4_0
اورکا
3.53 گیگابایت
- مبتنی بر دستورالعمل
- مجموعه داده های تنظیم شده را توضیح می دهد
- رویکردهای ساخت مجموعه داده مقاله تحقیقاتی Orca
- دارای مجوز برای استفاده تجاری
7 میلیارد
OpenLLaMA
q4_0
ویکونا
3.92 گیگابایت
- مبتنی بر دستورالعمل
- قابل استفاده تجاری نیست
7 میلیارد
LLaMA
q4_2
جادوگر
3.92 گیگابایت
- مبتنی بر دستورالعمل
- قابل استفاده تجاری نیست
7 میلیارد
LLaMA
q4_2
جادوگر بدون سانسور
7.58 گیگابایت
- مبتنی بر دستورالعمل
- قابل استفاده تجاری نیست
13 میلیارد
LLaMA
q4_0
به خاطر داشته باشید که مدل های ارائه شده دارای محدودیت های مختلفی هستند. همه مدل ها را نمی توان به صورت تجاری به صورت رایگان استفاده کرد. برخی به منابع سخت افزاری بیشتری نیاز دارند، در حالی که برخی دیگر به یک کلید API نیاز دارند. کمترین محدودیت موجود در GPT4All عبارتند از Groovy، GPT4All Falcon و Orca.
آیا می توانید مدل های GPT4All را آموزش دهید؟
بله، اما نه نسخه های کوانتیزه شده. برای تنظیم دقیق مدلهای GPT4All، باید مدلهای خام را دانلود کنید و از پردازندههای گرافیکی درجه یک مانند AMD’s Instinct Accelerators یا پردازندههای گرافیکی Ampere یا Hopper NVIDIA استفاده کنید. علاوه بر این، شما باید مدل را از طریق یک چارچوب آموزشی هوش مصنوعی مانند LangChain آموزش دهید، که به دانش فنی نیاز دارد.
تنظیم دقیق یک مدل GPT4All به برخی منابع پولی و همچنین دانش فنی نیاز دارد، اما اگر فقط میخواهید دادههای سفارشی مدل GPT4All را تغذیه کنید، میتوانید به آموزش مدل از طریق بازیابی تولید افزوده (که به مدل زبانی کمک میکند تا دسترسی پیدا کند ادامه دهید. و اطلاعات خارج از آموزش پایه خود را برای تکمیل وظایف درک کند). میتوانید این کار را با درخواست از GPT4All برای مدلسازی دادههای سفارشی شما قبل از پرسیدن سؤال انجام دهید. داده های سفارشی باید به صورت محلی ذخیره شوند، و زمانی که از شما خواسته شد، مدل باید بتواند اطلاعاتی را که زمانی داده اید در اختیار شما قرار دهد.
آیا باید از GTP4All استفاده کنید؟
ایده GPT4All ارائه یک پلت فرم رایگان و منبع باز است که افراد می توانند مدل های زبان بزرگ را بر روی رایانه خود اجرا کنند. در حال حاضر، GPT4All و مدل های کوانتیزه آن برای آزمایش، یادگیری و آزمایش LLM های مختلف در یک محیط امن عالی هستند. برای بارهای کاری حرفه ای، ما همچنان استفاده از ChatGPT را توصیه می کنیم زیرا این مدل به طور قابل توجهی توانایی بیشتری دارد.
به طور کلی، هیچ دلیلی وجود ندارد که شما خود را به یکی محدود کنید. از آنجایی که مورد استفاده آنها با هم همپوشانی ندارد، باید از هر دو استفاده کنید.