GPT4All چیست و چگونه کار می کند؟

مدل‌های GPT OpenAI انقلابی در پردازش زبان طبیعی (NLP) ایجاد کرده‌اند، اما تا زمانی که برای دسترسی ممتاز به خدمات OpenAI پولی پرداخت نکنید، نمی‌توانید مدل‌های GPT آن‌ها را در برنامه‌های خود تنظیم و ادغام کنید. علاوه بر این، OpenAI به تمام مکالمات شما دسترسی خواهد داشت، که اگر از ChatGPT برای تجارت و سایر زمینه های حساس تر زندگی خود استفاده کنید، ممکن است یک مشکل امنیتی باشد. اگر علاقه ای به این کار ندارید، ممکن است بخواهید GPT4All را امتحان کنید.

بنابراین GPT4All دقیقا چیست؟ چگونه کار می کند، و چرا از آن در ChatGPT استفاده کنیم؟

GPT4All چیست؟

GPT4All یک اکوسیستم منبع باز است که برای ادغام LLM ها در برنامه ها بدون پرداخت هزینه اشتراک پلتفرم یا سخت افزار استفاده می شود. این توسط Nomic AI، یک شرکت نقشه‌برداری اطلاعات که هدف آن بهبود دسترسی به منابع هوش مصنوعی است، ایجاد شده است.

GPT4All طوری طراحی شده است که روی رایانه های شخصی مدرن تا نسبتاً مدرن بدون نیاز به اتصال به اینترنت یا حتی GPU اجرا شود! این امکان پذیر است زیرا اکثر مدل های ارائه شده توسط GPT4All به اندازه چند گیگابایت کوچک شده اند و برای اجرا فقط به 4 تا 16 گیگابایت رم نیاز دارند.

این به کسب و کارهای کوچکتر، سازمان ها و محققان مستقل اجازه می دهد تا از یک LLM برای برنامه های کاربردی خاص استفاده و ادغام کنند. و با GPT4All که به راحتی از طریق یک نصب کننده با یک کلیک قابل نصب است، مردم اکنون می توانند از GPT4All و بسیاری از LLM های آن برای ایجاد محتوا، نوشتن کد، درک اسناد و جمع آوری اطلاعات استفاده کنند.

چرا از GPT4ALL از طریق ChatGPT استفاده کنیم؟

دلایل مختلفی وجود دارد که ممکن است بخواهید از GPT4All در ChatGPT استفاده کنید.

قابل حمل بودن: مدل های ارائه شده توسط GPT4All تنها به چهار تا هشت گیگابایت حافظه نیاز دارند، برای اجرا نیازی به GPU ندارند و به راحتی می توانند با نصب کننده GPT4All با یک کلیک بر روی یک درایو فلش USB ذخیره شوند. این باعث می‌شود که GPT4All و مدل‌های آن واقعاً قابل حمل و قابل استفاده در تقریباً هر رایانه مدرن موجود باشد.
حریم خصوصی و امنیت: همانطور که قبلاً توضیح داده شد، مگر اینکه به ChatGPT Plus دسترسی داشته باشید، همه تبدیل‌های ChatGPT شما توسط OpenAI قابل دسترسی هستند. GPT4All بر شفافیت داده ها و حفظ حریم خصوصی متمرکز است. اطلاعات شما فقط در سخت افزار محلی شما ذخیره می شود مگر اینکه عمداً آن را با GPT4All به اشتراک بگذارید تا به رشد مدل های آنها کمک کنید.
حالت آفلاین: GPT یک مدل اختصاصی است که برای جستجو یا دسترسی به مدل نیاز به دسترسی API و اتصال اینترنت ثابت دارد. اگر اتصال اینترنت را قطع کنید یا مشکل سرور داشته باشید، به ChatGPT دسترسی نخواهید داشت. این مورد در مورد GPT4All نیست. از آنجایی که تمام داده ها قبلاً در یک بسته چهار تا هشت گیگابایتی ذخیره شده است و استنباط به صورت محلی انجام می شود، برای دسترسی به هیچ مدلی در GPT4All نیازی به اتصال اینترنت ندارید. حتی بدون اتصال به اینترنت می توانید به چت و تنظیم دقیق مدل خود ادامه دهید.
رایگان و منبع باز: چندین LLM ارائه شده توسط GPT4All تحت مجوز GPL-2 هستند. این به هر کسی اجازه می‌دهد تا مدل‌های خود را برای استفاده تجاری بدون نیاز به پرداخت هزینه‌ای برای مجوز تنظیم و ادغام کند.

مطلب مرتبط: احساس ناامیدی؟ 5 وب سایت خبری خوب برای تشویق شما

چگونه GPT4All کار می کند

همانطور که قبلاً گفته شد، GPT4All یک اکوسیستم است که برای آموزش و استقرار LLM ها به صورت محلی روی رایانه شما استفاده می شود، که یک شاهکار باورنکردنی است! به طور معمول، بارگیری یک LLM استاندارد 25-30 گیگابایتی به 32 گیگابایت رم و یک GPU درجه یک سازمانی نیاز دارد.

برای مقایسه، LLM هایی که می توانید با GPT4All استفاده کنید فقط به 3 تا 8 گیگابایت فضای ذخیره سازی نیاز دارند و می توانند با 4 تا 16 گیگابایت رم کار کنند. این امر اجرای کل LLM را بر روی یک دستگاه لبه بدون نیاز به GPU یا کمک ابری خارجی امکان پذیر می کند.

نیازهای سخت افزاری برای اجرای LLM در GPT4All به لطف کوانتیزه کردن شبکه عصبی به میزان قابل توجهی کاهش یافته است. با کاهش وزن دقیق و فعال سازی در یک شبکه عصبی، بسیاری از مدل های ارائه شده توسط GPT4All را می توان بر روی اکثر رایانه های نسبتاً مدرن اجرا کرد.

داده‌های آموزشی مورد استفاده در برخی از مدل‌های موجود، از طریق «شمع» جمع‌آوری شده‌اند، که فقط داده‌های خراشیده شده از محتوای منتشر شده عمومی در اینترنت است. سپس داده‌ها به پایگاه داده Atlas AI Nomic AI فرستاده می‌شود، که می‌توان آن را بر اساس همبستگی‌ها در یک نقشه برداری دوبعدی که به راحتی قابل مشاهده است (همچنین به عنوان پایگاه داده برداری هوش مصنوعی شناخته می‌شود) مشاهده کرد.

با آموزش Nomic AI مدل Groovy و با استفاده از داده‌های در دسترس عموم، Nomic AI توانست این مدل را با مجوز GPL آزاد منتشر کند که به همه اجازه می‌دهد از آن استفاده کنند، حتی برای برنامه‌های تجاری.

مطلب مرتبط: چه چیزی در برنامه تنظیمات پیشرفته ویندوز 11 گنجانده شده است؟

نحوه نصب GPT4All

نصب GPT4All ساده است و اکنون که GPT4All نسخه 2 منتشر شده است، حتی ساده تر است! بهترین راه برای نصب GPT4All 2 دانلود نصب کننده با یک کلیک است:

دانلود:GPT4All برای Windows، macOS یا Linux (رایگان)

دستورالعمل های زیر برای ویندوز است، اما می توانید GPT4All را روی هر سیستم عامل اصلی نصب کنید.

پس از دانلود، بر روی نصب کننده دوبار کلیک کرده و Install را انتخاب کنید. Windows Defender ممکن است نصب را مخرب ببیند زیرا فرآیند ارائه امضای معتبر برای برنامه‌های شخص ثالث توسط مایکروسافت ممکن است طولانی شود. با این حال، این باید به زودی برطرف شود. در زمان نوشتن، تا زمانی که برنامه GPT4All را از وب سایت رسمی دانلود کرده اید، باید در امان باشید. برای نصب GPT4All بر روی Install Anyway کلیک کنید.

پس از باز کردن برنامه، باید مدلی را برای استفاده انتخاب کنید. GPT4ALL چندین مدل را در اختیار شما قرار می دهد که همگی نقاط قوت و ضعف خود را دارند. برای اینکه بدانید کدام مدل را دانلود کنید، در اینجا جدولی وجود دارد که نقاط قوت و ضعف آنها را نشان می دهد.

مدل

اندازه

توجه داشته باشید

پارامترها

تایپ کنید

کوانتیزاسیون

هرمس

7.58 گیگابایت

مبتنی بر دستورالعمل
پاسخ های طولانی می دهد
با 300000 دستورالعمل بدون سانسور انتخاب شده است
قابل استفاده تجاری نیست

13 میلیارد

LLaMA

q4_0

GPT4All Falcon

3.78 گیگابایت

پاسخ های سریع
مبتنی بر دستورالعمل
دارای مجوز برای استفاده تجاری

7 میلیارد

شاهین

q4_0

شیار

8 گیگابایت

پاسخ های سریع
-پاسخ های خلاقانه
مبتنی بر دستورالعمل
دارای مجوز برای استفاده تجاری

7 میلیارد

GPT-J

q4_0

ChatGPT-3.5 توربو

حداقل

به API شخصی نیاز دارد
چت های شما را به OpenAI ارسال می کند
GPT4All فقط برای برقراری ارتباط با OpenAI استفاده می شود

GPT

ChatGPT-4

حداقل

به API شخصی نیاز دارد
چت های شما را به OpenAI ارسال می کند
GPT4All فقط برای برقراری ارتباط با OpenAI استفاده می شود

GPT

چرت و پرت

7.58 گیگابایت

مبتنی بر دستورالعمل
کندتر از Groovy اما با پاسخ های با کیفیت بالاتر
قابل استفاده تجاری نیست

13 میلیارد

LLaMA

q4_0

MPT Chat

4.52 گیگابایت

پاسخ های سریع
چت مبتنی بر
قابل استفاده تجاری نیست

7 میلیارد

مطلب مرتبط: تسلا نیمه چیست و چه زمانی عرضه می شود؟

MPT

q4_0

اورکا

3.53 گیگابایت

مبتنی بر دستورالعمل
مجموعه داده های تنظیم شده را توضیح می دهد
رویکردهای ساخت مجموعه داده مقاله تحقیقاتی Orca
دارای مجوز برای استفاده تجاری

7 میلیارد

OpenLLaMA

q4_0

ویکونا

3.92 گیگابایت

مبتنی بر دستورالعمل
قابل استفاده تجاری نیست

7 میلیارد

LLaMA

q4_2

جادوگر

3.92 گیگابایت

مبتنی بر دستورالعمل
قابل استفاده تجاری نیست

7 میلیارد

LLaMA

q4_2

جادوگر بدون سانسور

7.58 گیگابایت

مبتنی بر دستورالعمل
قابل استفاده تجاری نیست

13 میلیارد

LLaMA

q4_0

به خاطر داشته باشید که مدل های ارائه شده دارای محدودیت های مختلفی هستند. همه مدل ها را نمی توان به صورت تجاری به صورت رایگان استفاده کرد. برخی به منابع سخت افزاری بیشتری نیاز دارند، در حالی که برخی دیگر به یک کلید API نیاز دارند. کمترین محدودیت موجود در GPT4All عبارتند از Groovy، GPT4All Falcon و Orca.

آیا می توانید مدل های GPT4All را آموزش دهید؟

بله، اما نه نسخه های کوانتیزه شده. برای تنظیم دقیق مدل‌های GPT4All، باید مدل‌های خام را دانلود کنید و از پردازنده‌های گرافیکی درجه یک مانند AMD’s Instinct Accelerators یا پردازنده‌های گرافیکی Ampere یا Hopper NVIDIA استفاده کنید. علاوه بر این، شما باید مدل را از طریق یک چارچوب آموزشی هوش مصنوعی مانند LangChain آموزش دهید، که به دانش فنی نیاز دارد.

تنظیم دقیق یک مدل GPT4All به برخی منابع پولی و همچنین دانش فنی نیاز دارد، اما اگر فقط می‌خواهید داده‌های سفارشی مدل GPT4All را تغذیه کنید، می‌توانید به آموزش مدل از طریق بازیابی تولید افزوده (که به مدل زبانی کمک می‌کند تا دسترسی پیدا کند ادامه دهید. و اطلاعات خارج از آموزش پایه خود را برای تکمیل وظایف درک کند). می‌توانید این کار را با درخواست از GPT4All برای مدل‌سازی داده‌های سفارشی شما قبل از پرسیدن سؤال انجام دهید. داده های سفارشی باید به صورت محلی ذخیره شوند، و زمانی که از شما خواسته شد، مدل باید بتواند اطلاعاتی را که زمانی داده اید در اختیار شما قرار دهد.

آیا باید از GTP4All استفاده کنید؟

ایده GPT4All ارائه یک پلت فرم رایگان و منبع باز است که افراد می توانند مدل های زبان بزرگ را بر روی رایانه خود اجرا کنند. در حال حاضر، GPT4All و مدل های کوانتیزه آن برای آزمایش، یادگیری و آزمایش LLM های مختلف در یک محیط امن عالی هستند. برای بارهای کاری حرفه ای، ما همچنان استفاده از ChatGPT را توصیه می کنیم زیرا این مدل به طور قابل توجهی توانایی بیشتری دارد.

به طور کلی، هیچ دلیلی وجود ندارد که شما خود را به یکی محدود کنید. از آنجایی که مورد استفاده آنها با هم همپوشانی ندارد، باید از هر دو استفاده کنید.