Meta’s Llama 2 اینجاست، و اینگونه است که می توانید آن را به دست آورید.
از GPT-4 OpenAI گرفته تا PalM 2 Google، مدلهای زبان بزرگ بر سرفصلهای فناوری تسلط دارند. هر مدل جدید وعده می دهد که بهتر و قدرتمندتر از مدل قبلی باشد و گاهی اوقات از هر رقیب موجود فراتر می رود.
با این حال، تعداد مدلهای موجود، ظهور مدلهای جدید را کند نکرده است. اکنون، شرکت مادر فیسبوک، متا، Llama 2، یک مدل زبان جدید قدرتمند را منتشر کرده است. اما چه چیزی در مورد Llama 2 منحصر به فرد است؟ چه تفاوتی با GPT-4، PalM 2 و Claude 2 دارد و چرا باید به آن اهمیت دهید؟
لاما 2 چیست؟
Llama 2، یک مدل زبان بزرگ، محصول اتحاد غیر معمول بین متا و مایکروسافت، دو غول فناوری رقیب در خط مقدم تحقیقات هوش مصنوعی است. این جانشین مدل زبان Meta’s Llama 1 است که در سه ماهه اول سال 2023 منتشر شد.
می توان گفت که این معادل متا است از Google’s Palm 2، OpenAIs GPT-4، و Anthropic’s Claude 2. این مجموعه بر روی مجموعه داده گسترده ای از داده های اینترنتی در دسترس عموم آموزش داده شده است، و از مزیت مجموعه داده ای جدیدتر و متنوع تر از آن بهره می برد. برای آموزش Llama 1 استفاده شد. Llama 2 با 40٪ داده بیشتر نسبت به نسخه قبلی خود آموزش داده شد و طول زمینه دو برابر (4k) دارد.
اگر در گذشته فرصت تعامل با Llama 1 را داشتید اما از خروجی آن خیلی تحت تأثیر قرار نگرفتید، Llama 2 از نسخه قبلی خود بهتر عمل می کرد و ممکن است همان چیزی باشد که شما نیاز دارید. اما در برابر رقابت بیرونی چگونه عمل می کند؟
Llama 2 چگونه در مقابل رقابت قرار می گیرد؟
خب، این بستگی به رقابتی دارد که با آن روبرو است. اولا، Llama 2 یک پروژه منبع باز است. این بدان معنی است که متا کل مدل را منتشر می کند تا هر کسی بتواند از آن برای ساخت مدل ها یا برنامه های جدید استفاده کند. اگر Llama 2 را با دیگر مدلهای اصلی زبان منبع باز مانند Falcon یا MBT مقایسه کنید، متوجه خواهید شد که در چندین معیار از آنها بهتر است. به جرات می توان گفت Llama 2 یکی از قدرتمندترین مدل های زبان بزرگ منبع باز در بازار امروز است.
با این حال، Llama 2 زمانی که با عواملی مانند GPT OpenAI و مدلهای AI پالم گوگل روبرو میشود، برتری خود را از دست میدهد. هنگام رسیدگی به وظایفی که نیاز به خلاقیت دارند، Llama 2 کمی اینجا و آنجا است. بسته به نوع آن که آزمایش می کنید، ممکن است خروجی مشابهی را که از مدل های Anthropic و OpenAI دریافت می کنید، دریافت نکنید.
Llama 2 در دفاع از خود، بیشتر یک “مدل بنیادی” است و نه یک “لحن دقیق”. مدلهای بنیادی، مدلهای زبان بزرگی هستند که با در نظر گرفتن انطباقهای احتمالی آینده ساخته شدهاند. آنها به هیچ حوزه خاصی تنظیم نشده اند، اما به گونه ای ساخته شده اند که بتوانند با طیف وسیعی از وظایف، هرچند، گاهی اوقات، با توانایی های محدود، مقابله کنند.
از سوی دیگر، یک مدل دقیق تنظیم شده یک مدل پایه است که برای افزایش کارایی آن در یک حوزه خاص تنظیم شده است. این مانند استفاده از یک مدل پایه مانند GPT و تنظیم دقیق آن در ChatGPT است، بنابراین می تواند توسط عموم استفاده شود.
نحوه استفاده از Llama 2 در حال حاضر
اگرچه Llama 2 در یک پلتفرم عمومی مانند ChatGPT در دسترس نیست، اما همچنان می توانید با دانلود یک کپی از مدل و اجرای آن به صورت محلی یا استفاده از دسترسی به آن از طریق یک نمونه میزبانی ابری Hugging Face، مدل را به دست آورید.
برای دسترسی به Llama on Hugging Face، به سادگی پیوند مربوطه Hugging Face را در زیر باز کنید و شروع به درخواست چت ربات هوش مصنوعی کنید.
- 7B پارامتر Llama-2 چت
- 13B پارامتر Llama-2 چت
- گپ 70B Llama-2
مدلهای Llama بالا برای برنامههای مکالمه بهخوبی تنظیم شدهاند، بنابراین نزدیکترین مدل به ChatGPT است که برای مدل Llama-2 دریافت میکنید. مطمئن نیستید کدام نسخه را امتحان کنید؟ ما گزینه سه را پیشنهاد می کنیم، چت با پارامترهای 70B Llama-2. شما هنوز هم می توانید با هر سه مدل بازی کنید تا ببینید کدام یک برای نیازهای منحصر به فرد شما بهتر عمل می کند.
ما از چت Llama-2 با پارامتر 70B متا برای چرخش استفاده کردیم و نتایج چشمگیر بود. برای آزمایش خلاقیت و حس شوخ طبعی آن، تست خلاقیت و طعنه خود را به آن دادیم. ما از مدل هوش مصنوعی خواستیم مکالمه بین دو نفر را که در مورد مزیت های رفتن به فضا با هم بحث می کنند شبیه سازی کند و در اینجا نتایج آمده است.
به دنبال:
و در نهایت:
تمام جزئیات در دستورالعمل های ما درست نبود، اما طنز آن چشمگیر بود.
از طرف دیگر، اگر عمق فنی لازم برای اجرای مدل Llama به صورت محلی بر روی دستگاه خود را دارید، می توانید با استفاده از فرم درخواست دسترسی Llama متا درخواست دسترسی به مدل کنید. پس از ارائه نام، ایمیل، مکان و نام سازمان شما، متا درخواست شما را بررسی میکند، پس از آن دسترسی یا رد میشود یا در یک پنجره چند ساعته تا دو روزه به آن اجازه دسترسی داده میشود. دسترسی من در عرض چند دقیقه اعطا شد، بنابراین امیدوارم شما هم خوش شانس باشید.
لاما 2: قدم اول مهم
Llama 2 ممکن است پیچیده ترین مدل زبان موجود نباشد، اما به دلیل منبع باز بودن، اولین گام مهم به سمت توسعه شفاف و پیشروانه هوش مصنوعی را نشان می دهد.
در حالی که شرکت هایی مانند OpenAI GPT در حال حاضر عملکرد بهتری دارند، رویکرد باغ دیواری OpenAI برای توسعه به این معنی است که رشد و سرعت توسعه مدل توسط شرکت کنترل می شود. با یک مدل منبع باز مانند Llama، جامعه منبع باز گسترده تر می تواند به طور مکرر برای ساخت محصولات جدیدی که ممکن است در یک سیستم باغ دیواری امکان پذیر نباشد، نوآوری کند.