خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

کلود 3 چیست و چه کاری می توانید با آن انجام دهید؟

این یک مسابقه ی گردن و گردن است و به نظر می رسد که کلود 3 از آنتروپیک ممکن است به تازگی جلو آمده باشد.

خلاصه عناوین

  • کلود 3 چیست؟
  • چه کاری می توانید با کلود 3 انجام دهید؟
  • کلود 3 در مقابل ChatGPT

تعاریف کلیدی

  • Claude 3 از Anthropic یک جهش قابل توجه از Claude 2 ارائه می دهد و در کارهای مختلف از GPT-4 بهتر عمل می کند.
  • با Claude 3، می‌توانید برای طیف وسیعی از پرس و جوها در زمینه‌های مختلف، بدون هزینه اشتراک، پاسخ ایجاد کنید.
  • Claude 3 به خوبی با GPT-4 ChatGPT رقابت می کند و در زمینه هایی مانند وظایف برنامه نویسی، نوشتن خلاقانه و اندازه پنجره زمینه عالی است.

Anthropic از انتشار Claude 3 – خانواده ای از مدل های هوش مصنوعی با پتانسیل ایجاد ناراحتی GPT-4 خبر داد. پتانسیل فوق‌العاده‌ای دارد، اما آیا آماده است تا تاج ChatGPT را تصاحب کند؟

کلود 3 چیست؟

Claude 3 یک خانواده از سه مدل هوش مصنوعی چندوجهی است که توسط Anthropic برای جایگزینی سری Claude 2 از مدل‌های AI توسعه یافته است. می توان گفت کلود 3 پاسخ Anthropic به Gemini گوگل و OpenAI GPT-4 است. Claude 3 که در سه نسخه Haiku، Sonnet و Opus منتشر شده است، با ترتیب روزافزون هوش، اولین مدل هوش مصنوعی چندوجهی Anthropic است و نشان دهنده جهش قابل توجهی از سری Claude 2 است.

اکنون، اگر تا به حال نام چت ربات هوش مصنوعی کلود را نشنیده باشید، قابل درک است. کلود و مدل های زیربنایی آن از وضعیت فوق ستاره ChatGPT یا جذابیت برند Gemini گوگل برخوردار نیستند. با این حال، کلود بدون شک یکی از پیشرفته ترین چت ربات های هوش مصنوعی در جهان است که در چندین زمینه کلیدی از ChatGPT بسیار تحسین شده بهتر عمل می کند.

برای قدردانی از کلود 3، مهم است که به شکست های مدل های قبلی نگاه کنیم.

  1. تکرارهای قبلی کلود به دلیل رویکردی بیش از حد به ایمنی هوش مصنوعی شهرت داشت. به عنوان مثال، ویژگی‌های ایمنی Claude 2 به قدری فشرده بودند که ربات چت از بسیاری از موضوعات اجتناب می‌کرد، حتی موضوعاتی که هیچ مشکل ایمنی واضحی نداشتند.
  2. همچنین مشکلاتی با پنجره زمینه مدل وجود داشت. وقتی از یک مدل هوش مصنوعی می‌خواهید چیزی را توضیح دهد یا مثلاً یک مقاله طولانی را خلاصه کند، تصور کنید که فقط می‌تواند چند پاراگراف مقاله را در یک زمان بخواند. این محدودیت از اینکه چه مقدار متن می تواند در یک زمان در نظر بگیرد “پنجره زمینه” نامیده می شود. نسخه‌های قبلی Claude با 200 هزار توکن (معادل 150000 کلمه) پنجره زمینه ارائه می‌شد. با این حال، این مدل عملاً قادر به مقابله با این مقدار متن در یک حرکت بدون فراموش کردن بخش‌هایی از آن نبود.
  3. بحث چندوجهی هم وجود داشت. تقریباً همه مدل‌های اصلی هوش مصنوعی چندوجهی شده‌اند، به این معنی که می‌توانند اشکال دیگری از داده‌ها مانند تصاویر را پردازش کنند و به آن داده‌ها پاسخ دهند (به‌جای ورودی متن). کلود نتوانست این کار را انجام دهد.
مطلب مرتبط:   3 روش جالب هوش مصنوعی برای تغییر جستجوی گوگل

اکنون هر سه مشکل به طور کامل یا حداقل تا حدی با انتشار کلود 3 برطرف شده است.

چه کاری می توانید با کلود 3 انجام دهید؟

رابط چت بات هوش مصنوعی کلود

دقیقاً مانند اکثر مدل‌های پیشرفته هوش مصنوعی، Claude 3 می‌تواند پاسخ‌های درجه یک برای پرس و جوهای مختلف در زمینه‌های مختلف ایجاد کند. خواه به حل سریع مشکل جبر نیاز داشته باشید، یک آهنگ کاملاً جدید نوشته شده، یک مقاله عمیق پیش نویس شده، کد نوشته شده برای نرم افزار، یا یک مجموعه داده انبوه تجزیه و تحلیل شده باشد، کلود 3 با این شرایط مطابقت دارد.

اما اکثر مدل‌های هوش مصنوعی در حال حاضر در این وظایف خوب هستند، پس چرا از Claude 3 استفاده کنیم؟

پاسخ ساده است؛ Claude 3 فقط یک مدل هوش مصنوعی دیگر نیست که در این کارها خوب عمل می کند، بلکه پیشرفته ترین مدل هوش مصنوعی چندوجهی آزادانه است که می توانید در هر کجای اینترنت دریافت کنید. بله، Gemini وجود دارد، قاتل GPT-4 که ​​بسیار مورد ادعای گوگل قرار گرفته است، که عملکرد چشمگیری در تست های بنچمارک دارد. با این حال، Anthropic ادعا می کند که Claude 3 در چندین کار با یک حاشیه قابل توجه از آن بهتر عمل می کند. در حالی که نتایج بنچمارک چیزی است که ما اغلب باید با یک دانه نمک از آن استفاده کنیم، من هر دو مدل هوش مصنوعی را مورد آزمایش قرار دادم و برتری مدل Claude 3 در چندین مورد مهم بسیار واضح بود.

بنابراین، Claude 3 به شما امکان می دهد بیشتر کارهایی را که می توانید با Gemini و GPT-4 انجام دهید (منهای تولید تصویر) بدون پرداخت هزینه اشتراک 20 دلاری برای حق بیمه ChatGPT.

کلود 3 در مقابل ChatGPT

لوگوهای ChatGPT در مقابل Claude AI

یک راه سریع برای آزمایش عملکرد یک مدل هوش مصنوعی این است که بررسی کنید چقدر در برابر بهترین های بازار: GPT-4 قرار می گیرد. البته من هر دو مدل رو تست کردم. کلود 3 آنتروپیک چقدر در مقابل GPT-4 عظیم الجثه قرار می گیرد؟

کلود در مقابل ChatGPT: مهارت های کدنویسی

با شروع با رشته ای از وظایف برنامه نویسی، کلود 3 با توانایی GPT -4 در تمام وظایف برنامه نویسی اولیه ارائه شده مطابقت داشت و حتی در برخی از آن ها بهتر عمل کرد. در حالی که من فقط اصول اولیه را آزمایش کردم، نسخه قبلی Claude به طور قابل توجهی در همان کارها مهارت کمتری داشت وقتی که آن را در این مقایسه ChatGPT در مقابل Claude در سپتامبر 2023 آزمایش کردیم. به عنوان مثال، وقتی از هر دو مدل خواستیم یک کار ساده بسازند. برنامه لیست، کلود در همه موارد ناموفق بود، در حالی که ChatGPT آنچه را که در آن زمان عملکرد پنج ستاره می نامیدیم ارائه داد.

مطلب مرتبط:   7 روش مسئول برای استفاده از هوش مصنوعی به عنوان نویسنده یا ویرایشگر محتوا

با آخرین نسخه، Claude 3 در هر سه موردی که آزمایش کردیم، یک برنامه لیست کارهای با عملکرد بهتر تولید کرد. در اینجا نتیجه GPT-4 است که از شما خواسته می شود یک برنامه لیست کارها ایجاد کنید.

ChatGPT GPT-4 یک برنامه فهرست کار می سازد

و در اینجا نتیجه کلود 3 است که از آن خواسته می شود همین کار را انجام دهد.

کلود 3 برنامه لیست کارها را می سازد

هر دو برنامه تا حدی کاربردی بودند، اما واضح است که Claude 3 در این مورد بهتر عمل کرده است.

پس از آزمایش‌های پیچیده‌تر برنامه‌نویسی، کلود در چندین مورد مدل بهتری بود، در حالی که GPT-4 نیز برنده‌های خود را داشت. در حالی که نمی توانم به طور قطعی بگویم Claude 3 در منطق برنامه نویسی بهتر است، اگر فاصله زیادی بین این دو مدل وجود داشت، تقریباً به طور قطع این شکاف کاهش می یافت.

کلود در مقابل ChatGPT: استدلال عقل سلیم

من پیش رفتم تا هر دو مدل را روی استدلال عقل سلیم آزمایش کنم. کار با چت ربات های هوش مصنوعی پارادوکس جالبی است. چت ربات‌های هوش مصنوعی می‌توانند کارهای پیچیده را به راحتی انجام دهند، اما اغلب با مشکلات اساسی که نیاز به عقل سلیم یا منطق دارند، دست و پنجه نرم می‌کنند. بنابراین، ما به هر دو مدل یک سری سؤالات به ظاهر ساده دادیم که برای پاسخ صحیح به عقل سلیم نیاز داشت.

از پنج سوال این چنینی، هر دو مدل به هر پنج سوال پاسخ منطقی دادند. ما از هر دو چت ربات یک سوال پرسیدیم: اگر یک سفینه فضایی از مریخ به دو قسمت تقسیم شود، یک قسمت به اقیانوس اطلس نزدیک برزیل و قسمت دیگر به اقیانوس آرام در نزدیکی ژاپن سقوط کند، بازماندگان را کجا دفن می‌کنید؟

ChatGPT به سؤال ترفندی پاسخ می دهد

ChatGPT حتی بدون GPT-4 به درستی پاسخ داد. اگر دلیل انتخاب سوال را می‌پرسید، خوب، چت‌بات‌ها از نظر تاریخی به طرز تاسف‌باری در این نوع خط سوال شکست خورده‌اند. بعد نوبت کلود بود که جواب بدهد.

آزمایش کلود 3 بر روی استدلال عقل سلیم

پاسخ کلود دقیقاً یک پاسخ قطعی نبود، اما می‌توانست اطلاعات کلیدی را شناسایی کند. شما بازماندگان را دفن نمی کنید توجه به این نکته مهم است که آخرین باری که از کلود 2 سوال مشابهی پرسیدیم، نتوانست از طریق تله عقل سلیم ببیند.

کلود در مقابل ChatGPT: نوشتن خلاق

در دنیای واقعی، یکی از محبوب‌ترین موارد استفاده برای چت ربات‌های هوش مصنوعی، تولید متن خلاقانه در همه اشکال است: مقالات، نامه‌ها، متن آهنگ. بنابراین، من هر دو مدل را آزمایش کردم تا مشخص کنم کدام یک متن با صدای انسانی بهتری ایجاد می کند.

مطلب مرتبط:   8 روش برای استفاده از ChatGPT Vision

ایده این است که نتایج نباید فقط «درست» یا خلاقانه (به نوعی روباتیک) باشد، بلکه باید به نظر برسد که گویی توسط یک انسان نوشته شده است. من هر دو مدل را موظف کردم که شعر یک آهنگ رپ درباره پرورش خیار و میلیونر شدن از آنها را بسازند. چه کسی در مورد خیار آهنگ رپ می نویسد؟ این ایده است – چیزی چالش برانگیز!

برداشت ChatGPT در اینجا آمده است:

ChatGPT شعر یک آهنگ رپ را می نویسد

و در اینجا پاسخ کلود با استفاده از همان اعلان است.

کلود شعر یک آهنگ را می نویسد

ممکن است ذهنی باشد، اما به نظر می رسد کلود گزینه بهتری در اینجا باشد. زمانی که هر دو ابزار وظیفه تهیه پیش نویس سه مقاله در مورد موضوعات مختلف را داشتند، کلود گزینه بهتری را در هر سه مورد ارائه کرد. نتیجه ای شبیه به انسان ایجاد کرد و از الگوهایی که معمولاً با متون تولید شده توسط هوش مصنوعی مرتبط هستند، مانند اغراق، استفاده از کلمات پیچیده و استفاده پراکنده از کلمات پیوند دهنده اجتناب کرد.

کلود در مقابل ChatGPT: توانایی های تشخیص تصویر

برای آزمایش توانایی‌های تشخیص تصویر، چندین تصویر از ساختمان‌های بلند محبوب در سراسر جهان به ChatGPT و Claude داده شد. ChatGPT همه 20 آنها را به درستی شناسایی کرد، در حالی که کلود 3 نتوانست برخی از آنها را شناسایی کند، از جمله مارینا 101 دبی نسبتاً محبوب، برج جهانی Lotte در سئول، و ساختمان Merdeka 118 در کوالالامپور، مالزی.

برخلاف ChatGPT، کلود با شناسایی ساختمان‌ها در میان سایر ساختمان‌ها مشکل داشت و اگر ساختمان در ایالات متحده یا چین نباشد، میزان خرابی افزایش می‌یابد. با این حال، در شناسایی نسخه های مبهم برج ایفل یا ساختمان امپایر استیت مشکلی نداشت.

ساختمان امپایر استیت شناسایی شده توسط کلود 3

ChatGPT به وضوح در این کار بهتر است، اما با توجه به اینکه Claude 3 اولین تلاش آنتروپیک برای ساخت یک مدل هوش مصنوعی چندوجهی است، خروج بدی نبود.

اگرچه مدل‌های معروفی مانند پالم ۲ گوگل و متعاقباً جمینی، همیشه به‌عنوان قاتلان بالقوه GPT-4 معرفی شده‌اند، ما همواره معتقد بوده‌ایم که هوش مصنوعی کمتر شناخته‌شده Claude احتمالاً از زمان عرضه اولیه‌اش در مارس ۲۰۲۳، این افتخار را خواهد داشت. پس از چند ماه و چندین بار تکرار در طول خط، کلود 3 دقیقاً شبیه قاتل GPT-4 است که پیش‌بینی می‌کردیم. اگر یک کاربر سنگین چت بات هستید اما چت ربات هوش مصنوعی کلود را امتحان نکرده اید، یک ابزار هوش مصنوعی بسیار تاثیرگذار را از دست داده اید که می تواند بهره وری شما را افزایش دهد.