این یک مسابقه ی گردن و گردن است و به نظر می رسد که کلود 3 از آنتروپیک ممکن است به تازگی جلو آمده باشد.
خلاصه عناوین
- کلود 3 چیست؟
- چه کاری می توانید با کلود 3 انجام دهید؟
- کلود 3 در مقابل ChatGPT
تعاریف کلیدی
- Claude 3 از Anthropic یک جهش قابل توجه از Claude 2 ارائه می دهد و در کارهای مختلف از GPT-4 بهتر عمل می کند.
- با Claude 3، میتوانید برای طیف وسیعی از پرس و جوها در زمینههای مختلف، بدون هزینه اشتراک، پاسخ ایجاد کنید.
- Claude 3 به خوبی با GPT-4 ChatGPT رقابت می کند و در زمینه هایی مانند وظایف برنامه نویسی، نوشتن خلاقانه و اندازه پنجره زمینه عالی است.
Anthropic از انتشار Claude 3 – خانواده ای از مدل های هوش مصنوعی با پتانسیل ایجاد ناراحتی GPT-4 خبر داد. پتانسیل فوقالعادهای دارد، اما آیا آماده است تا تاج ChatGPT را تصاحب کند؟
کلود 3 چیست؟
Claude 3 یک خانواده از سه مدل هوش مصنوعی چندوجهی است که توسط Anthropic برای جایگزینی سری Claude 2 از مدلهای AI توسعه یافته است. می توان گفت کلود 3 پاسخ Anthropic به Gemini گوگل و OpenAI GPT-4 است. Claude 3 که در سه نسخه Haiku، Sonnet و Opus منتشر شده است، با ترتیب روزافزون هوش، اولین مدل هوش مصنوعی چندوجهی Anthropic است و نشان دهنده جهش قابل توجهی از سری Claude 2 است.
اکنون، اگر تا به حال نام چت ربات هوش مصنوعی کلود را نشنیده باشید، قابل درک است. کلود و مدل های زیربنایی آن از وضعیت فوق ستاره ChatGPT یا جذابیت برند Gemini گوگل برخوردار نیستند. با این حال، کلود بدون شک یکی از پیشرفته ترین چت ربات های هوش مصنوعی در جهان است که در چندین زمینه کلیدی از ChatGPT بسیار تحسین شده بهتر عمل می کند.
برای قدردانی از کلود 3، مهم است که به شکست های مدل های قبلی نگاه کنیم.
- تکرارهای قبلی کلود به دلیل رویکردی بیش از حد به ایمنی هوش مصنوعی شهرت داشت. به عنوان مثال، ویژگیهای ایمنی Claude 2 به قدری فشرده بودند که ربات چت از بسیاری از موضوعات اجتناب میکرد، حتی موضوعاتی که هیچ مشکل ایمنی واضحی نداشتند.
- همچنین مشکلاتی با پنجره زمینه مدل وجود داشت. وقتی از یک مدل هوش مصنوعی میخواهید چیزی را توضیح دهد یا مثلاً یک مقاله طولانی را خلاصه کند، تصور کنید که فقط میتواند چند پاراگراف مقاله را در یک زمان بخواند. این محدودیت از اینکه چه مقدار متن می تواند در یک زمان در نظر بگیرد “پنجره زمینه” نامیده می شود. نسخههای قبلی Claude با 200 هزار توکن (معادل 150000 کلمه) پنجره زمینه ارائه میشد. با این حال، این مدل عملاً قادر به مقابله با این مقدار متن در یک حرکت بدون فراموش کردن بخشهایی از آن نبود.
- بحث چندوجهی هم وجود داشت. تقریباً همه مدلهای اصلی هوش مصنوعی چندوجهی شدهاند، به این معنی که میتوانند اشکال دیگری از دادهها مانند تصاویر را پردازش کنند و به آن دادهها پاسخ دهند (بهجای ورودی متن). کلود نتوانست این کار را انجام دهد.
اکنون هر سه مشکل به طور کامل یا حداقل تا حدی با انتشار کلود 3 برطرف شده است.
چه کاری می توانید با کلود 3 انجام دهید؟
دقیقاً مانند اکثر مدلهای پیشرفته هوش مصنوعی، Claude 3 میتواند پاسخهای درجه یک برای پرس و جوهای مختلف در زمینههای مختلف ایجاد کند. خواه به حل سریع مشکل جبر نیاز داشته باشید، یک آهنگ کاملاً جدید نوشته شده، یک مقاله عمیق پیش نویس شده، کد نوشته شده برای نرم افزار، یا یک مجموعه داده انبوه تجزیه و تحلیل شده باشد، کلود 3 با این شرایط مطابقت دارد.
اما اکثر مدلهای هوش مصنوعی در حال حاضر در این وظایف خوب هستند، پس چرا از Claude 3 استفاده کنیم؟
پاسخ ساده است؛ Claude 3 فقط یک مدل هوش مصنوعی دیگر نیست که در این کارها خوب عمل می کند، بلکه پیشرفته ترین مدل هوش مصنوعی چندوجهی آزادانه است که می توانید در هر کجای اینترنت دریافت کنید. بله، Gemini وجود دارد، قاتل GPT-4 که بسیار مورد ادعای گوگل قرار گرفته است، که عملکرد چشمگیری در تست های بنچمارک دارد. با این حال، Anthropic ادعا می کند که Claude 3 در چندین کار با یک حاشیه قابل توجه از آن بهتر عمل می کند. در حالی که نتایج بنچمارک چیزی است که ما اغلب باید با یک دانه نمک از آن استفاده کنیم، من هر دو مدل هوش مصنوعی را مورد آزمایش قرار دادم و برتری مدل Claude 3 در چندین مورد مهم بسیار واضح بود.
بنابراین، Claude 3 به شما امکان می دهد بیشتر کارهایی را که می توانید با Gemini و GPT-4 انجام دهید (منهای تولید تصویر) بدون پرداخت هزینه اشتراک 20 دلاری برای حق بیمه ChatGPT.
کلود 3 در مقابل ChatGPT
یک راه سریع برای آزمایش عملکرد یک مدل هوش مصنوعی این است که بررسی کنید چقدر در برابر بهترین های بازار: GPT-4 قرار می گیرد. البته من هر دو مدل رو تست کردم. کلود 3 آنتروپیک چقدر در مقابل GPT-4 عظیم الجثه قرار می گیرد؟
کلود در مقابل ChatGPT: مهارت های کدنویسی
با شروع با رشته ای از وظایف برنامه نویسی، کلود 3 با توانایی GPT -4 در تمام وظایف برنامه نویسی اولیه ارائه شده مطابقت داشت و حتی در برخی از آن ها بهتر عمل کرد. در حالی که من فقط اصول اولیه را آزمایش کردم، نسخه قبلی Claude به طور قابل توجهی در همان کارها مهارت کمتری داشت وقتی که آن را در این مقایسه ChatGPT در مقابل Claude در سپتامبر 2023 آزمایش کردیم. به عنوان مثال، وقتی از هر دو مدل خواستیم یک کار ساده بسازند. برنامه لیست، کلود در همه موارد ناموفق بود، در حالی که ChatGPT آنچه را که در آن زمان عملکرد پنج ستاره می نامیدیم ارائه داد.
با آخرین نسخه، Claude 3 در هر سه موردی که آزمایش کردیم، یک برنامه لیست کارهای با عملکرد بهتر تولید کرد. در اینجا نتیجه GPT-4 است که از شما خواسته می شود یک برنامه لیست کارها ایجاد کنید.
و در اینجا نتیجه کلود 3 است که از آن خواسته می شود همین کار را انجام دهد.
هر دو برنامه تا حدی کاربردی بودند، اما واضح است که Claude 3 در این مورد بهتر عمل کرده است.
پس از آزمایشهای پیچیدهتر برنامهنویسی، کلود در چندین مورد مدل بهتری بود، در حالی که GPT-4 نیز برندههای خود را داشت. در حالی که نمی توانم به طور قطعی بگویم Claude 3 در منطق برنامه نویسی بهتر است، اگر فاصله زیادی بین این دو مدل وجود داشت، تقریباً به طور قطع این شکاف کاهش می یافت.
کلود در مقابل ChatGPT: استدلال عقل سلیم
من پیش رفتم تا هر دو مدل را روی استدلال عقل سلیم آزمایش کنم. کار با چت ربات های هوش مصنوعی پارادوکس جالبی است. چت رباتهای هوش مصنوعی میتوانند کارهای پیچیده را به راحتی انجام دهند، اما اغلب با مشکلات اساسی که نیاز به عقل سلیم یا منطق دارند، دست و پنجه نرم میکنند. بنابراین، ما به هر دو مدل یک سری سؤالات به ظاهر ساده دادیم که برای پاسخ صحیح به عقل سلیم نیاز داشت.
از پنج سوال این چنینی، هر دو مدل به هر پنج سوال پاسخ منطقی دادند. ما از هر دو چت ربات یک سوال پرسیدیم: اگر یک سفینه فضایی از مریخ به دو قسمت تقسیم شود، یک قسمت به اقیانوس اطلس نزدیک برزیل و قسمت دیگر به اقیانوس آرام در نزدیکی ژاپن سقوط کند، بازماندگان را کجا دفن میکنید؟
ChatGPT حتی بدون GPT-4 به درستی پاسخ داد. اگر دلیل انتخاب سوال را میپرسید، خوب، چتباتها از نظر تاریخی به طرز تاسفباری در این نوع خط سوال شکست خوردهاند. بعد نوبت کلود بود که جواب بدهد.
پاسخ کلود دقیقاً یک پاسخ قطعی نبود، اما میتوانست اطلاعات کلیدی را شناسایی کند. شما بازماندگان را دفن نمی کنید توجه به این نکته مهم است که آخرین باری که از کلود 2 سوال مشابهی پرسیدیم، نتوانست از طریق تله عقل سلیم ببیند.
کلود در مقابل ChatGPT: نوشتن خلاق
در دنیای واقعی، یکی از محبوبترین موارد استفاده برای چت رباتهای هوش مصنوعی، تولید متن خلاقانه در همه اشکال است: مقالات، نامهها، متن آهنگ. بنابراین، من هر دو مدل را آزمایش کردم تا مشخص کنم کدام یک متن با صدای انسانی بهتری ایجاد می کند.
ایده این است که نتایج نباید فقط «درست» یا خلاقانه (به نوعی روباتیک) باشد، بلکه باید به نظر برسد که گویی توسط یک انسان نوشته شده است. من هر دو مدل را موظف کردم که شعر یک آهنگ رپ درباره پرورش خیار و میلیونر شدن از آنها را بسازند. چه کسی در مورد خیار آهنگ رپ می نویسد؟ این ایده است – چیزی چالش برانگیز!
برداشت ChatGPT در اینجا آمده است:
و در اینجا پاسخ کلود با استفاده از همان اعلان است.
ممکن است ذهنی باشد، اما به نظر می رسد کلود گزینه بهتری در اینجا باشد. زمانی که هر دو ابزار وظیفه تهیه پیش نویس سه مقاله در مورد موضوعات مختلف را داشتند، کلود گزینه بهتری را در هر سه مورد ارائه کرد. نتیجه ای شبیه به انسان ایجاد کرد و از الگوهایی که معمولاً با متون تولید شده توسط هوش مصنوعی مرتبط هستند، مانند اغراق، استفاده از کلمات پیچیده و استفاده پراکنده از کلمات پیوند دهنده اجتناب کرد.
کلود در مقابل ChatGPT: توانایی های تشخیص تصویر
برای آزمایش تواناییهای تشخیص تصویر، چندین تصویر از ساختمانهای بلند محبوب در سراسر جهان به ChatGPT و Claude داده شد. ChatGPT همه 20 آنها را به درستی شناسایی کرد، در حالی که کلود 3 نتوانست برخی از آنها را شناسایی کند، از جمله مارینا 101 دبی نسبتاً محبوب، برج جهانی Lotte در سئول، و ساختمان Merdeka 118 در کوالالامپور، مالزی.
برخلاف ChatGPT، کلود با شناسایی ساختمانها در میان سایر ساختمانها مشکل داشت و اگر ساختمان در ایالات متحده یا چین نباشد، میزان خرابی افزایش مییابد. با این حال، در شناسایی نسخه های مبهم برج ایفل یا ساختمان امپایر استیت مشکلی نداشت.
ChatGPT به وضوح در این کار بهتر است، اما با توجه به اینکه Claude 3 اولین تلاش آنتروپیک برای ساخت یک مدل هوش مصنوعی چندوجهی است، خروج بدی نبود.
اگرچه مدلهای معروفی مانند پالم ۲ گوگل و متعاقباً جمینی، همیشه بهعنوان قاتلان بالقوه GPT-4 معرفی شدهاند، ما همواره معتقد بودهایم که هوش مصنوعی کمتر شناختهشده Claude احتمالاً از زمان عرضه اولیهاش در مارس ۲۰۲۳، این افتخار را خواهد داشت. پس از چند ماه و چندین بار تکرار در طول خط، کلود 3 دقیقاً شبیه قاتل GPT-4 است که پیشبینی میکردیم. اگر یک کاربر سنگین چت بات هستید اما چت ربات هوش مصنوعی کلود را امتحان نکرده اید، یک ابزار هوش مصنوعی بسیار تاثیرگذار را از دست داده اید که می تواند بهره وری شما را افزایش دهد.