مولدهای هنری هوش مصنوعی در تولید تصاویر نادرست از دست ها رپ بدی دارند. بیایید Midjourney v5 را در مقابل Dall-E 2 قرار دهیم تا ببینیم کدام بهتر این کار را انجام می دهد.
مولدهای هنر هوش مصنوعی همچنان تحت تاثیر قرار میدهند و به ما امکان میدهند تقریباً هر چیزی را که میتوانیم تصور کنیم خلق کنیم. با این حال، به نظر میرسد که این فناوری زمانی که نوبت به تولید دستهایی با ظاهر واقعی میرسد، به دیوار آجری برخورد کرده است.
در اینجا، ما به دو تا از برنامههای هنری مولد پیشرو نگاه میکنیم و آنها را رو به رو یا دست به دست میکنیم تا ببینیم کدام یک میتواند دستهای بهتری تولید کند، Midjourney v5 یا Dall-E 2. یکی از این برنامهها را داشته باشید. دست های مسلط؟ بیایید دریابیم!
مشکل هوش مصنوعی با دست ها
از زمانی که هنر تولید شده توسط هوش مصنوعی در اینترنت گسترده شد، انتقادهایی در مورد کیفیت دست های ترسیم شده توسط هوش مصنوعی وجود دارد. با وجود بهروزرسانیهای اخیر، همانطور که در مقایسههای جانبی ما نشان داده شده است، نتایج رضایتبخش نبوده است.
هر دو مدعی توانایی ها و کیفیت خروجی های خود را با هر تکرار بهبود می بخشند. آخرین به روز رسانی، نسخه 5 Midjourney، پیشرفت چشمگیری را نشان داده است. با این حال، مشکل عقربه های ترسیم شده توسط هوش مصنوعی حل نشده باقی مانده و نمی توان آن را نادیده گرفت.
مقایسه 1: استفاده از دستورات “Hand” و “Hands”
مقایسههای ما دقیقاً حاوی همان دستورات برای Dall-E 2 و Midjourney v5 است. ما دستورات را طوری طراحی میکنیم که بهجای اینکه افراد را بسازیم تا ببینند دستها چگونه به نظر میرسند، مختص به دست باشند. ما همچنین به هر برنامه فقط یک فرصت (رول) برای هر درخواست می دهیم.
دست
بیایید کارها را با ابتدایی ترین و مرتبط ترین دستور شروع کنیم: “دست”.
Midjourney v5:
Dall-E 2:
ما شروع خوبی نداریم!
Midjourney مسیر غیرمعمول ارتباط دست با موقعیتهای نسبتاً خلاقانه را در پیش گرفت. به جای تمرکز روی یک دست، ما یک جادوگر، دستکش، یک اسکلت و یک مجسمه کوچک را می بینیم. تصویر دستکش نیز انگشت خود را از دست داده است.
Dall-E 2 رویکردی مخالف دارد و تنها یک دست را در یک پسزمینه ساده به ما پیشنهاد میدهد. اما به طرز عجیبی، برخی حالت های عجیب و غریب وجود دارد، به خصوص با انگشتان شست، که طبیعی و راحت به نظر نمی رسند. هر دست نیز در یکی از دو طرف تصاویر بریده شده است.
چه کسی برنده این دور است؟ برای دقت کلی آن را به Dall-E 2 می دهیم.
دست ها
حالا بیایید جمع اعلان “دست” را بسازیم و ببینیم که هوش مصنوعی چه چیزی را ارائه می کند.
Midjourney v5:
Dall-E 2:
تلاش Midjourney در “دست” این بار بهتر به نظر می رسد. اما هر چهار تصویر سیاه و سفید هستند و تعدادی انگشت گم شده داریم. با بررسی دقیق تر، همچنین می توانید ببینید که برخی از ارقام به طرز عجیبی شکل گرفته اند یا به یکدیگر تبدیل می شوند.
Dall-E 2 همچنان دارای دستهایی با پسزمینه ساده است. هیچ رقمی وجود ندارد، اما عقربهها در تصویر سوم بریده شدهاند و نسخههای دیگر در ترکیب بندی دست و پا چلفتی به نظر میرسند و اصلاً خلاقیت ندارند.
بیایید این مقایسه را قرعه کشی بنامیم. اگر این تنها عامل بود، Dall-E 2 از نظر دقت برنده می شد، اما Midjourney موفق می شود تصاویر زیبایی را در اجرای سیاه و سفید خود ایجاد کند، حتی اگر هر چهار نسخه خیلی واقعی نباشند.
شما همیشه می توانید از فتوشاپ برای تعمیر هنر Midjourney خود از جمله دست ها استفاده کنید.
مقایسه 2: حرکات دست
بیایید چند حرکت دست را که تقریباً در سطح جهانی شناخته شده اند، مقایسه کنیم.
انگشتان ضربدری
ابتدا بیایید “انگشت های ضربدری” را امتحان کنیم.
Midjourney v5:
Dall-E 2:
به جرات می توان گفت که Midjourney این درخواست را کاملاً ناکام گذاشته است. ما انگشتان دستمان را از دست داده ایم و هیچ یک از نسخه ها اصلا طبیعی به نظر نمی رسند.
یک بار دیگر به Dall-E 2 برای درست کردن شمارش انگشتان کلاه میگویم، اما این تنها خبر خوب است. هر نسخه به نظر می رسد انگشتان دست در حال انجام حرکات یوگای خود در بازی Twister هستند.
هیچ برنده ای در این مقایسه وجود ندارد.
شست بالا
در مرحله بعد، ما با “شست بالا” پیش می رویم.
Midjourney v5:
Dall-E 2:
Midjourney شمارش انگشتان را درست میکند در حالی که با هر درخواست به شکلی خلاقانه رفتار میکند. به معرفی یک سبک گویا توجه کنید؟
Dall-E 2 همچنین امتیازهایی را برای دقت دریافت میکند در حالی که سعی نمیکند قایق را تکان دهد و هیچ چیز خلاقانهای به هر نتیجه اضافه شود.
در اینجا هیچ برنده مشخصی وجود ندارد.
مقایسه 3: دست با اشیاء
اکنون، ما پیچیدگی را با ترغیب دست ها به تعامل با اشیا افزایش می دهیم.
دست نگهدارنده توپ کریستالی
بیایید با یک شی تصادفی شروع کنیم، با استفاده از اعلان “دست نگه داشتن توپ کریستالی”.
Midjourney v5:
Dall-E 2:
با افزایش پیچیدگی، Midjourney شروع به درخشش می کند. جدا از اینکه چند اجرا غیرطبیعی به نظر می رسند، دست ها و توپ های کریستالی زیبا به نظر می رسند. Midjourney حتی برای ایجاد انعکاساتی در لیوان وقت صرف می کند که مطمئناً به خلاقیت کلی می افزاید.
اما برای اولین بار، ما میبینیم که Dall-E 2 یک رقم را در حداقل یکی از عقربهها از دست میدهد، در حالی که دست چهارم کاملاً عجیب به نظر میرسد. توپ های کریستالی نیز در مقایسه با Midjourney چشمگیر به نظر نمی رسند.
Midjourney اولین برد خود را بدست آورد.
دست نگه داشتن آب
بیایید چیزی حتی پیچیده تر را با اعلان “دست نگه داشتن آب” امتحان کنیم.
Midjourney v5:
Dall-E 2:
Midjourney فقط میتواند یک تصویر را با تعداد ارقام صحیح پخش کند. اگرچه به زیبایی رندر شده است، اما یک بار دیگر شاهد شکافهایی در بخش باورپذیری هستیم.
Dall-E 2 با دستیابی به دست های طبیعی نیز مشکل دارد، اما کار بسیار بهتری را انجام می دهد. برای تنوع رنگ در پسزمینه را نیز تغییر میدهد.
ما این دور را به Dall-E 2 می دهیم.
مقایسه 4: دست های کار
برای این مقایسه، اعلانهایی ایجاد میکنیم که دستها در فعالیتها دخالت دارند.
دست قالب گیری خاک رس
بیایید ببینیم مدلهای هوش مصنوعی با «خشت قالبگیری با دست» چگونه عمل میکنند.
Midjourney v5:
Dall-E 2:
Midjourney یک انگشت را در دو تصویر از دست داد، اما همه چیز عالی به نظر می رسد.
تصاویر Dall-E 2 گیج کننده و شلوغ به نظر می رسند و در نیمی از نسخه ها به اضافه کردن دست های شخص دیگری متوسل می شوند.
لبه به Midjourney می رود.
دست فشار دادن خمیر
بیایید یک فعالیت مشابه، “دست فشار دادن خمیر” را امتحان کنیم.
Midjourney v5:
Dall-E 2:
تصاویر Midjourney به طور کلی عالی به نظر می رسند. اما بار دیگر، نیمی از آنها دارای ارقام گم شده هستند. اما نمی توان تصاویر را به دلیل سبک هنری آنها ایراد گرفت.
نسخههای Dall-E 2 نیز در نیمی از اجراها انگشتان خود را از دست دادهاند و حتی یکی را به آخرین دست در مجموعه اضافه میکنند.
بیایید این یکی را قرعه کشی بنامیم.
اگر میخواهید خودتان این مقایسهها را امتحان کنید، به شما نشان میدهیم که چگونه از Midjourney برای ایجاد هنر هوش مصنوعی استفاده کنید.
نتایج به ما چه می گوید؟
رفتن به مقایسه و تعیین یک برنده کلی سرگرم کننده است. و اگر مجبور بودیم انتخاب کنیم، آن را به نفع Midjourney v5 می نامیم. اگرچه Dall-E 2 بیشتر اوقات دستها را با تعداد انگشتان صحیح خلق میکرد، اما Midjourney بود که تصاویر هنرمندانهتر و جذابتری خلق کرد.
اما هر دو برنامه برای هنرمندانی که تصاویر Dall-E 2 و Midjourney را برای کار خود تغییر کاربری می دهند، جایگاهی در بازار دارند. هر دو قادر به ایجاد دست هایی هستند که می توانند به عنوان برش یا در کامپوزیت ها برای استفاده هنری، ویرایشی و تجاری استفاده شوند. این فقط یک موضوع ترجیح شخصی است.
هوش مصنوعی در نهایت دست ها را تسخیر خواهد کرد
برنامه های هنری مولد مانند Dall-E 2 و Midjourney در توانایی خود برای ایجاد هنر واقعی و خارق العاده پیشرفت زیادی کرده اند. آنها هنوز با دستهای تولیدی دست و پنجه نرم میکنند، اما با توجه به شتاب فناوری مولد، ما فقط میتوانیم انتظار بهبود در آینده نزدیک را داشته باشیم.