آیا تا به حال بخواهید فوراً ساخته DALL-E 3 خود را ویرایش کنید اما نمی دانید چگونه تغییرات را ایجاد کنید؟
خلاصه عناوین
- ابزارهای ویرایش DALL-E 3 چیست؟
- نحوه استفاده از ابزار ویرایش DALL-E 3
- ابزارهای ویرایش DALL-E مفید هستند، اما نیاز به کار دارند (و کمی پشتکار)
نکات کلیدی
- OpenAI ابزارهای ویرایش را به DALL-E 3 در ChatGPT برای تنظیمات درون خطی اضافه می کند.
- ابزارهای ویرایش می توانند ویژگی ها را حذف کنند و تغییرات کوچکی ایجاد کنند اما با درخواست های دقیق مشکل دارند.
- ابزارهای ویرایش DALL-E 3 برای برخی از کارها مفید هستند، اما ممکن است به چندین فرمان و صبر نیاز داشته باشند.
آیا تا به حال بخواهید فوراً ساخته DALL-E 3 خود را ویرایش کنید اما نمی دانید چگونه تغییرات را ایجاد کنید؟
OpenAI صدای شما را می شنود و ابزارهای ویرایش درون خطی را به DALL-E 3 در ChatGPT اضافه کرده است که به شما امکان می دهد بدون خروج از برنامه تغییراتی در آثار خود ایجاد کنید.
تنها مسئله این است که آنها کاری را که OpenAI تبلیغ میکند انجام نمیدهند، و در مورد اینکه آیا شما ویرایشهایی را که میخواهید دریافت خواهید کرد یا خیر، اختلاف نظر دارند. اما با این حال، این شروعی است برای آنچه که برای ویرایش DALL-E 3 در راه است، و این نحوه کار آنهاست.
ابزارهای ویرایش DALL-E 3 چیست؟
مدتی بود که آمدند، اما OpenAI بالاخره قابلیت ویرایش را به DALL-E 3 در ChatGPT Plus اضافه کرد. قبل از این، میتوانید سعی کنید آثار DALL-E 3 خود را ویرایش کنید، اما معمولاً همیشه منجر به ایجاد یک تصویر کاملاً تازه میشود. حتی اگر اعلانهای مورد استفاده برای ایجاد تصویر ویرایش شده بسیار شبیه به درخواست اول باشد، به دلیل ماهیت هوش مصنوعی مولد، خروجی میتواند بهطور قابل توجهی متفاوت باشد.
ابزار ویرایش یکپارچه DALL-E 3 اکنون با هدف رفع مشکلات موجود در همان تصویر بدون ایجاد یک درخواست جدید میباشد. ناحیهای را در تصویری که میخواهید تنظیم کنید برجسته میکنید، از DALL-E میخواهید یک تغییر خاص ایجاد کند (مانند “حذف این” یا “افزودن این ویژگی”) و کار به کار میرود.
با این حال، این یک کیسه مخلوط است.
نمونه وبلاگ رسمی OpenAI نشان می دهد که DALL-E شکوفه های گیلاس را به تصویر گربه به سبک Ukiyo-e اضافه می کند و کاملاً کار می کند. در تجربه من، ابزارهای ویرایش DALL-E برای افزودن چنین تصاویر دقیقی به یک تصویر موجود تلاش میکنند و در بیشتر موارد، نمیتوانند درخواستهایی از این قبیل را پردازش کنند.
این بدان معنا نیست که ابزارهای ویرایش کار نمی کنند. آنها می توانند کاملاً ویژگی ها را حذف کنند و تغییرات کوچکی را همانطور که در زیر توضیح داده شده است ایجاد کنند، اما همه اینها در مقیاس کوچک است.
نحوه استفاده از ابزار ویرایش DALL-E 3
بهترین راه برای نشان دادن آنچه که ابزار ویرایش DALL-E 3 می تواند انجام دهد، استفاده از چند مثال مناسب است.
حذف و پاک کردن
ابزار ویرایش DALL-E 3 می تواند برخی از ویژگی های کوچک را پاک کند، اما قطعاً مشکل دارد. در تصویر زیر، من از DALL-E خواسته بودم که “دستی روباتیک که یک تراشه مربعی درخشان و شفاف را در دست دارد که روی آن “AI Accelerated” نوشته شده است، بسازد. پسزمینه آبی تیره است و فضایی آیندهنگر و با فناوری بالا را ایجاد میکند.
اکنون، با توجه به اینکه نوشتن متن یک مسئله خاص برای هوش مصنوعی مولد است، تعجب نمیکنم که متن اشتباه بوده است—بنابراین از DALL-E خواستم اشتباه املایی را حذف کند. در اولین تلاش با اعلان “حذف این لطفا” ناموفق بود، اما در تلاش دوم با اعلان “لطفاً این کلمه را از تصویر حذف کنید” موفق شد. بنابراین، موفقیت، بله، اما ممکن است مجبور باشید برای به دست آوردن نتیجه، دستورات مختلفی را امتحان کنید. سپس از آن خواستم حروف هوش مصنوعی را به مرکز مربع منتقل کند، که علیرغم خراب شدن رایانه شخصی من به دلایلی، این کار را به خوبی انجام داد.
در مرحله بعد، از DALL-E خواستم تا به من کمک کند تا تصویری از تلویزیونی را که ثابت نشان می دهد ویرایش کنم. DALL-E برای تولید تصاویر منحصربهفرد عالی است، اما برخی جزئیات را اشتباه میگیرد یا متن تابخورده را ارائه میدهد. در این مورد، نوار اطلاعات روی صفحه تلویزیون، متن AI گسسته را نشان می دهد، بنابراین من می خواستم آن را حذف کنم. اولین تلاش DALL-E در جایی که نوار اطلاعات قرار داشت سایه ای باقی گذاشت، در حالی که تلاش دوم و سوم بسیار تمیزتر بود. کامل نیست، اما به اندازه کافی مناسب برای چیزی که از تصویر استفاده می کردم.
افزودن و تغییر
DALL-E 3 میتواند تغییراتی در تصاویر ایجاد کند، اما باز هم بستگی به مقیاس درخواستی شما دارد. اضافات و تغییرات کوچک امکان پذیر است، اما بیشتر اوقات، ابزار ویرایش DALL-E نمی تواند آنچه را که خواسته می شود پردازش کند.
من از DALL-E خواستم که “تصویر 2:1 4k از چشم انسان را از نزدیک ایجاد کند، جزئیات بیشتری داشته باشد”، که نتیجه آن تصویر زیر است:
بسیار مناسب است، اگر کمی عجیب باشد (انعکاس مژه ها؟!)، اما من می خواستم رنگ عنبیه را به آبی-سبز تغییر دهم و این تصویر را به دست آورد:
رنگ کمی کسل کننده اما بدون تغییر است و برخی از ویژگی ها کمی تاب خورده است.
در مرحله بعد، از DALL-E خواستم تا “یک تصویر 4k 2:1 به سبک رسی از شخصی که یک ببر onesie پوشیده است در حال اسکی کردن از یک شیب با پس زمینه یتی ایجاد کند.”
باز هم، تصویر اصلی خوب است، رنگهای واضح و زنده دارد و با درخواست مطابقت دارد. با این حال، من می خواستم یتی را به نوع دیگری از حیوانات ترسناک تغییر دهم.
به جای تعویض یتی با یک حیوان دیگر، کاملاً از بین رفته است. در عوض، به تصویر اصلی بازگشتم و از آن خواستم تا یک یتی دیگر اضافه کند که موفق نشد. هنگامی که از شما خواسته شد درختان بیشتری به تصویر اضافه کنید، به طور مشابه شکست خورد.
اضافه کردن متن
اینجا چیز زیادی برای پوشش دادن وجود ندارد. همانطور که گفته شد، هوش مصنوعی مولد معمولاً با متن مشکل دارد و افزودن متن به یک تصویر حتی دشوارتر است. من از DALL-E خواستم کارت پستالی از ساحل بریتانیا بسازد، که این کار را انجام داد و صحنه را به خوبی ثبت کرد. سپس می خواستم کلمه “Sunny Beach” را به تصویر اضافه کنم، که آن را نمی توانست. یعنی تا زمانی که تقریباً شش یا هفت درخواست رفت و برگشت به DALL-E یادآوری کرد که چه کاری باید انجام دهد، یک تصویر کاملاً جدید با متن مورد نیاز ایجاد کرد. و متن دقیق نیز؛ من در مورد چهره کودک زیر نور خورشید مطمئن نیستم.
بعد رفتم برای کارت تولد. این بار، DALL-E «تولدت مبارک» را بدون درخواست اضافه کرد، که با توجه به موضوع، خوب است. بنابراین، از آن خواستم که تاریخ تولد را روی کارت اضافه کند. باز هم نتوانست تاریخ را به کارت اضافه کند، اما پس از چند دور درخواست، تصویر جدیدی با تاریخ درخواستی ایجاد کرد. در این مورد، اضافه کردن تاریخ برای خودم راحتتر بود، به خصوص اگر میخواستم تصویر اصلی را حفظ کنم.
ابزارهای ویرایش DALL-E مفید هستند، اما نیاز به کار دارند (و کمی پشتکار)
من متوجه شده ام که ابزارهای ویرایش DALL-E برای کارهای خاصی مفید هستند، اما برای انجام درست ویرایش کمی زمان می برد. در زمانهای دیگر، کار نمیکند، و احتمالاً بهتر است از دستور اصلی خود استفاده کنید و آن را برای ایجاد یک تصویر جدید تغییر دهید.
ابزارهای ویرایش DALL-E احتمالاً در طول زمان بهبود خواهند یافت، اما تا آن زمان، بهتر است تصویر خود را با یک ابزار ویرایش تصویر ویرایش کنید تا اینکه چندین دور گفتگوی وقتگیر با DALL-E را طی کنید. وقتی کار می کند، خوب است. وقتی آن را نمی فهمد یا اصلا ویرایش را انجام نمی دهد، خسته کننده است.