Stable Diffusion میتواند تولید تصویر هوش مصنوعی را با تنظیمات دقیق فراوان برای کاوش به سطح بالاتری برساند، اما این به این معنی است که گرفتن نتایج خوب دقیقاً شهودی نیست. با این حال، درک تعداد انگشت شماری از تکنیک های کلیدی به شما کمک می کند تا از این مانع عبور کنید.
خلاصه عناوین
- مروری سریع بر انتشار پایدار: دریافت تصاویر خوب
- نوشتن توضیحات مفصل
- استفاده از پیام های منفی
- پالایش نتایج
نکات کلیدی
- درخواستها را به دستههایی مانند موضوع، نور، سبک هنری، هنرمند و جامعه تقسیم کنید.
- از اعلان های منفی برای اصلاح تصاویر استفاده کنید: برای جلوگیری از عناصر خاص، کلماتی مانند “زشت” را اضافه کنید.
- وزن کلمه کلیدی را با افزودن براکت برای تاکید بر کلمات در درخواست خود تنظیم کنید.
Stable Diffusion میتواند تولید تصویر هوش مصنوعی را با تنظیمات دقیق فراوان برای کاوش به سطح بالاتری برساند، اما این به این معنی است که گرفتن نتایج خوب دقیقاً شهودی نیست. با این حال، درک تعداد انگشت شماری از تکنیک های کلیدی به شما کمک می کند تا از این مانع عبور کنید.
مروری سریع بر انتشار پایدار: دریافت تصاویر خوب
تولیدکنندههای تصویر هوش مصنوعی زیادی وجود دارد و Stable Diffusion به دلیل ماهیت منبع باز و کنترل پیشرفتهای که بر تولید تصویر دارید، یکی از محبوبترین آنهاست.
اما این به این معنی است که گرفتن عکسهای خوشنظر فوری میتواند دشوار باشد. من زمان زیادی را صرف استفاده از مولد هوش مصنوعی Midjourney کردهام، که تقریباً بدون زحمت تصاویر زیباییشناختی را تولید میکند. در مقایسه، Stable Diffusion کمی تلاش بیشتری برای یادگیری میطلبد.
سریعترین راه برای دستیابی به نتایج خوب این است که شرح مفصلی بنویسید، برای جلوگیری از عناصر ناخواسته یک پیام منفی اضافه کنید، و سپس با تغییر وزن کلمات کلیدی و ایدهها در درخواستتان، تصویر را اصلاح کنید.
به این اصول اولیه تسلط پیدا کنید، و مطمئن خواهید شد که می توانید هر بار تصاویر واقعا عالی خلق کنید.
نوشتن توضیحات مفصل
بیایید با توضیحات شروع کنیم. با Stable Diffusion، اگر می خواهید تصاویر خیره کننده ای تولید کنید، باید اعلان های دقیق بنویسید. مطالعه اعلانهای دیگران راهی فوقالعاده برای مشاهده چگونگی انجام آن است.
ما از ویدیوی بالا به عنوان مثال استفاده خواهیم کرد. اعلان به این شکل است:
پرتره الهه کیهانی، کت و شلوار ساخته شده از ستاره ها و کهکشان ها و انرژی کیهانی، پیچیده، هد شات، با جزئیات بسیار، نقاشی دیجیتال، ایستگاه هنری، هنر مفهومی، فوکوس تیز، نورپردازی سینمایی، تصویرسازی، هنری توسط آرگرم و گرگ روتکوسکی، آلفونی بسیار، cgsociety
این اعلان از 38 کلمه تشکیل شده است که به شما ایده خوبی در مورد اینکه چقدر باید توضیحات خود را ببرید، می دهد. خوشبختانه، درک اینکه چه نوع کلماتی در این مثال استفاده می شود، چندان پیچیده نیست. من یک تجزیه و تحلیل سریع از این درخواست انجام دادم و متوجه شدم که هفت دسته وجود دارد که می توانید کلمات کلیدی را به آنها تقسیم کنید.
- موضوع: پرتره ای از الهه کیهانی، لباسی ساخته شده از ستاره ها و کهکشان ها و انرژی کیهانی
- شات: هد شات
- نورپردازی: نورپردازی سینمایی
- جزئیات: فوکوس پیچیده، با جزئیات بسیار زیاد و واضح
- سبک هنری: نقاشی دیجیتال، هنر مفهومی، تصویرسازی
- هنرمند: هنر آرگرم و گرگ روتکوسکی، آلفونس موچا
- مراجع انجمن: ArtStation، CGsociety
استفاده از یک الگوی سریع می تواند به ایده اولیه کمک زیادی کند. در اینجا یکی از مواردی است که نویسنده ویدیو از آن استفاده می کند:
موضوع، اکشن، پس زمینه، نورپردازی، سبک، هنرمند
هیچ قانون سختی در مورد اینکه چه کلمات کلیدی باید گنجانده شود، یا به چه ترتیبی وجود ندارد، با این تفاوت که به کلمات در ابتدای دستور اهمیت بیشتری داده می شود و در تصویر برجسته تر نشان داده می شوند.
در اینجا یک الگوی دیگر وجود دارد که می توانید با آن آزمایش کنید:
- موضوع: به عنوان مثال زن، مرد، سنتور
- حالت: به عنوان مثال ایستادن، نشستن، نگاه کردن به بیرون از پنجره، خوابیدن
- جزئیات: به عنوان مثال لباس، رنگ مو، لوازم جانبی، لوازم جانبی
- محیط زیست: به عنوان مثال دفتر، ساحل، جنگل، قلعه قرون وسطایی
- توصیف کننده های کیفیت: جزئیات دقیق، پیچیده
با گذشت زمان، ممکن است به الگویی بسنده کنید که بهترین نتایج را برای شما داشته باشد. با این حال، تا آن زمان، می توانید از این قالب ها برای شروع استفاده کنید.
استفاده از پیام های منفی
پیامهای منفی ابزاری است که میتوانید با گفتن آنچه نمیخواهید به سیستم هوش مصنوعی بگویید، تصاویر خود را بهبود بخشید. اگر افراد تصادفی در تصویر شما وجود دارند، میتوانید برای حذف آنها در خط منفی بنویسید: «بدون افراد».
در ابتدا، ممکن است یک راه حل جادویی به نظر برسد، اما این دقیقاً درست نیست. گاهی اوقات افزودن فقط یک کلمه اضافی به یک پیام منفی به طور ناگهانی و شدید تصویر شما را به روشی که انتظارش را ندارید تغییر می دهد.
درک رابطه بین پیام منفی و تصویر اغلب دشوار است. به نظر می رسد هیچ پیام منفی جهانی وجود ندارد که هر بار کار کند. با این حال، برخی از کلمات عمومی وجود دارد که جامعه Stable Diffusion از آنها استفاده می کند.
این YouTuber الگوی پیام منفی زیر را برای شما ارائه می دهد تا آن را امتحان کنید:
کیچ، زشت، اشباع بیش از حد، دانه، کم رزولوشن، تار، آناتومی بد، صورت ضعیف، اندام اضافی، دستهای ضعیف، اندام گمشده، اندامهای شناور، اندامهای قطع شده، دستهای ناقص، تاری، خارج از فوکوس، گردن بلند، بلند بدن، زشت، بد ترسیم، کودکانه، ژولیده، پیر، سورئال
در مورد جالب دیگری، این کاربر Reddit توضیح می دهد که چگونه و چرا از اعلان منفی زیر استفاده می کنند:
کاریکاتور، وحشت بدن، جهش یافته، فیس بوک، یوتیوب، غذا
سه مورد اول باید واضح باشد که چرا نمیخواهم آنها بر عکسهای من از افراد معمولی تأثیر بگذارند. سه مورد آخر تلاشی برای فیلتر کردن بخش بزرگی از ابر برچسب بهینه سازی موتور جستجو (سئو) است که بسیاری از تصاویر موجود در مجموعه داده را آلوده می کند.
برخی از این تگهای منفی را برای خودتان امتحان کنید تا ببینید چگونه بر تصاویر شما تأثیر میگذارند. برای شروع کوچک، فقط با چند کلمه در پیام منفی شما مفید است، بنابراین می توانید ببینید که کلمات چگونه بر تصویر تأثیر می گذارند.
پالایش نتایج
هنگامی که به نوشتن اعلانهای تصویری دقیق و استفاده از ابزار اعلان منفی برای حذف عناصر ناخواسته در تصویر دست میزنید، بهترین چیزی که باید یاد بگیرید این است که چگونه کلمات خاصی را برای تأکید بر بخشهایی از تصویر خود وزن کنید.
شما می توانید این کار را با افزودن براکت به هر کلمه ای در درخواستی که می خواهید سیستم هوش مصنوعی روی آن تمرکز کند، نسبت به سایر کلمات در توضیحات خود، انجام دهید. برای مثال، اگر می خواهید روی “موز” تاکید کنید، می توانید دستور زیر را بنویسید: یک کاسه میوه، (موز)، سیب، توت فرنگی.
در این ویدئو، می توانید نمونه های متعددی از اتفاقاتی که برای یک تصویر در هنگام قرار دادن وزن روی میوه های مختلف در توضیحات رخ می دهد را مشاهده کنید. افزودن براکت به یک کلمه اهمیت آن عنصر را در تصویر شما افزایش می دهد. برای اضافه کردن وزن بیشتر می توانید چند براکت اضافه کنید.
همچنین میتوانید کلمه را برجسته کنید و Ctrl یا Command را فشار دهید، به علاوه فلش بالا یا پایین را برای تغییر وزن فشار دهید. اگر از این میانبر استفاده کنید، مقداری نیز در کنار کلمه اضافه می کند.
به طور پیشفرض، وزن هر کلمه کلیدی در فرمان شما 1 است. میتوانید از آن به عنوان نقطه شروع برای افزایش یا کاهش وزن استفاده کنید. به عنوان مثال، وزن 2 یا 3 نتایج فوق العاده ای ایجاد می کند، بنابراین بهتر است با افزایش های کوچک مانند 1.2 یا 1.3 و غیره حرکت کنید. بازی با وزن کلمات یکی از ساده ترین راه ها برای ایجاد تصویر بیشتر است.
شروع با یک توصیف قوی با جزئیات زیاد، سپس حرکت به سمت اعلانهای منفی و وزندهی کلمات کلیدی، برخی از بهترین اصول برای یادگیری در Stable Diffusion هستند. با در نظر گرفتن این نکات، می توانید شروع به ایجاد تصاویر دقیقی که می خواهید کنید.