اگر از ابزارهای مولد هوش مصنوعی برای ایجاد تصاویر استفاده کرده اید، احتمالاً در نوشتن متن در تصاویر با مشکلاتی مواجه شده اید. دانستن اینکه چرا این اتفاق میافتد، کمک زیادی به اجتناب از آن میکند، و همینطور دانستن راهحلها.
خلاصه عناوین
- چرا هوش مصنوعی نمی تواند متن را در تصاویر بنویسد؟
- آیا راه حلی برای متن ناخوانا در تصاویر هوش مصنوعی وجود دارد؟
نکات کلیدی
- هوش مصنوعی به دلیل ورودی های تاریخی و داده های آموزشی محدود با نوشتن متن مشکل دارد. از نظر فنی در روزهای اولیه خود است.
- از اعلانهای خاص، مترادفهای کلمه «متن» و ابزارهای جایگزین برای افزودن متن استفاده کنید.
- متن را کوتاه نگه دارید، هر مشکلی را با ابزارهای دیگر برطرف کنید و از ابزار هوش مصنوعی مخصوصا برای ایجاد متن دقیق استفاده کنید.
اگر از ابزارهای مولد هوش مصنوعی برای ایجاد تصاویر استفاده کرده اید، احتمالاً در نوشتن متن در تصاویر با مشکلاتی مواجه شده اید. دانستن اینکه چرا این اتفاق میافتد، کمک زیادی به اجتناب از آن میکند، و همینطور دانستن راهحلها.
چرا هوش مصنوعی نمی تواند متن را در تصاویر بنویسد؟
بزرگترین دلیلی که هوش مصنوعی نمیتواند متن بنویسد، ورودیهای تاریخی است. در حالی که هوش مصنوعی به طور کلی در تولید تصاویر بسیار خوب است، برخی از جنبهها – مانند متن – برای آموزش LLM (مدلهای زبان بزرگ) به همان اندازه استفاده نشده است. به همین دلیل، هوش مصنوعی در تولید متن در تصاویر ماهر نیست.
اگرچه ابزارهای هوش مصنوعی در حال حاضر کاملاً پیشرفته هستند، اما هنوز از نظر فنی در روزهای اولیه خود هستند. علاوه بر این، برخی از ابزارهای هوش مصنوعی در حال اتمام داده های آموزشی هستند. هنوز ممکن است ابزارهای مولد در تولید متن بهتر شوند، اما در حال حاضر، باید یک راه حل را امتحان کنید.
آیا راه حلی برای متن ناخوانا در تصاویر هوش مصنوعی وجود دارد؟
اگرچه تولید متن در تصاویر هوش مصنوعی بسیار چالش برانگیز است، اما غیرممکن نیست. این چیزی است که من پیدا کردم برای من کار می کند …
1. به ژنراتور دستورات خاص تری بدهید
زمانی که من برای اولین بار استفاده از هوش مصنوعی را شروع کردم، مهارت های تشویقی من در بهترین حالت غیر استاندارد بود. من همان اشتباهات ChatGPT را مرتکب شدم که بسیاری از مردم مرتکب می شوند، و همچنین این کار را با سایر ابزارهای هوش مصنوعی مولد انجام دادم. بزرگترین اشتباه من این بود که اعلانهای مبهم مانند «لطفا تصویری از یک صحنه خیابان ایجاد کنید» بود.
جای تعجب نیست که من نتایج غیر استانداردی گرفتم. من فکر می کنم که بهترین راه برای استفاده از هوش مصنوعی مولد این است که درخواست خود را به عنوان یک خلاصه خلاقانه در نظر بگیرید. هر چه دقیق تر باشید، بهتر است. برای مثال، یکی از درخواستهایی که من امتحان کردم، وجود دارد:
تصویری از نمای بیرونی یک کافه ایتالیایی بسازید. من می خواهم نوشته “کافه” را به عنوان علامت داشته باشد و در یک روز آفتابی باشد.
همانطور که در تصویر زیر می بینید، ChatGPT کار نسبتا خوبی انجام داده است. فکر نمیکنم اگر فقط میگفتم “تصویری از نمای بیرونی یک کافه ایتالیایی بسازید” اینطور نبود.
من همچنین ایجاد تصاویر ساده تر را پیشنهاد می کنم. از تجربه شخصی، به نظر می رسد اینها بهتر عمل می کنند. به عنوان مثال، تصویر بالا عناصر کمتری نسبت به آنچه در زیر امتحان کردم دارد – به این معنی که هوش مصنوعی کمتری میتواند تلاش کند و بفهمد.
2. از تغییرات کلمه “متن” استفاده کنید
من اغلب متوجه شده ام که تغییر جزئی زبان در پیام های من می تواند تفاوت بزرگی ایجاد کند. پس از چندین بار امتحان کردن عبارت «متن»، احساس میکردم که در دایرهها میروم، بنابراین به دنبال امتحان مترادفهای مختلف بودم.
به عنوان مثال، به جای “متن”، می توانید امتحان کنید:
- عنوان
- نامه ها
- کلمات نوشته شده
- امضا کنید
اگر هیچکدام از اینها جواب نداد، به امتحان جایگزین ادامه دهید. اینکه چه چیزی باعث موفقیت می شود و چه چیزی باعث موفقیت نمی شود ممکن است بسته به آنچه می خواهید ایجاد کنید متفاوت باشد. برای مثال، اگر میخواهید یک کارت تولد طراحی کنید، احتمالاً از «نشانه» استفاده نمیکنید. آزمایش با ایده های مختلف هوش مصنوعی در اینجا کلید اصلی است، و مولدهای مختلف نیز ممکن است به روش های مختلف کار کنند.
3. متن را با استفاده از ابزارهای جایگزین اضافه کنید
اگر قرار است کلمات بخشی از تصویر شما باشند، اضافه کردن متن از طریق ابزارهای جایگزین را توصیه نمیکنم، اما اگر میخواهید گرافیک بیشتری ایجاد کنید، این ایده خوبی است. اگر بخواهید کارت، گرافیک، جلد کتاب یا چیزی در همین راستا طراحی کنید، کارساز خواهد بود.
اگر می خواهید این کار را انجام دهید، پیشنهاد می کنم مطمئن شوید که فضای کافی در تصویر وجود دارد. می توانید از هر ابزاری که می خواهید برای افزودن متن به تصاویر خود استفاده کنید. من شخصا Canva یا Adobe Photoshop Express را توصیه می کنم، اما برنامه های دیگری که به شما امکان می دهند متن را به تصاویر گوشی هوشمند خود اضافه کنید برای محتوایی که با هوش مصنوعی تولید می کنید نیز کار می کنند.
همچنین باید مطمئن شوید که متن به خوبی با تصویر تولید شده توسط هوش مصنوعی شما مطابقت دارد. از فونت هایی استفاده کنید که با حالتی که می خواهید منتقل کنید مطابقت دارد و همه چیز را به گونه ای که احساس می کنید ضروری است تغییر شکل دهید.
4. متن را مختصر نگه دارید
هر بار که سعی کردم متن را در تصاویر هوش مصنوعی خود تولید کنم (و شکست خوردم)، اغلب زمانی است که سعی می کنم متن زیادی اضافه کنم. صادقانه بگویم، این اتفاق زمانی می افتد که من سعی می کنم چیزی با بیش از 10 کاراکتر خلق کنم. همانطور که من پیشنهاد می کنم تصاویر خود را ساده نگه دارید، فکر می کنم شما باید هر کاری که می توانید انجام دهید تا متن خود مختصر باشد.
برای آزمایش این مورد، من دستور دیگری را امتحان کردم:
لطفاً تصویری از یک بانک با متن “بانک” در بیرون ایجاد کنید. من میخواهم در یک منطقه مرکزی شهر و ساختاری مدرن باشد، مانند آنچه در یک شهر ایالات متحده میبینید.
همانطور که در زیر می بینید، ابزار هوش مصنوعی در گوش دادن به من کار نسبتا خوبی انجام داد. با این حال، من متوجه ایراداتی در یک قسمت از تصویر شدم. بنابراین، پیشنهاد میکنم به هوش مصنوعی بگویید که فقط یک یا دو علامت میخواهید تا احتمال این اتفاق را محدود کند. به نظر می رسد که این مسائل زمانی که متن کوچکتر است برای من نیز اتفاق می افتد، بنابراین ممکن است بخواهید آن را در نظر داشته باشید.
5. از ابزاری برای اصلاح کلمات استفاده کنید
به همان روشی که میتوانید لکههای عکسهایی را که با دوربین میگیرید از بین ببرید، ممکن است بخواهید از ابزاری استفاده کنید که به شما کمک میکند کلمات موجود در تصاویرتان را اصلاح کنید. اپلیکیشنهای زیادی وجود دارند که متنهای نامفهوم را در تصاویر تولید شده با هوش مصنوعی اصلاح میکنند، مانند Storia Lab.
هنگام استفاده از این ابزارها، به طور معمول می توانید متن را انتخاب کنید و آنچه را که می گوید را تغییر دهید. برخی از برنامه ها رایگان هستند، اما در موارد دیگر، به اشتراک پولی نیاز دارید. اگر تصاویر زیادی با هوش مصنوعی تولید می کنید، ممکن است ارزش خرید یک برنامه ماهانه یا سالانه برای دسترسی در هر زمان که به آن نیاز دارید، داشته باشد.
6. از یک AI Generator که متن دقیق تولید می کند استفاده کنید
احتمالاً نام Midjourney، DALL-E، Firefly و تولید کننده های تصویر هوش مصنوعی مشابه را شنیده اید. اما آیا می دانستید که مولدهای هنری هوش مصنوعی خاصی وجود دارند که متن دقیقی را در تصاویر تولید می کنند؟
از آنجایی که یکی از تخصص های Ideogram تولید متن خوانا است، منطقی است که حداقل این برنامه را برای چند مورد از ساخته های خود امتحان کنید. Ideogram دارای یک ویژگی Magic Prompt است که در نسخه اصلی شما گسترش می یابد، به این معنی که می توانید نتایج دقیق تری دریافت کنید. فراتر از طرح رایگان، اشتراک پولی از 8 دلار در ماه شروع می شود.
علیرغم کاستی های هوش مصنوعی مولد در ایجاد تصاویر با متن خوانا، اگر بخواهید خارج از چارچوب فکر کنید، چند راه حل پیدا خواهید کرد. گاهی اوقات، بهترین گزینه این است که به ابزار خود دستورات دقیق تری بدهید اما کلمات کمتری برای مقابله با آن ارائه دهید. همچنین ممکن است بخواهید مشکلات موجود در تصاویر خود را با نرم افزارهای دیگر برطرف کنید یا از ابزارهایی استفاده کنید که به طور خاص برای ایجاد متن دقیق طراحی شده اند.