خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

این دلیلی است که هوش مصنوعی نمی تواند متن را در تصاویر بنویسد – و چگونه می توانید از آن دور شوید

اگر از ابزارهای مولد هوش مصنوعی برای ایجاد تصاویر استفاده کرده اید، احتمالاً در نوشتن متن در تصاویر با مشکلاتی مواجه شده اید. دانستن اینکه چرا این اتفاق می‌افتد، کمک زیادی به اجتناب از آن می‌کند، و همینطور دانستن راه‌حل‌ها.

خلاصه عناوین

  • چرا هوش مصنوعی نمی تواند متن را در تصاویر بنویسد؟
  • آیا راه حلی برای متن ناخوانا در تصاویر هوش مصنوعی وجود دارد؟

نکات کلیدی

  • هوش مصنوعی به دلیل ورودی های تاریخی و داده های آموزشی محدود با نوشتن متن مشکل دارد. از نظر فنی در روزهای اولیه خود است.
  • از اعلان‌های خاص، مترادف‌های کلمه «متن» و ابزارهای جایگزین برای افزودن متن استفاده کنید.
  • متن را کوتاه نگه دارید، هر مشکلی را با ابزارهای دیگر برطرف کنید و از ابزار هوش مصنوعی مخصوصا برای ایجاد متن دقیق استفاده کنید.

اگر از ابزارهای مولد هوش مصنوعی برای ایجاد تصاویر استفاده کرده اید، احتمالاً در نوشتن متن در تصاویر با مشکلاتی مواجه شده اید. دانستن اینکه چرا این اتفاق می‌افتد، کمک زیادی به اجتناب از آن می‌کند، و همینطور دانستن راه‌حل‌ها.

چرا هوش مصنوعی نمی تواند متن را در تصاویر بنویسد؟

بزرگ‌ترین دلیلی که هوش مصنوعی نمی‌تواند متن بنویسد، ورودی‌های تاریخی است. در حالی که هوش مصنوعی به طور کلی در تولید تصاویر بسیار خوب است، برخی از جنبه‌ها – مانند متن – برای آموزش LLM (مدل‌های زبان بزرگ) به همان اندازه استفاده نشده است. به همین دلیل، هوش مصنوعی در تولید متن در تصاویر ماهر نیست.

اگرچه ابزارهای هوش مصنوعی در حال حاضر کاملاً پیشرفته هستند، اما هنوز از نظر فنی در روزهای اولیه خود هستند. علاوه بر این، برخی از ابزارهای هوش مصنوعی در حال اتمام داده های آموزشی هستند. هنوز ممکن است ابزارهای مولد در تولید متن بهتر شوند، اما در حال حاضر، باید یک راه حل را امتحان کنید.

آیا راه حلی برای متن ناخوانا در تصاویر هوش مصنوعی وجود دارد؟

اگرچه تولید متن در تصاویر هوش مصنوعی بسیار چالش برانگیز است، اما غیرممکن نیست. این چیزی است که من پیدا کردم برای من کار می کند …

1. به ژنراتور دستورات خاص تری بدهید

زمانی که من برای اولین بار استفاده از هوش مصنوعی را شروع کردم، مهارت های تشویقی من در بهترین حالت غیر استاندارد بود. من همان اشتباهات ChatGPT را مرتکب شدم که بسیاری از مردم مرتکب می شوند، و همچنین این کار را با سایر ابزارهای هوش مصنوعی مولد انجام دادم. بزرگ‌ترین اشتباه من این بود که اعلان‌های مبهم مانند «لطفا تصویری از یک صحنه خیابان ایجاد کنید» بود.

مطلب مرتبط:   نحوه استفاده از نشانه گذاری برای سانسور عکس ها و اسکرین شات ها در آیفون

جای تعجب نیست که من نتایج غیر استانداردی گرفتم. من فکر می کنم که بهترین راه برای استفاده از هوش مصنوعی مولد این است که درخواست خود را به عنوان یک خلاصه خلاقانه در نظر بگیرید. هر چه دقیق تر باشید، بهتر است. برای مثال، یکی از درخواست‌هایی که من امتحان کردم، وجود دارد:

تصویری از نمای بیرونی یک کافه ایتالیایی بسازید. من می خواهم نوشته “کافه” را به عنوان علامت داشته باشد و در یک روز آفتابی باشد.

همانطور که در تصویر زیر می بینید، ChatGPT کار نسبتا خوبی انجام داده است. فکر نمی‌کنم اگر فقط می‌گفتم “تصویری از نمای بیرونی یک کافه ایتالیایی بسازید” اینطور نبود.

تصویر یک کافه تولید شده در DALL-E

من همچنین ایجاد تصاویر ساده تر را پیشنهاد می کنم. از تجربه شخصی، به نظر می رسد اینها بهتر عمل می کنند. به عنوان مثال، تصویر بالا عناصر کمتری نسبت به آنچه در زیر امتحان کردم دارد – به این معنی که هوش مصنوعی کمتری می‌تواند تلاش کند و بفهمد.

یک صحنه خیابان تنظیم شده در برنامه DALL-E 3

2. از تغییرات کلمه “متن” استفاده کنید

من اغلب متوجه شده ام که تغییر جزئی زبان در پیام های من می تواند تفاوت بزرگی ایجاد کند. پس از چندین بار امتحان کردن عبارت «متن»، احساس می‌کردم که در دایره‌ها می‌روم، بنابراین به دنبال امتحان مترادف‌های مختلف بودم.

به عنوان مثال، به جای “متن”، می توانید امتحان کنید:

  • عنوان
  • نامه ها
  • کلمات نوشته شده
  • امضا کنید

اگر هیچکدام از اینها جواب نداد، به امتحان جایگزین ادامه دهید. اینکه چه چیزی باعث موفقیت می شود و چه چیزی باعث موفقیت نمی شود ممکن است بسته به آنچه می خواهید ایجاد کنید متفاوت باشد. برای مثال، اگر می‌خواهید یک کارت تولد طراحی کنید، احتمالاً از «نشانه» استفاده نمی‌کنید. آزمایش با ایده های مختلف هوش مصنوعی در اینجا کلید اصلی است، و مولدهای مختلف نیز ممکن است به روش های مختلف کار کنند.

3. متن را با استفاده از ابزارهای جایگزین اضافه کنید

اگر قرار است کلمات بخشی از تصویر شما باشند، اضافه کردن متن از طریق ابزارهای جایگزین را توصیه نمی‌کنم، اما اگر می‌خواهید گرافیک بیشتری ایجاد کنید، این ایده خوبی است. اگر بخواهید کارت، گرافیک، جلد کتاب یا چیزی در همین راستا طراحی کنید، کارساز خواهد بود.

مطلب مرتبط:   محدودیت های تولید تصویر هوش مصنوعی در Adobe Firefly چیست؟

اگر می خواهید این کار را انجام دهید، پیشنهاد می کنم مطمئن شوید که فضای کافی در تصویر وجود دارد. می توانید از هر ابزاری که می خواهید برای افزودن متن به تصاویر خود استفاده کنید. من شخصا Canva یا Adobe Photoshop Express را توصیه می کنم، اما برنامه های دیگری که به شما امکان می دهند متن را به تصاویر گوشی هوشمند خود اضافه کنید برای محتوایی که با هوش مصنوعی تولید می کنید نیز کار می کنند.

همچنین باید مطمئن شوید که متن به خوبی با تصویر تولید شده توسط هوش مصنوعی شما مطابقت دارد. از فونت هایی استفاده کنید که با حالتی که می خواهید منتقل کنید مطابقت دارد و همه چیز را به گونه ای که احساس می کنید ضروری است تغییر شکل دهید.

4. متن را مختصر نگه دارید

هر بار که سعی کردم متن را در تصاویر هوش مصنوعی خود تولید کنم (و شکست خوردم)، اغلب زمانی است که سعی می کنم متن زیادی اضافه کنم. صادقانه بگویم، این اتفاق زمانی می افتد که من سعی می کنم چیزی با بیش از 10 کاراکتر خلق کنم. همانطور که من پیشنهاد می کنم تصاویر خود را ساده نگه دارید، فکر می کنم شما باید هر کاری که می توانید انجام دهید تا متن خود مختصر باشد.

برای آزمایش این مورد، من دستور دیگری را امتحان کردم:

لطفاً تصویری از یک بانک با متن “بانک” در بیرون ایجاد کنید. من می‌خواهم در یک منطقه مرکزی شهر و ساختاری مدرن باشد، مانند آنچه در یک شهر ایالات متحده می‌بینید.

همانطور که در زیر می بینید، ابزار هوش مصنوعی در گوش دادن به من کار نسبتا خوبی انجام داد. با این حال، من متوجه ایراداتی در یک قسمت از تصویر شدم. بنابراین، پیشنهاد می‌کنم به هوش مصنوعی بگویید که فقط یک یا دو علامت می‌خواهید تا احتمال این اتفاق را محدود کند. به نظر می رسد که این مسائل زمانی که متن کوچکتر است برای من نیز اتفاق می افتد، بنابراین ممکن است بخواهید آن را در نظر داشته باشید.

مطلب مرتبط:   نحوه استفاده از Gemini (Bard سابق) به جای دستیار گوگل در اندروید

تصویر ساختمان مدرن در DALL-E ایجاد شده است

5. از ابزاری برای اصلاح کلمات استفاده کنید

به همان روشی که می‌توانید لکه‌های عکس‌هایی را که با دوربین می‌گیرید از بین ببرید، ممکن است بخواهید از ابزاری استفاده کنید که به شما کمک می‌کند کلمات موجود در تصاویرتان را اصلاح کنید. اپلیکیشن‌های زیادی وجود دارند که متن‌های نامفهوم را در تصاویر تولید شده با هوش مصنوعی اصلاح می‌کنند، مانند Storia Lab.

خطای ابزار Storia Lab AI Textify

هنگام استفاده از این ابزارها، به طور معمول می توانید متن را انتخاب کنید و آنچه را که می گوید را تغییر دهید. برخی از برنامه ها رایگان هستند، اما در موارد دیگر، به اشتراک پولی نیاز دارید. اگر تصاویر زیادی با هوش مصنوعی تولید می کنید، ممکن است ارزش خرید یک برنامه ماهانه یا سالانه برای دسترسی در هر زمان که به آن نیاز دارید، داشته باشد.

6. از یک AI Generator که متن دقیق تولید می کند استفاده کنید

احتمالاً نام Midjourney، DALL-E، Firefly و تولید کننده های تصویر هوش مصنوعی مشابه را شنیده اید. اما آیا می دانستید که مولدهای هنری هوش مصنوعی خاصی وجود دارند که متن دقیقی را در تصاویر تولید می کنند؟

از آنجایی که یکی از تخصص های Ideogram تولید متن خوانا است، منطقی است که حداقل این برنامه را برای چند مورد از ساخته های خود امتحان کنید. Ideogram دارای یک ویژگی Magic Prompt است که در نسخه اصلی شما گسترش می یابد، به این معنی که می توانید نتایج دقیق تری دریافت کنید. فراتر از طرح رایگان، اشتراک پولی از 8 دلار در ماه شروع می شود.

اعلان "سیب با کاراته در نقل قول" در Ideogram

علیرغم کاستی های هوش مصنوعی مولد در ایجاد تصاویر با متن خوانا، اگر بخواهید خارج از چارچوب فکر کنید، چند راه حل پیدا خواهید کرد. گاهی اوقات، بهترین گزینه این است که به ابزار خود دستورات دقیق تری بدهید اما کلمات کمتری برای مقابله با آن ارائه دهید. همچنین ممکن است بخواهید مشکلات موجود در تصاویر خود را با نرم افزارهای دیگر برطرف کنید یا از ابزارهایی استفاده کنید که به طور خاص برای ایجاد متن دقیق طراحی شده اند.