خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

برای خودتان ببینید: نسل جدید تصویر چتپپ بسیار خوب است

Openai فقط یک نسخه هیولا را به نسل تصویر Chatgpt کاهش داد ، و این یکی از آن لحظه هایی است که شما چشمک می زنید ، دوباره نگاه می کنید و شروع به سؤال از واقعیت می کنید.

پیوندهای سریع

  • دست و انگشتان
  • چهره های تاریخی
  • چهره های داستانی
  • کارتون
  • آینه ها و بازتاب ها
  • اتومبیل و خیابان
  • متن و نامه ها

Openai فقط یک نسخه هیولا را به نسل تصویر Chatgpt کاهش داد ، و این یکی از آن لحظه هایی است که شما چشمک می زنید ، دوباره نگاه می کنید و شروع به سؤال از واقعیت می کنید.

من وقت شما را با شماره ها ، اندازه های مدل یا چند ساعت Bazillion GPU که مدل جدید از آن استفاده می کند ، تلف نمی کنم. من فقط می خواهم به شما نشان دهم که این کار چه کاری می تواند انجام دهد-و چگونه در برابر مدل قدیمی دال پشته می شود.

7

دست و انگشتان

نزدیک کسی که یک وتر E جزئی را روی گیتار بازی می کند ، انگشتان دست را با عمق کم عمق میدان روی رشته ها می کشند.

نسل تصویر هوش مصنوعی وقتی برای اولین بار به جریان اصلی رسید ، ذهن ما را منفجر کرد. و بعد … ما نزدیکتر نگاه کردیم. نشانه مشخصه تصویر هوش مصنوعی آناتومی دست و انگشت عجیب است. بنابراین ، چه راهی بهتر برای آزمایش مدل ها از اینکه از آنها بخواهیم وتر گیتار را به تصویر بکشید؟

برای صرفه جویی در بهترین ها برای آخرین ، ابتدا از مدل اصلی Dall-E پرسیدم ، و سپس ژنراتور تصویر جدید در مدل Chatgpt 4O ادغام شد.

نمای نزدیک از دست یک شخص که یک وتر جزئی در گیتار آکوستیک بازی می کند

در بالا همان چیزی است که دال با آن روبرو شد. علیرغم کاستی های دال ، در واقع انگشتان دست و آناتومی عمومی را به طور جدی در اینجا اداره می کرد. اما خود وتر … نه خیلی. راه قرار داده شده بیش از حد در قسمت Fretboard برای بازی در E Minor بسیار زیاد است. اگر کمی بزرگنمایی کنید ، می گیرید که گیتار بیش از هفت رشته دارد. فاصله بین رشته ها نیز در همه جا قرار دارد.

با توجه به این نکته ، بیایید به Chatgpt 4O برویم.

نمای نزدیک از دست یک شخص که یک وتر جزئی در گیتار آکوستیک بازی می کند

من می توانستم به شما بگویم که من شوخی می کنم و این در واقع وقتی گیتار می نواختم ، این یک عکس قدیمی از پشت است. chatgpt 4o خوب است. شش رشته ، به طور مساوی فاصله دارد و وتر در واقع E جزئی است. من تحت تأثیر قرار گرفته ام

6

چهره های تاریخی

آلبرت انیشتین در حال خوردن بستنی در پارک مرکزی ، پیراهن گاه به گاه و تعلیق.

اکنون که دست (و انگشتان) خود را کثیف کرده ایم ، بیایید با برخی از چهره ها آشفتگی کنیم. من فهمیدم که ما می خواهیم چهره های تاریخی را امتحان کنیم زیرا آنها مورد توهین قرار نمی گیرند ، و دیدن آنها در یک محیط مدرن جالب خواهد بود.

مردی که شبیه انیشتین در حال خوردن بستنی در پارک مرکزی است

یک فروند کل To be fair, DALL-E did warn me it couldn’t use Einstein himself and would go with someone “closely resembling” him instead. یکی از کلاسیک های کلاسیک دال ، سبک کارتونی و واقع بینانه آن است که در اینجا با تمام توان ظاهر می شود.

The San Remo in the background does hint that this is Central Park, but that’s about the only win here. در حال حرکت به Chatgpt 4O.

مردی که شبیه انیشتین در حال خوردن بستنی در پارک مرکزی است

یک فیلتر سیاه و سفید را روی آن سیلی بزنید ، و من می توانم شما را متقاعد کنم که این یک عکس پرنعمت واقعی است. کرم موجود در مخروط به درستی خامه ای به نظر می رسد ، آلبرت امضای خود را بدون هیچ گونه وبی و بی نظیر در حال تکان دادن است ، و سان Remo هنوز در آنجا برگشته است و بلند ایستاده است. همه چیز چک می کند. chatgpt 4o آن را میخ زد.

5

چهره های داستانی

چهره ای شبیه به یک ارباب Sith که خواستار تاکسی در میدان جورج ، گلاسکو است ، با باران سبک و چراغ راهنمایی در پس زمینه.

در حال حاضر ما دیده ایم که Chatgpt می تواند چهره های تاریخی را به خوبی نقاشی کند. از آنجا که چهره ها و مردم هنوز یکی از بهترین راه های استرس تست هوش مصنوعی هستند ، بیایید برخی دیگر را امتحان کنیم.

چهره ای بلند و مرموز که شبیه یک ارباب سیت است که در میدان جورج ، گلاسکو ایستاده است

من با “مشابه” رفتم تا این ربات را به همکاری برساند بدون اینکه با سخنرانی کپی رایت به من ضربه بزند. نتیجه دال خوب است. این شکل شما را به یاد یک Sith می اندازد ، و بقیه عناصر کم و بیش دقیق هستند.

هیچ کارتون صریح در مورد آن وجود ندارد ، اما فقط احساس واقعی نمی کند. می خواهید واقعی؟ بررسی کنید که chatgpt 4o با همان سریع تولید شده است:

چهره ای بلند و مرموز که شبیه یک ارباب سیت است که در گلاسکو ایستاده است

من جو را دوست دارم – نورپردازی ، دریز ، حضور سیت پروردگار. همه آنجاست تنها مشکل این است که پروردگار تاریک ما در خیابان ایستاده است و در حالی که روبرو می شود ، تاکسی را صدا می کند … پیاده رو. اوه ، و علامت تاکسی می گوید “تاکسی”.

بیایید از داستان های آینده گرفته تا داستان های تاریخی محوری کنیم. چیزی مانند:

شخصیتی شبیه به Geralt of Rivia برای خرید مواد غذایی در یک سوپر مارکت مدرن ، فشار دادن یک سبد خرید و اخم کردن در کالاهای کنسرو.

مردی ناهموار و سفید پوست با زخم در چهره خود ، شبیه یک شکارچی هیولا فانتزی ، خرید در یک سوپر مارکت مدرن

اصلاً بد نیست همانطور که انتظار می رود ، این تصویر هنوز هم آن پرنعمت کارتونی مصنوعی و متن موجود در جعبه های غلات را حمل می کند.

Chatgpt 4O در ابتدا به دلیل حق چاپ از این فوریت امتناع ورزید ، اما این کار را انجام داد که من “شبیه به” با “شباهت” را عوض کردم. بنگر:

مردی ناهموار و سفید پوست با زخم در چهره خود ، شبیه یک شکارچی هیولا فانتزی ، خرید در یک سوپر مارکت مدرن

من بی حرف هستم مانند اکثر مردم ، تفسیر چتپپ از جرالت اساساً فقط هنری کاویل است ، نه نسخه بازی ویدیویی – اما ، آن را میخکوب کرد. scowl در نقطه است و تنظیمات طبیعی است.

این می تواند به عنوان یک شوت از مجموعه یک تبلیغ متقاطع عجیب و غریب عبور کند. و بله ، من قبل از نمایش ، کتابهای Witcher را خواندم.

4

کارتون

یک کاپیتان دزدان دریایی به سبک کارتونی با یک کت قرمز بلند و یک بازوی سایبرنتیک ، با خندیدن روی عرشه یک کشتی پرنده. پس زمینه شفاف

تولید تصویر Openai محدود به واقع گرایی نیست. در حالی که دال همیشه بدون توجه به آنچه که به آن پرتاب می کنید ، کمی هوا را تکیه می دهد ، تصمیم گرفتم هر دو مدل را به حالت کارتونی کامل سوق دهم.

یک کاپیتان دزدان دریایی به سبک کارتونی که روی عرشه یک کشتی پرواز توسط دال ایستاده است

دال در واقع یک کار محکم در اینجا انجام داد – و حتی درخواست پیش زمینه شفاف را درک کرد. نوع آنچه که ما بدست آوردیم الگوی کلاسیک Checkerboard Checkerboard است که معمولاً به معنای شفاف است … به جز در اینجا ، آن را در تصویر پخته می کند. بنابراین ، به هیچ وجه شفاف نیست.

همچنین ، از قضا ، دست بیولوژیکی AI Pirate ما دارای چهار انگشت است در حالی که سایبرنتیک دارای پنج است. شاید او بازوی اشتباه را کروم کند؟

یک کاپیتان دزدان دریایی به سبک کارتونی که روی عرشه یک کشتی پرنده ایستاده است

نسخه Chatgpt 4O احساس واضح تر و عمدی تر می کند. سبک رنگ آمیزی متفاوت است – چه بهتر باشد یا نه ذهنی است – اما به وضوح به نظر می رسد که یک هنرمند به معنای ترسیم آن است.

پیشینه نیز در واقع شفاف است. می توانید این را روی یک تی شرت سیلی بزنید ، آن را چاپ کنید ، یا حتی آن را به یک برچسب WhatsApp در محل تبدیل کنید.

3

آینه ها و بازتاب ها

یک سینک حمام مدرن با یک مسواک و تیغ روی پیشخوان ، که از نظر آینه و نمای واقعی در دنیای واقعی قابل مشاهده است-نورپردازی نرم و یکنواخت است.

آینه ها منعکس می شوند – و بازتاب ها به منطق مکانی نیاز دارند تا طبیعی به نظر برسند. من یک سریع را بیرون انداختم و می دانستم که دال-او را فریب می دهد.

یک سینک حمام مدرن با طراحی براق و یک میز تمیز

همانطور که انتظار می رفت چیزی در تلاش است تا بازتابی از شیر آب موجود در آینه باشد ، اما خیلی طولانی است. مسواک در داخل سینک لخت است و هیچ بازتاب ندارد. دال واقعاً برای این یکی از کلاه ایمنی AI خود را بند کرد.

یک سینک حمام مدرن با طراحی براق و یک میز تمیز

مدل جدیدتر کار بسیار بهتری را انجام می دهد تا تصویر مانند یک عکس واقعی احساس واقعی کند. بازتاب شیر آب کمی پر پیچ و خم است اما قابل عبور است. سپس مسواک وجود دارد ، که بازتاب دارد اما در دنیای فیزیکی وجود ندارد – مانند یک خون آشام معکوس.

در اینجا برنده مشخص نیست. نتایج هوش مصنوعی متناقض است ، بنابراین من هر دو شلیک دیگر را با چیزی کمی بلندپروازانه دادم:

زنی که جلوی یک آینه تمام قد در یک اتاق خواب آفتاب ایستاده است ، لباس و لباس او دقیقاً آینه می شود ، با بازتاب قابل مشاهده از پنجره پشت سرش.

زنی که جلوی یک آینه تمام قد در یک اتاق خواب آفتاب ایستاده است

… من حتی نمی خواهم این را با یک تجزیه و تحلیل عزت بزنم. مردمی ، اگر می خواهید دال را بد به نظر برسانید ، فقط کلمه “آینه” را به سرعت خود پرتاب کنید. در حال حرکت

زنی که جلوی یک آینه تمام قد در یک اتاق خواب آفتاب 1 ایستاده است

همانطور که انتظار می رفت ، نسخه Chatgpt 4O بسیار واقعی تر به نظر می رسد – اما شاید این بار کمی سورئال باشد؟ لباس و لباس زن آینه ای است ، اما فقط تا حدی ، مانند یک اثر پاپ آشکار 3D Photoshop. زوایای بازتاب نیز خاموش است. هوش مصنوعی هنوز نمی تواند منطق مکانی را اداره کند.

2

اتومبیل و خیابان

یک فورد GT در سال 2006 و یک پژو 206 در پشت چراغ ترافیک قرمز در وال استریت ، نیویورک ، ظهر.

من علاقه مند به ماشین هستم هنگامی که ژنراتورهای تصویر AI برای اولین بار به صحنه رسیدند ، یکی از اولین مواردی که من امتحان کردم عکس گرفتن از اتومبیل بود. نتایج پس از آن خوب نبود ، اما با استفاده از مدل جدید ، مجبور شدم به آن عکس دیگری بدهم.

فورد GT در سال 2006 در چراغ ترافیک قرمز در کنار پژو 206 متوقف می شود

با زیبایی شناسی کارتونی به طور فزاینده ای که به طور فزاینده ای آزار دهنده است ، دوباره دال می رود. پژو در پیاده رو است ، چراغهای راهنمایی و رانندگی که از آنها خواسته ام رو به روی ساختمانها هستند و تعداد بشقاب همه آنها مبهم است.

فورد GT در سال 2006 در چراغ ترافیک قرمز در کنار پژو 206 متوقف می شود

نتایج Chatgpt 4O به طور قابل توجهی بهتر است. این اتومبیل ها به درستی به تصویر کشیده شده اند-حتی پوشش چرخ پژو نقطه ای از آن و درست است. این نوع جزئیات تصادفی نیست. اما حتی بهتر می شود:

فورد GT در سال 2006 در چراغ ترافیک قرمز در کنار پژو 206 متوقف می شود

من در واقع می توانم از این یکی به عنوان تصویر زمینه تلفن خود استفاده کنم. روشنایی ، ترکیب ، بازتاب ها – همه بررسی ها. به غیر از پوچی عجیب خیابان ، این می تواند مستقیماً برای یک عکس واقعی عبور کند.

1

متن و نامه ها

یک نامه دست نوشته روی کاغذ پیر با فیلمنامه فرسوده ، در کنار قلم چشمه و یک بطری جوهر استراحت می کند.

سرانجام ، ما هدف ما پاشنه آشیل از هر ژنراتور تصویر هستیم. بیشتر ژنراتور تصویر AIS تلاش می کند تا متن را به درستی بدست آورند. در حال حاضر ، شما به اندازه کافی از دال در مثالهای قبلی دیدن کرده اید تا بدانید منظور من چیست.

برای جالب تر کردن آن – و سازگارتر – اضافه کردم که این نامه باید شامل متن سخنرانی پادشاه Terenas به Arthas از Warcraft III باشد.

یک صحنه نزدیک از یک دستگیره دست نویس کاغذ پوستی کمی زرد

دال آنچه را که بهترین کار را با متن انجام داد انجام داد: آن را به جیب های ناخوشایند و غیرقابل توصیف تبدیل کرد. این موفق شد برخی از کلمات را به درستی بدست آورد ، و جو کار می کند – قلم و بطری جوهر جامد به نظر می رسد.

یک صحنه نزدیک از یک دستگیره دست نویس کاغذ پوستی کمی زرد

chatgpt 4o آن را میخکوب می کند – هر کلمه یک کلمه ، در اسکریپت cursive تمیز. نامه کامل در مقایسه با Dall-E ، این یک جهش گسترده به جلو است. کلاه خاموش ، Openai.

یک لپ تاپ با Photoshop Open و چندین برنامه جایگزین که از صفحه نمایش بیرون می آید

از زمان رونق هوش مصنوعی ، دیگر نیازی به تخصص یا دلایل بزرگ برای فتوشاپ ندارید. به جای این گزینه های AI را بررسی کنید.

تولید تصویر AI مسیری طولانی را طی کرده است – و این نشان می دهد. Chatgpt 4O مانند اولین مدلی است که واقعاً هنگام روشنایی ، بافت و متن آن را بدست می آورد.

در این مرحله ، تنها سؤال واقعی باقی مانده این است: حفاظت از چتگپ چقدر قوی است؟ من به راحتی از محدودیت های حق چاپ آن عبور کردم. چه مدت قبل از اینکه کسی از زندان چته کند و شروع به تولید محتوای مورد نظر خود با استفاده از این مدل توانا و غیرقابل توصیف کند؟

مطلب مرتبط:   نحوه استفاده از برنامه Game Captures در Xbox One یا Series X|S