من واقعاً در مورد انتشار Apple Intelligence هیجان زده هستم، اما معتقدم که فضای زیادی برای بهبود وجود دارد. اپل می تواند چندین ویژگی را برای بهتر کردن آن اضافه کند. در اینجا ایده های من در مورد آنچه که می تواند مجموعه ویژگی های هوش مصنوعی اپل را به سطح بعدی برساند، آورده شده است.
خلاصه عناوین
- ابزارهای ویرایش تصویر بیشتر
- تولید تصویر واقعی تر
- غربالگری تماس
- ویژگی های بهتر ترجمه زنده
- گزینه ای برای انتخاب LLM شخص ثالث
من واقعاً در مورد انتشار Apple Intelligence هیجان زده هستم، اما معتقدم که فضای زیادی برای بهبود وجود دارد. اپل می تواند چندین ویژگی را برای بهتر کردن آن اضافه کند. در اینجا ایده های من در مورد آنچه که می تواند مجموعه ویژگی های هوش مصنوعی اپل را به سطح بعدی برساند، آورده شده است.
1 ابزار ویرایش تصویر بیشتر
Apple Intelligence تنها یک ویژگی اصلی ویرایش تصویر به نام Clean Up را ارائه می دهد که شبیه پاک کن جادویی گوگل است و به شما امکان می دهد اشیاء ناخواسته را از عکس ها حذف کنید. در حالی که این یک افزودنی خوشآمد است، اما پیشگامانه به نظر نمیرسد، به خصوص که گوگل و سامسونگ مدتهاست ابزارهای مشابهی را ارائه کردهاند.
فراتر از پاکسازی، Apple Intelligence از نظر ابزارهای ویرایش عکس بسیار کمی ارائه می دهد. در مقابل، Google Pixel 9 دارای بسیاری از ویژگیهای هوش مصنوعی شگفتانگیز است، مانند Add Me، که تضمین میکند همه در عکسهای گروهی قرار میگیرند، یا Reimagine، که به شما امکان میدهد بخشهایی از یک تصویر را فقط با توصیف آن با یک پیام متنی جایگزین کنید. اگر اپل بتواند از گوگل الهام بگیرد و ویژگی های مشابهی را معرفی کند، عالی خواهد بود.
بهعنوان فردی که در ویرایش عکسها مهارت زیادی ندارم، ویژگیای را دوست دارم که به من امکان میدهد فیلترها را بر اساس یک پیام متنی ایجاد کنم. من میتوانم توضیح دهم که کدام رنگها را میخواهم بیشتر برجسته کنم یا نوع فضایی را که هدفم آن است، و مدل هوش مصنوعی فیلتری برای مطابقت با این توصیف ایجاد میکند.
2 تولید تصویر واقعی تر
اپل همچنین اپلیکیشن جدیدی به نام Image Playground را به عنوان بخشی از Apple Intelligence معرفی کرد که به کاربران این امکان را میدهد تا تصاویر را از یک پیام متنی در سه سبک هنری مختلف تولید کنند: انیمیشن، تصویرسازی، و طرح. به راحتی با برنامه هایی مانند پیام ها و حتی پلتفرم های شخص ثالث ادغام می شود. در حالی که پیاده سازی به خوبی انجام شده است، من طرفدار نتایج نیستم.
سبک های هنری برای سلیقه من بیش از حد کارتونی به نظر می رسند، و نمی توانم خودم را با استفاده از Image Playground برای ایجاد تصاویر و ارسال آنها برای دوستان یا خانواده ببینم. اگرچه این مدل برای Genmojis به خوبی کار میکند، که به شما امکان میدهد شکلکهای شخصیسازیشده کاملاً جدیدی را از طریق یک پیام متنی ایجاد کنید، اما باید سبکهای هنری واقعیتری در دسترس باشد.
یکی از دلایل احتمالی این امر این است که مدل انتشار تصویر برای حفظ حریم خصوصی بهتر روی دستگاه اجرا می شود. با این حال، من از یک مدل تولید تصویر واقعیتر که بر روی محاسبات ابری خصوصی اپل برای رسیدگی به نیازهای محاسباتی بالاتر اجرا میشود، فکر نمیکنم، که همچنین پس از پردازش درخواستهای شما، تمام دادههای شما را حذف میکند.
3 غربالگری تماس
یکی از ویژگیهای مورد علاقه من در Google Pixel، غربالگری تماس است، که در آن دستیار Google به تماسها پاسخ میدهد و رونوشت زنده ارائه میکند و به شما کمک میکند تصمیم بگیرید که آیا تماس را قبول کنید یا خیر. حتی میتواند تماسهایی را از شمارههای ناشناس برای شما دریافت کند، و اگر تشخیص دهد که یک تماس خودکار یا هرزنامه است، Google Assistant بهطور خودکار بدون اینکه شما را اذیت کند، تماس را قطع میکند.
اگر سیری بتواند کاری مشابه انجام دهد و بر اساس زمینه پاسخ های خودکار تولید کند، عالی خواهد بود. به عنوان مثال، اگر آیفون شما میداند که بیرون هستید، سیری میتواند بهطور خودکار از یک تحویلدهنده بخواهد که بسته را درب منزل شما بگذارد.
متأسفانه، Apple Intelligence در حال حاضر به تولید رونوشت و ارائه خلاصه ای از یک تماس تلفنی محدود شده است، اما این حوزه ای است که اپل باید به توسعه آن فکر کند.
4 ویژگی بهتر ترجمه زنده
در حالی که میتوانید از برنامه ترجمه داخلی برای کارهای اساسی، مانند تایپ متن و خواندن آن با صدای بلند به زبان دیگری استفاده کنید، اما من نمیتوانم احساس کنم که Apple Intelligence میتواند کمک بیشتری کند.
چیزی که من واقعاً دوست دارم ببینم ابزارهای ترجمه بلادرنگ هستند که در کل سیستم کار می کنند. یک مثال عالی Live Translate سامسونگ است که می تواند مکالمات را در زمان واقعی در طول تماس های تلفنی رونویسی و ترجمه کند. Google همچنین ویژگیهای مشابهی را ارائه میکند که به طور یکپارچه در چندین برنامه کار میکنند و تمام پردازشها روی دستگاه انجام میشود.
از آنجایی که هم سامسونگ و هم گوگل قبلاً این را پیادهسازی کردهاند و مدلهای آنها به طور موثر روی دستگاه اجرا میشوند، نمیدانم چرا اپل روی ویژگیهای ترجمه با Apple Intelligence تمرکز نکرده است.
5 گزینه ای برای انتخاب LLM شخص ثالث
اگرچه سیری با ویژگیهایی مانند آگاهی از روی صفحه بهروزرسانی بزرگی را دریافت میکند، اما ممکن است به هر درخواستی رسیدگی نکند. برای پر کردن این شکافها، از ChatGPT به عنوان یک بازگشت برای ایجاد پاسخ یا پاسخ به سؤالات در مورد عکسها یا اسناد استفاده میکند.
در حالی که ChatGPT عالی است، ای کاش می توانستم انتخاب کنم که از کدام LLM شخص ثالث می خواهم استفاده کنم، مشابه روشی که می توانید موتور جستجوی پیش فرض خود را تغییر دهید. ما قبلاً جایگزین های ChatGPT را دیده ایم که در وظایف خاص عالی هستند. حتی بهتر خواهد بود اگر کاربران بتوانند اولویت هایی را برای وظایف مختلف تعیین کنند. به عنوان مثال، به طور خودکار از Claude برای سؤالات مربوط به تصویر استفاده کنید، اما برای تولید متن به Gemini یا ChatGPT تغییر دهید.
بنابراین، اینها ویژگی هایی هستند که من دوست دارم در Apple Intelligence ببینم. با این حال، هنوز چیزهای زیادی وجود دارد که منتظر آن باشیم زیرا می بینیم که مجموعه هوش مصنوعی اپل چگونه در مقابل پیشنهادات گوگل و سامسونگ قرار می گیرد. اگرچه برای عموم در دسترس نیست، میتوانید Apple Intelligence را در نسخههای بتای iOS 18.1 و macOS 15.1 امتحان کنید. فقط به یاد داشته باشید که تجربه شما ممکن است کاملاً پایدار نباشد، زیرا اینها هنوز نسخه های آزمایشی اولیه هستند.