OpenAI به ChatGPT توانایی صحبت با استفاده از صدای سنتز شده را داده است و به زودی به گوشی هوشمند شما می آید.
ChatGPT قرار است به یک تجربه هوش مصنوعی مولد تعاملی تبدیل شود. OpenAI فاش کرد که چت ربات پیشرو هوش مصنوعی جهان میتواند با استفاده از صدای ترکیبی و احتمالاً تولید شده توسط هوش مصنوعی صحبت کند و به سؤالات کاربران پاسخ دهد.
ChatGPT علاوه بر صدای جدید خود، میتواند به تصاویر خاصی که در آن آپلود شده یا در حین استفاده از برنامه ChatGPT اندروید یا iOS گرفته شده، پاسخ دهد و در مورد آنها بحث کند. ویژگی تشخیص تصویر شبیه به لنز گوگل و سایر برنامه هایی است که از شبکه های عصبی برای تشخیص دقیق داده ها و اطلاعات استفاده می کنند.
OpenAI به ChatGPT یک صدا می دهد
در 25 سپتامبر 2023، توسعه دهنده ChatGPT OpenAI فاش کرد که به ربات چت هوش مصنوعی مولد پیشرو خود در جهان صدایی خواهد داد. کاربران ChatGPT میتوانند مستقیماً با ربات چت صحبت کنند و از آن درخواست کنند که بازگو کند، به طور مؤثری به ChatGPT اجازه میدهد برای اولین بار مستقیماً با صدا صحبت کند.
نمونه کلیپ OpenAI زنی را نشان میدهد که از ChatGPT میخواهد یک داستان منحصر به فرد قبل از خواب ایجاد کند، که ChatGPT به درستی با صدای ترکیب شده زنانه به آن پاسخ میدهد.
به گفته Wired، مدل جدید تبدیل متن به گفتار در داخل توسعه داده شده است. این می تواند صدای «شبیه انسان» را از متن و چند ثانیه نمونه سخنرانی (با استفاده از مدل OpenAI Whisper) تولید کند و با لحن ها و سبک های مختلف صحبت کند. می توانید طیف وسیعی از نمونه های صوتی را در وبلاگ OpenAI بیابید.
برخی از شرکت ها در حال حاضر از مدل صوتی جدید OpenAI استفاده می کنند. به عنوان مثال، Spotify از مدل متن به گفتار OpenAI برای ترجمه پادکست ها به زبان های مختلف استفاده می کند و مهارت ترجمه زبان ChatGPT را با توانایی گفتاری جدید خود ترکیب می کند.
مدل جدید تبدیل متن به گفتار ChatGPT فقط برای مشترکین Plus و Enterprise با استفاده از برنامههای رسمی اندروید و iOS در دسترس است و انتظار میرود ظرف دو هفته آینده (از ۲۵ سپتامبر ۲۰۲۳) عرضه شود. علاوه بر این، ویژگی صوتی جدید برای شروع به زبان انگلیسی محدود شده است، اگرچه انتظار داریم که این ویژگی به سرعت تغییر کند.
ChatGPT می تواند تصاویر و عکس ها را شناسایی و تجزیه و تحلیل کند
بخش دوم آپدیت ChatGPT OpenAI، توانایی تجزیه و تحلیل و گفتگو تصاویر آپلود شده در ابزار است. گزینه تجزیه و تحلیل تصویر بصری در ویدیوهای به روز رسانی GPT-4 نشان داده شد، اما از آن زمان تا به حال زیاد مورد بحث قرار نگرفته است (به غیر از ChatGPT Code Interpreter).
اکنون، ChatGPT عملکردی مشابه لنز گوگل به دست می آورد. میتوانید یک تصویر را در ChatGPT آپلود کنید یا با استفاده از دوربین تلفن هوشمند خود در برنامه ChatGPT عکس بگیرید، و جزئیات تصویر را نشان میدهد و در صورت لزوم، زمینه بیشتری را اضافه میکند.
نامیدن آن “شبیه به لنز گوگل” واقعاً بی عدالتی است. امکان چت کردن در مورد تصویر برای به دست آوردن اطلاعات و زمینه بیشتر، آن را برای طیف وسیعی از تنظیمات بسیار مفید می کند. با این حال، مهم است که به چاپ ظریف توجه داشته باشید، با OpenAI واضح است که به دلایل حفظ حریم خصوصی و دقت، «توانایی ChatGPT برای تجزیه و تحلیل و اظهارنظر مستقیم درباره افراد» را محدود کرده است. با این وجود، آیا ابزار «Who Is This» مجهز به OpenAI برای آینده در دست ساخت است؟ (امیدواریم که نه!)
همانند مدل جدید تبدیل متن به گفتار، OpenAI قابلیت تشخیص تصویر را در دو هفته آینده راه اندازی خواهد کرد، اگرچه در همه پلتفرم ها و نه فقط برنامه ChatGPT در دسترس خواهد بود.
حریم خصوصی، امنیت و سایر مسائل
پیامدهای یک ChatGPT با صدا بسیار واضح است. مطمئنا، هیجان انگیز است. با این حال، توانایی ایجاد یک صدای سنتز شده منحصر به فرد با استفاده از یک قطعه کوتاه به عنوان مثال، دارای مسائل حریم خصوصی و امنیتی قابل توجهی است. پتانسیل بازیگران مخرب برای سوء استفاده از این ابزارها بسیار زیاد است، و مانند هر ابزار هوش مصنوعی مولد، زمانی که جن از بطری خارج شد، مطلقاً به داخل نخواهد رفت. جزر و مد
به نظر میرسد حتی هشدار OpenAI در مورد این موضوع با وجود ذکر این مسائل، از بدیهیات دور است:
با این حال، این قابلیتها خطرات جدیدی را نیز به همراه دارند، مانند پتانسیل بازیگران بدخواه برای جعل هویت شخصیتهای عمومی یا ارتکاب کلاهبرداری. به همین دلیل است که ما از این فناوری برای تقویت یک مورد خاص استفاده می کنیم – چت صوتی.
با توجه به این که نوک کوه یخ است، انتظار پاسخ به صدای تازه کشف شده ChatGPT را داشته باشید، به خصوص زمانی که یک افزایش قابل پیش بینی در عناوین ناخوشایند وجود دارد که ادعا می کنند از ChatGPT برای ارتکاب کلاهبرداری و غیره استفاده می شود.
OpenAI ChatGPT را به برنامه Go-To AI تبدیل می کند
هرچه OpenAI ویژگیهای کاربرپسند بیشتری را به ChatGPT اضافه کند، بیشتر به برنامه هوش مصنوعی مولد تبدیل میشود. ChatGPT بهعنوان اولین برنامهای که در طول رونق اولیه هوش مصنوعی به شهرت گستردهای دست یافت، علیرغم رقابت از سوی شرکتهایی مانند Google Bard (و احتمالاً Google Gemini) و Anthropic’s Claude، همچنان پیشرو است و تنها اپلیکیشنی است که برخی از آن استفاده میکنند.
تا زمانی که OpenAI بتواند به افزودن ویژگیهایی ادامه دهد که استفاده از ChatGPT را آسانتر میکند، مردم را درگیر نگه میدارد و هرچه بیشتر به هدف خود یعنی ابزار هوش مصنوعی چندوجهی نزدیکتر میشود.