خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

OpenAI به ChatGPT صدایی می دهد تا به اعلان ها و دستورات پاسخ دهد

OpenAI به ChatGPT توانایی صحبت با استفاده از صدای سنتز شده را داده است و به زودی به گوشی هوشمند شما می آید.

ChatGPT قرار است به یک تجربه هوش مصنوعی مولد تعاملی تبدیل شود. OpenAI فاش کرد که چت ربات پیشرو هوش مصنوعی جهان می‌تواند با استفاده از صدای ترکیبی و احتمالاً تولید شده توسط هوش مصنوعی صحبت کند و به سؤالات کاربران پاسخ دهد.

ChatGPT علاوه بر صدای جدید خود، می‌تواند به تصاویر خاصی که در آن آپلود شده یا در حین استفاده از برنامه ChatGPT اندروید یا iOS گرفته شده، پاسخ دهد و در مورد آنها بحث کند. ویژگی تشخیص تصویر شبیه به لنز گوگل و سایر برنامه هایی است که از شبکه های عصبی برای تشخیص دقیق داده ها و اطلاعات استفاده می کنند.

OpenAI به ChatGPT یک صدا می دهد

در 25 سپتامبر 2023، توسعه دهنده ChatGPT OpenAI فاش کرد که به ربات چت هوش مصنوعی مولد پیشرو خود در جهان صدایی خواهد داد. کاربران ChatGPT می‌توانند مستقیماً با ربات چت صحبت کنند و از آن درخواست کنند که بازگو کند، به طور مؤثری به ChatGPT اجازه می‌دهد برای اولین بار مستقیماً با صدا صحبت کند.

نمونه کلیپ OpenAI زنی را نشان می‌دهد که از ChatGPT می‌خواهد یک داستان منحصر به فرد قبل از خواب ایجاد کند، که ChatGPT به درستی با صدای ترکیب شده زنانه به آن پاسخ می‌دهد.

به گفته Wired، مدل جدید تبدیل متن به گفتار در داخل توسعه داده شده است. این می تواند صدای «شبیه انسان» را از متن و چند ثانیه نمونه سخنرانی (با استفاده از مدل OpenAI Whisper) تولید کند و با لحن ها و سبک های مختلف صحبت کند. می توانید طیف وسیعی از نمونه های صوتی را در وبلاگ OpenAI بیابید.

مطلب مرتبط:   چگونه تصاویر DALL-E خود را بدون واترمارک ذخیره کنید

برخی از شرکت ها در حال حاضر از مدل صوتی جدید OpenAI استفاده می کنند. به عنوان مثال، Spotify از مدل متن به گفتار OpenAI برای ترجمه پادکست ها به زبان های مختلف استفاده می کند و مهارت ترجمه زبان ChatGPT را با توانایی گفتاری جدید خود ترکیب می کند.

مدل جدید تبدیل متن به گفتار ChatGPT فقط برای مشترکین Plus و Enterprise با استفاده از برنامه‌های رسمی اندروید و iOS در دسترس است و انتظار می‌رود ظرف دو هفته آینده (از ۲۵ سپتامبر ۲۰۲۳) عرضه شود. علاوه بر این، ویژگی صوتی جدید برای شروع به زبان انگلیسی محدود شده است، اگرچه انتظار داریم که این ویژگی به سرعت تغییر کند.

ChatGPT می تواند تصاویر و عکس ها را شناسایی و تجزیه و تحلیل کند

بخش دوم آپدیت ChatGPT OpenAI، توانایی تجزیه و تحلیل و گفتگو تصاویر آپلود شده در ابزار است. گزینه تجزیه و تحلیل تصویر بصری در ویدیوهای به روز رسانی GPT-4 نشان داده شد، اما از آن زمان تا به حال زیاد مورد بحث قرار نگرفته است (به غیر از ChatGPT Code Interpreter).

اکنون، ChatGPT عملکردی مشابه لنز گوگل به دست می آورد. می‌توانید یک تصویر را در ChatGPT آپلود کنید یا با استفاده از دوربین تلفن هوشمند خود در برنامه ChatGPT عکس بگیرید، و جزئیات تصویر را نشان می‌دهد و در صورت لزوم، زمینه بیشتری را اضافه می‌کند.

نامیدن آن “شبیه به لنز گوگل” واقعاً بی عدالتی است. امکان چت کردن در مورد تصویر برای به دست آوردن اطلاعات و زمینه بیشتر، آن را برای طیف وسیعی از تنظیمات بسیار مفید می کند. با این حال، مهم است که به چاپ ظریف توجه داشته باشید، با OpenAI واضح است که به دلایل حفظ حریم خصوصی و دقت، «توانایی ChatGPT برای تجزیه و تحلیل و اظهارنظر مستقیم درباره افراد» را محدود کرده است. با این وجود، آیا ابزار «Who Is This» مجهز به OpenAI برای آینده در دست ساخت است؟ (امیدواریم که نه!)

مطلب مرتبط:   13 ایده عالی برای تولید فونت هوش مصنوعی در Adobe Firefly

همانند مدل جدید تبدیل متن به گفتار، OpenAI قابلیت تشخیص تصویر را در دو هفته آینده راه اندازی خواهد کرد، اگرچه در همه پلتفرم ها و نه فقط برنامه ChatGPT در دسترس خواهد بود.

حریم خصوصی، امنیت و سایر مسائل

پیامدهای یک ChatGPT با صدا بسیار واضح است. مطمئنا، هیجان انگیز است. با این حال، توانایی ایجاد یک صدای سنتز شده منحصر به فرد با استفاده از یک قطعه کوتاه به عنوان مثال، دارای مسائل حریم خصوصی و امنیتی قابل توجهی است. پتانسیل بازیگران مخرب برای سوء استفاده از این ابزارها بسیار زیاد است، و مانند هر ابزار هوش مصنوعی مولد، زمانی که جن از بطری خارج شد، مطلقاً به داخل نخواهد رفت. جزر و مد

به نظر می‌رسد حتی هشدار OpenAI در مورد این موضوع با وجود ذکر این مسائل، از بدیهیات دور است:

با این حال، این قابلیت‌ها خطرات جدیدی را نیز به همراه دارند، مانند پتانسیل بازیگران بدخواه برای جعل هویت شخصیت‌های عمومی یا ارتکاب کلاهبرداری. به همین دلیل است که ما از این فناوری برای تقویت یک مورد خاص استفاده می کنیم – چت صوتی.

با توجه به این که نوک کوه یخ است، انتظار پاسخ به صدای تازه کشف شده ChatGPT را داشته باشید، به خصوص زمانی که یک افزایش قابل پیش بینی در عناوین ناخوشایند وجود دارد که ادعا می کنند از ChatGPT برای ارتکاب کلاهبرداری و غیره استفاده می شود.

OpenAI ChatGPT را به برنامه Go-To AI تبدیل می کند

هرچه OpenAI ویژگی‌های کاربرپسند بیشتری را به ChatGPT اضافه کند، بیشتر به برنامه هوش مصنوعی مولد تبدیل می‌شود. ChatGPT به‌عنوان اولین برنامه‌ای که در طول رونق اولیه هوش مصنوعی به شهرت گسترده‌ای دست یافت، علی‌رغم رقابت از سوی شرکت‌هایی مانند Google Bard (و احتمالاً Google Gemini) و Anthropic’s Claude، همچنان پیشرو است و تنها اپلیکیشنی است که برخی از آن استفاده می‌کنند.

مطلب مرتبط:   Jukebox OpenAI چیست و چه کاری می توانید با آن انجام دهید؟

تا زمانی که OpenAI بتواند به افزودن ویژگی‌هایی ادامه دهد که استفاده از ChatGPT را آسان‌تر می‌کند، مردم را درگیر نگه می‌دارد و هرچه بیشتر به هدف خود یعنی ابزار هوش مصنوعی چندوجهی نزدیک‌تر می‌شود.