آیا دستیارهای خانه هوشمند شما از هوش مصنوعی استفاده می کنند؟ بیایید دریابیم.
خلاصه عناوین
- آیا دستیاران مجازی مانند الکسا از هوش مصنوعی استفاده می کنند؟
- آیا سیری، الکسا و دستیار گوگل باید هوش مصنوعی در نظر گرفته شوند؟
- آینده هوش مصنوعی در دستیاران مجازی
نکات کلیدی
- دستیارهای مجازی مانند الکسا، سیری و دستیار گوگل از هوش مصنوعی، به ویژه یادگیری ماشینی و پردازش زبان طبیعی برای درک و پاسخ به دستورات صوتی استفاده می کنند.
- این دستیارهای مجازی صرفاً ابزارهای هوش مصنوعی نیستند، زیرا آنها عملکردهای دیگری دارند که به NLP یا یادگیری ماشینی متکی نیستند، مانند یادآوری ها و روال ها.
- ارائه دهندگان دستیار مجازی در حال کار بر روی یکپارچه سازی هوش مصنوعی مولد، با استفاده از مدل های زبان بزرگ (LLM)، برای درک بهتر درخواست های زبان طبیعی و ارائه پاسخ های طبیعی تر هستند. آمازون، گوگل و اپل به طور فعال در حال توسعه ادغام های مبتنی بر LLM برای دستیاران مجازی خود هستند.
اگر خانه هوشمند دارید، به احتمال زیاد از دستیارهایی مانند الکسا، دستیار گوگل یا سیری استفاده می کنید. اما آیا این دستیارهای خانگی محبوب از هوش مصنوعی برای عملکرد استفاده می کنند و اگر چنین است، چگونه؟
آیا دستیاران مجازی مانند الکسا از هوش مصنوعی استفاده می کنند؟
از آنجایی که دستیارهای مجازی می توانند به دستورات صوتی گوش دهند، از پردازش زبان مبتنی بر هوش مصنوعی بهره مند می شوند، زیرا به آنها کمک می کند دستورات و سؤالات صوتی را بهتر درک کنند و به آنها پاسخ دهند.
همه دستیارهای مجازی با یکدیگر متفاوت هستند و نوع هوش مصنوعی آنها نیز متفاوت است. با این حال، یادگیری ماشینی یک فناوری رایج است که توسط اکثر دستیاران مجازی استفاده می شود. سیری، الکسا و دستیار گوگل همگی از هوش مصنوعی و یادگیری ماشینی برای تفسیر درخواست ها و انجام وظایف استفاده می کنند.
الکسا از یادگیری ماشین و NLP (پردازش زبان طبیعی) برای انجام درخواستها استفاده میکند. «زبان طبیعی» به زبانی اطلاق میشود که در مکالمات انسانها به کار میرود و بهطور طبیعی جریان دارد. به منظور پردازش بهترین دستورات صوتی، دستیاران مجازی به NLP برای درک کامل آنچه درخواست می شود، تکیه می کنند.
با این حال، خود آمازون این را درک زبان طبیعی یا NLU می نامد. آمازون بیان می کند که از NLU برای استنتاج معنای واقعی یک گوینده و نه فقط کلماتی که می گویند استفاده می کند. آمازون در اینجا از مثالی استفاده میکند و بیان میکند که NLU به الکسا کمک میکند تا پیشبینی آب و هوا را در صورتی که کاربر بپرسد در خارج از خانه چگونه است، ارائه دهد. بدون گفتن «پیشبینی آبوهوا»، NLU به الکسا اجازه میدهد همچنان آنچه را که کاربر درخواست میکند، تشخیص دهد.
علاوه بر این، آمازون بیان می کند که NLU “همه چیز در مورد فراهم کردن رایانه ها با زمینه لازم در پشت آنچه می گوییم، و انعطاف پذیری برای درک بسیاری از تغییرات در نحوه گفتن چیزهای یکسان است.” به طور خلاصه، NLU ابزاری را برای تعیین بهتر آنچه کاربر هنگام برقراری ارتباط شفاهی میخواهد فراهم میکند.
Google Assistant از NLP و تعدادی الگوریتم پیچیده برای پردازش درخواستهای صوتی و شرکت در مکالمات دو طرفه استفاده میکند. ویژگیهایی مانند Look and Talk که در سال 2022 معرفی شد، از این الگوریتمها برای تعیین اینکه آیا شما به عنوان کاربر به سادگی از کنار Nest Hub خود عبور میکنید یا قصد تعامل با آن را دارید، استفاده میکنند.
از آن زمان، دستیار گوگل دستخوش به روز رسانی های متعددی شده است. در ژانویه 2024، گوگل اعلام کرد که ویژگیهای کمتر مورد استفاده، مانند آلارم رسانه و کنترل صوتی Google Play Books را حذف خواهد کرد.
در نهایت، سیری اپل وجود دارد. سیری در حال حاضر از هوش مصنوعی برای عملکردهای خود استفاده می کند و از NLP و یادگیری ماشینی استفاده می کند. مانند دو دستیار مجازی دیگر که در اینجا مورد بحث قرار میگیرند، سیری محرکهای صوتی را تشخیص میدهد و میتواند عبارت “Hey Siri” را با استفاده از یک شبکه عصبی مکرر دریافت کند.
دستیاران هوش مصنوعی نیز به سمت استفاده از هوش مصنوعی مولد حرکت می کنند. این یک نوع جدیدتر از هوش مصنوعی است که در حال حاضر در ابزارهایی مانند ChatGPT استفاده می شود.
هم گوگل و هم الکسا در حال حاضر در حال توسعه قابلیت های هوش مصنوعی برای دستیاران صوتی خود هستند. گوگل از Gemini، مدل زبان بزرگ خود (LLM) استفاده می کند. از سوی دیگر، آمازون در حال توسعه LLM خود است که در حال حاضر به عنوان “Alexa AI” شناخته می شود.
همانطور که توسط آمازون بیان شده است، الکسا AI چند امتیاز، از جمله ادامه مکالمه بدون کلمات تکراری، پاسخ های شخصی تر و کنترل چندین دستگاه متصل از طریق یک درخواست را امکان پذیر می کند.
در جولای 2023، اعلام شد که اپل در حال کار بر روی LLM خود به نام Ajax است که در ربات چت خود، Apple GPT استفاده خواهد شد. در اوایل سال 2024، گزارش هایی مبنی بر تلاش اپل برای بهبود سیری با استفاده از هوش مصنوعی مولد آغاز شد. در گزارش بلومبرگ Power On، اعلام شد که اپل در حال برنامهریزی یک بازسازی بزرگ برای سیری است.
به طور خاص، گزارش شده است که اپل در حال توسعه کد هوش مصنوعی، هم برای سیری و هم برای سرویس Apple Care است. 2024 ممکن است اطلاعات بیشتری در مورد این تحولات نشان دهد.
آیا سیری، الکسا و دستیار گوگل باید هوش مصنوعی در نظر گرفته شوند؟
با توجه به اینکه چقدر دستیاران مجازی به شدت به هوش مصنوعی متکی هستند، چه از طریق NLP و چه از طریق یادگیری ماشینی، طبیعی است که آنها را کاملاً به عنوان هوش مصنوعی طبقه بندی کنیم. دستیارهای صوتی مانند Alexa، Google Assistant و Siri اغلب به عنوان ابزارهای هوش مصنوعی شناخته می شوند، زیرا آنها از NLP و یادگیری ماشینی استفاده می کنند.
در حالی که این دستیاران مجازی دارای بسیاری از ویژگی های دیگر هستند که از هوش مصنوعی استفاده نمی کنند، اما برای عملکرد به شدت به هوش مصنوعی متکی هستند. بنابراین، آنها را می توان هوش مصنوعی در نظر گرفت.
آینده هوش مصنوعی در دستیاران مجازی
یکی از موارد مشترک بسیاری از ارائه دهندگان دستیار مجازی این است که در حال حاضر روی استفاده از هوش مصنوعی مولد در سیستم های خود کار می کنند.
هوش مصنوعی مولد رشته خاصی از هوش مصنوعی است که از یادگیری عمیق و شبکه های عصبی برای تولید متن یا رسانه بر اساس درخواست های کاربر (که می تواند به صورت متن یا تصویر نیز باشد) استفاده می کند. معرفی هوش مصنوعی مولد در دستیاران مجازی از طریق ادغام LLM ها انجام می شود.
در آینده، هوش مصنوعی مولد میتواند قابلیتهای زیر را به دستیاران مجازی بدهد:
- شخصی سازی بیشتر تجربه کاربر (بر اساس مکان، اولویت ها و غیره).
- ارائه مشاوره و توصیه برای مسائل روزمره.
- ارائه مکالمات معنادارتر با کاربران
همانطور که هوش مصنوعی همچنان پیچیدهتر میشود، ممکن است شاهد باشیم که دستیارهای صوتی قابل اعتماد ما بسیار توانمند شده و میتوانند در همه موارد به ما کمک کنند. هوش مصنوعی این پتانسیل را دارد که فناوریهای موجود را به عصر جدیدی از قابلیتها منتقل کند و دستیارهای صوتی نیز از این قاعده مستثنی نیستند.