فناوری جدید به تصاویری که فاقد آن هستند، «متن جایگزین» می دهد.
زیرنویسها راهی عالی برای کمک به افرادی که مشکلات دسترسی دارند، محتوایی را که مصرف میکنند درک کنند، و اکنون مایکروسافت میخواهد آنها را حتی بهتر کند. این شرکت اعلام کرده است که مایکروسافت اج اکنون تصاویر را “کپشن” می کند تا آنهایی که به سختی دیده می شوند بدانند چه خبر است.
توضیحات تصویر جدید مایکروسافت اج
مایکروسافت این خبر را در بلاگ مایکروسافت اج اعلام کرد. زیرنویس برای تقویت راویانی است که محتوا را در یک صفحه وب می خوانند.
گاهی اوقات، صاحبان وب سایت خود متنی را روی تصاویر تنظیم می کنند (به نام “متن جایگزین”) که راوی آنها را می خواند. این بدان معناست که کسانی که بینایی کمتری دارند می توانند “تصویر را بشنوند” و بفهمند که در وب سایت چه می گذرد.
با این حال، گاهی اوقات صاحبان وبسایت متنی را تنظیم نمیکنند، که باعث میشود راوی درباره اینکه تصویر چیست، در تاریکی باقی بماند. اگر این اتفاق در Microsoft Edge رخ دهد، میتواند تصویر را در Computer Vision API برای خدمات شناختی Azure آپلود کند.
مایکروسافت بیان میکند که API با اکثر فرمتهای تصویری که به خوبی استفاده میشوند، مانند JPEG، PNG و حتی GIF کار میکند. هنگامی که API فکر میکند میداند چه اتفاقی میافتد، عنوان خود را برای راوی کاربر ایجاد میکند تا از آن استفاده کند. API می تواند هم آنچه در یک تصویر می گذرد و هم هر متن چاپ شده روی آن را شناسایی کند.
با این حال، چند محدودیت برای این ویژگی وجود دارد. موارد زیر را پردازش نمی کند:
- تصاویری که توسط نویسنده وب سایت به عنوان “تزیینی” علامت گذاری شده اند. تصاویر تزئینی به محتوا یا معنای وب سایت کمک نمی کند.
- تصاویر کوچکتر از 50×50 پیکسل (اندازه آیکون و کوچکتر)
- تصاویر بیش از حد بزرگ
- تصاویری که توسط Vision API بهعنوان ماهیت هرزهنگاری، ترسناک یا تلقینکننده جنسی دستهبندی میشوند.
همچنین از روی هر تصویری که مالک وب سایت قبلاً متنی برای آن تنظیم کرده است، رد می شود. این بدان معنی است که متن جایگزین نوشته شده توسط انسان همیشه بر آنچه API فکر می کند باید بگوید اولویت دارد.
اگر API توصیف خود را ایجاد کند، راوی بیان می کند که تصویر “به نظر می رسد …” قبل از توصیف آن است. هر متنی که تشخیص دهد با “به نظر می رسد…” معرفی می شود تا شنوندگان بفهمند که راوی به جای استفاده از متن صاحب وب سایت، با استفاده از API حدس می زند.
یک برد دسترسی برای Edge
توسعه دهندگان مرورگرها همیشه در تلاش هستند تا یکدیگر را به عنوان سگ برتر تبدیل کنند، اما رقابت برای تبدیل شدن به در دسترس ترین مرورگر در بازار یک پیروزی برای همه است. افرادی که کم شنوایی یا بینا هستند می توانند بهتر از همیشه در اینترنت جستجو کنند زیرا شرکت ها برای ارائه بهترین تجربه مبارزه می کنند.
سایر شرکتهای خارج از بازار مرور وب، برداشت خود را از این فناوری ارائه میکنند. به عنوان مثال، در ژانویه 2021، فیس بوک برای کمک به افرادی که به کمک نیاز دارند، بهبودهایی را در خدمات توصیف تصویر هوش مصنوعی خود انجام داد.
به این ترتیب، کسانی که برای گشت و گذار در اینترنت به کمک نیاز دارند، ممکن است در مایکروسافت اج آرامش پیدا کنند. و با توجه به نحوه از پیش نصب شدن آن با هر کپی از ویندوز 10 و 11، به این معنی است که حداقل تنظیمات برای کارکرد این ویژگی وجود دارد.
دسترسی به اینترنت، یک ویژگی در یک زمان
هر خبری برای کمک به کسانی که به کمک نیاز دارند، خبر خوبی است و به نظر میرسد سرویس توصیف تصویر مایکروسافت اج برنده است. ما باید ببینیم که آیا سایر مرورگرها به این توسعه پاسخ می دهند یا خیر.