Shazam می تواند تقریباً هر آهنگی را تقریباً بلافاصله شناسایی کند. اما Shazam واقعا چگونه کار می کند؟
آیا تا به حال به این فکر کرده اید که Shazam چگونه آهنگی را که می نوازید می شنود و آن را با چنین دقتی شناسایی می کند؟ خوب، شما تنها نیستید.
فناوری تقویت کننده سرویس تشخیص موسیقی برای بسیاری یک معماست، به خصوص که این سرویس سال ها قبل از اینکه تلفن های هوشمند و یادگیری ماشینی تبدیل به یک چیز شوند، راه اندازی شد.
در این مقاله، نحوه عملکرد Shazam و نحوه تشخیص دقیق موسیقی را بررسی خواهیم کرد.
Shazam چیست؟
Shazam یک برنامه تشخیص موسیقی محبوب است که میتوانید از آن برای یافتن اطلاعات درباره آهنگ جدیدی که دوست دارید استفاده کنید، اما عنوان یا نام هنرمند را نمیدانید.
فرض کنید در یک کافی شاپ هستید یا در گوشه ای از مغازه قدم می زنید و آهنگ جدیدی را می شنوید که دوست دارید در کتابخانه موسیقی خود داشته باشید. Shazam به شما کمک می کند آهنگ را به راحتی پیدا کنید. تنها کاری که باید انجام دهید این است که چند ثانیه از آهنگ را در برنامه ضبط کنید.
برنامه Shazam از فناوری تشخیص صدا برای شناسایی موسیقیهایی که میشنوید در چند ثانیه استفاده میکند تا بتوانید نام هنرمند را بیابید و آهنگ را دنبال کنید، ویدیوها را تماشا کنید و حتی آهنگ را روی دستگاه خود بخرید یا پخش کنید.
دانلود: Shazam برای iOS | اندروید (رایگان)
Shazam چگونه کار می کند؟
Shazam از یک فناوری انحصاری توسعه یافته توسط Avery Lin-Chun Wang، یکی از بنیانگذاران برنامه و دانشمند ارشد داده، استفاده می کند تا مطابقت آهنگ های درخواست شده در پلت فرم خود را شناسایی کند. این فناوری برای ضبطهای صوتی اثر انگشت ایجاد میکند، که سس مخفی پشت مهارتهای تشخیص عالی Shazam است.
Shazam اثر انگشت صوتی متشکل از مجموعهای از دادههای عددی را برای هر بیش از 15 میلیارد آهنگ ایجاد و ذخیره میکند. هنگامی که کاربر آهنگی را «شزمس» میکند، Shazam به سرعت یک اثر انگشت صوتی از صدای دریافتی از تلفن هوشمند یا میکروفون رایانه شخصی ایجاد میکند.
پس از ایجاد اثر انگشت صوتی برای ضبط، Shazam اثر انگشت صوتی (نه صدا) را در سرور خود آپلود می کند، جایی که جستجوی پایگاه داده را برای موارد مشابه اجرا می کند. اگر مطابقت پیدا شد، اطلاعات آهنگ را با گزینههایی درباره مکان پخش یا خرید آن به همراه اطلاعات شناسایی برمیگرداند.
اثر انگشت صوتی چیست؟
اثر انگشت صوتی یک خلاصه دیجیتال فشرده از سیگنال های صوتی است. آنها برای شناسایی یک نمونه صوتی یا مکان یابی موارد مشابه در یک پایگاه داده صوتی استفاده می شوند.
فناوری انگشت نگاری صوتی Shazam می تواند قطعات بدون برچسب محتوای صوتی را با موارد مشابه در پایگاه داده صوتی خود مطابقت دهد. Shazam عنوان آهنگی را که ضبط کردهاید (یک محتوای صوتی بدون برچسب) با تطبیق اثر انگشت آهنگ با اثر انگشت آهنگهای موجود در پایگاه دادهاش شناسایی میکند.
Shazam با استفاده از نقاط داده مشخصی که با کمک طیفنگار شناسایی شدهاند، اثر انگشت منحصربهفردی را برای آهنگها در پایگاه داده خود ایجاد میکند.
طیف نگار چیست؟
طیف نگار یک نمودار سه بعدی است که به عنوان نمایش صدا استفاده می شود. طیفنگار تغییر فرکانسها را در یک دوره زمانی نشان میدهد که دامنه یا حجم را نیز در نظر میگیرد. عکس زیر نمونه ای از قرائت طیف نگاری است.
اوری وانگ در مصاحبه ای با ساینتیفیک امریکن در سال 2003 فاش کرد که الگوریتم Shazam از نقاط طیف نگاری استفاده می کند که نت هایی با بالاترین انرژی را برای تولید اثر انگشت صوتی نشان می دهد.
Shazam با نادیده گرفتن بیشتر اطلاعات موجود در یک آهنگ و تمرکز تنها بر روی چند نت تعیین کننده، می تواند پایگاه داده خود را جستجو کرده و با سرعتی باورنکردنی مطابقت دقیقی برای درخواست های آهنگ ارائه دهد.
Shazam چگونه می تواند آهنگ ها را در مکان های پر سر و صدا شناسایی کند؟
Shazam از آهنگ های ضبط شده بدون نویز و اعوجاج پس زمینه برای ایجاد اثر انگشت برای پایگاه داده خود استفاده می کند. وقتی آهنگی را با برنامه در مکانی پر سر و صدا ضبط میکنید، با شناسایی نتهایی که بیشترین انرژی روی ضبط را دارند، یک اثر انگشت صوتی از ضبط شما ایجاد میکند.
سپس پایگاه داده خود را برای یافتن اثر انگشت صوتی ضبط شده شما جستجو می کند، مشروط بر اینکه سطح نویز پس زمینه به اندازه کافی بالا نباشد که داده های استفاده شده برای ایجاد اثر انگشت صوتی را مخدوش کند.
مواقعی که Shazam نمی تواند به شما در شناسایی آهنگ کمک کند
Shazam در تطبیق آهنگ ها، حتی موسیقی مبهم که فکر می کنید ممکن است در پایگاه داده خود نباشد، عالی است. اما آیا لحظاتی وجود دارد که Shazam نتواند آهنگی را شناسایی کند؟
ضبط تحریف شده
وقتی آهنگی را در مکانی که سطح نویز پسزمینه خیلی زیاد است Shazam میکنید، نویز دادههای روی Spectrogram را مخدوش میکند. به همین دلیل، اثر انگشت صوتی ضبط شده شما با آهنگ اصلی متفاوت خواهد بود.
وقتی این اتفاق میافتد، Shazam گفتگوی Song Not Known را برمیگرداند زیرا نمیتواند مطابقت با اثر انگشت صوتی پیدا کند.
اجرای زنده ی موسیقی
Shazam در توانایی خود برای شناسایی موسیقی از اجراهای زنده کوتاهی می کند. این به این دلیل است که صدایی که در اجراهای زنده ضبط می کنید اغلب با نسخه اصلی آهنگ Shazam که برای ایجاد اثر انگشت صوتی استفاده می کند متفاوت است.
تنها راهی که Shazam می تواند آهنگ را در طول اجرای زنده شناسایی کند این است که گروه مهارت کافی برای اجرای آهنگ را دقیقاً همانطور که ضبط شده است داشته باشد. با آرزوی موفقیت گروه برای انجام این کار…
ضبط صدای شما
“آیا اگر من واقعاً خواننده خوبی بودم، می توانستم Shazam آهنگی را که می خواندم تشخیص دهد؟”
خلاصه نه
الگوریتم Shazam فقط می تواند موسیقی از پیش ضبط شده را شناسایی کند. برای اینکه Shazam بتواند آهنگی را که میخوانید شناسایی کند، باید صدای یکسانی را با سازها در سرعت ضبط شده اصلی آهنگ داشته باشید.
زمزمه شما
Shazam نمیتواند مطابق با هومها را شناسایی کند زیرا الگوریتم آن از فرکانسها و دامنههای دقیق برای ایجاد اثر انگشت صوتی برای آهنگهای پایگاه داده خود استفاده میکند.
وقتی آهنگی را زمزمه می کنید، Shazam برای آن اثر انگشت ایجاد می کند. اما از آنجایی که زمزمه فقط تلاشی برای سنتز مجدد یک آهنگ است، الگوریتم با ضبط مطابقت نخواهد داشت.
آیا Shazam تنها برنامه شناسایی موسیقی است؟
Shazam اولین سرویس شناسایی موسیقی بود و در حال حاضر پرکاربردترین اپلیکیشن شناسایی آهنگ است. با این حال، برنامه های دیگری وجود دارد که می توانید از آنها برای شناسایی آهنگی که در اطراف شما پخش می شود استفاده کنید. برخی حتی می توانند آهنگی را که می خوانید یا زمزمه می کنید شناسایی کنند.
سه مورد از محبوب ترین جایگزین های Shazam SoundHound، Musixmatch Lyrics و Genius هستند. Musixmatch و Genius در درجه اول به شما کمک می کنند تا اشعار موسیقی پخش شده در اطراف شما را شناسایی کنید، در حالی که SoundHound نزدیک ترین رقیب Shazam است.
موارد مرتبط: بهترین برنامههای تشخیص موسیقی برای یافتن آهنگها با آهنگ آنها
شما می توانید از برنامه SoundHound برای انجام تقریباً تمام کارهایی که Shazam انجام می دهد استفاده کنید. مزیت اصلی آن نسبت به Shazam این است که دارای قابلیت اضافه شده برای شناسایی آهنگ هایی است که می خوانید یا زمزمه می کنید.
اعتبار تصویر: Sulastri Sulastri / Shutterstock.com