ابزارهای هوش مصنوعی در تولید موسیقی چیز جدیدی نیستند. اما در مورد موسیقی تولید شده از ابتدا با هوش مصنوعی چطور؟ این هم اکنون یک واقعیت است.
هوش مصنوعی مولد به آرامی در حال گسترش به رشته های همیشه در صنعت خلاق است. این کار با مولدهای هنری AI شروع شد و سپس به نوشتن با متن تولید شده توسط هوش مصنوعی گسترش یافت. اکنون می توانیم موسیقی را به آن لیست اضافه کنیم.
در آینده نزدیک، موسیقی تولید شده توسط هوش مصنوعی که از ابتدا تولید شده است، به واقعیت تبدیل خواهد شد. در واقع، این امکان از قبل با Jukebox، مدل هوش مصنوعی OpenAI برای ساخت موسیقی وجود دارد. این هنوز در یک برنامه کاربردی آسان در دسترس نیست، و هنوز به اندازه کافی خوب به نظر نمی رسد، اما استخوان های الگوریتمی وجود دارد.
در اینجا آنچه شما باید در مورد Jukebox OpenAI بدانید و کارهایی که می توانید با آن انجام دهید آورده شده است.
جوک باکس: هوش مصنوعی که موسیقی را به صورت صوتی خام تولید می کند
Jukebox یک شبکه عصبی است که میتواند موسیقی را به صورت صوتی خام تولید کند، وقتی به آن ورودی مانند ژانر، هنرمند یا اشعار بدهید. در آوریل 2020 توسط OpenAI منتشر شد، همان شرکتی که مولد هنر هوش مصنوعی به نام Dall-E و ربات چت هوش مصنوعی به نام ChatGPT را برای ما به ارمغان آورد.
برخلاف Dall-E که به سرعت در سراسر جهان گسترش یافت و هوش مصنوعی را به موضوعی داغ از اخبار و رسانه ها تبدیل کرد، جوک باکس پس از انتشار، طیف وسیعی از علاقه را به خود جلب نکرد. یکی از دلایل این امر این است که برنامه وب کاربرپسندی ندارد – حداقل هنوز نه.
میتوانید کد را در وبسایت OpenAI به همراه توضیحی عمیق درباره نحوه عملکرد فرآیند رمزگذاری و رمزگشایی بیابید.
دلیل احتمالی دیگر این است که زمان و قدرت محاسباتی بسیار زیادی را می طلبد. برای اینکه ایده ای به شما بدهم، تنها یک دقیقه صدا می تواند 9 ساعت طول بکشد تا ارائه شود. اگر میخواهید ببینید یک مدل هوش مصنوعی برای تولید موسیقی چه کاری میتواند انجام دهد، به تمایل به کشف مدل در فرم کد آن، به علاوه صبر زیادی نیاز دارید.
یا می توانید به کاوشگر نمونه جوک باکس بروید. اینجاست که OpenAI آزمایش های خود را از تولید آهنگ هایی شبیه الا فیتزجرالد یا 2Pac منتشر کرده است.
برای روشن بودن، ابزارهای موسیقی هوش مصنوعی دیگری وجود دارند که به شما در تولید آهنگ کمک می کنند، اما آنها صدا را از ابتدا تولید نمی کنند. در عوض، آنها یا نمونه های از پیش ضبط شده را ترکیب می کنند یا اطلاعات MIDI را ایجاد می کنند که از طریق یک سینت سایزر دیجیتال قرار می گیرد.
جوک باکس چه صدایی دارد؟
نتایج جوک باکس قابل تشخیص اما عجیب است. درک شکل آهنگ و ژانری که به آن تعلق دارد کار سختی نیست، اما کیفیت نتایج باعث می شود به نظر برسد که گویی در حال گوش دادن به برخی از قدیمی ترین موسیقی های ضبط شده هستید: یعنی با نویز فراوان.
به جرات می توان گفت، جوک باکس صدایی با کیفیت بالا را که از یک جفت هدفون خوب می شنوید تولید نمی کند. این بیشتر شبیه شنیدن موسیقی از یک ایستگاه رادیویی است که به طور کامل روی فرکانس مناسب تنظیم نشده است. برخی از آهنگ ها دوباره اجرا می شوند در حالی که برخی دیگر ادامه آهنگ های موجود هستند. همچنین دستهای برای هنرمندان و سبکهای رمان و اشعار دیده نشده وجود دارد.
با وجود کیفیت صدا، آزمایشکنندگان اولیه توصیف میکنند که از زیبایی وهمآور و ماهیت عجیب موسیقی ساخته شده توسط جوکباکس شگفتزده شدهاند. مرزمنچ در مدیوم می نویسد: «مثل یک موسیقی متن مستند درباره کشوری ناشناخته با فرهنگی ناشناخته».
در حال حاضر، نتایج به اندازه کافی برای کپی کردن یا حتی جایگزینی موسیقی ساخته شده توسط انسان خوب نیست، اما این فناوری به سرعت در حال حرکت است و به زودی، مدل هایی مانند Jukebox نیز قادر به انجام این شاهکارها خواهند بود.
جوک باکس OpenAI چگونه آموزش داده شد
بخشی از اینکه جوک باکس می تواند موسیقی بسازد که قبلا وجود نداشته است این است که بر روی موسیقی نوازندگان واقعی آموزش دیده است. OpenAI توضیح می دهد که:
“برای آموزش این مدل، ما در وب خزیده ایم تا مجموعه داده جدیدی از 1.2 میلیون آهنگ (600000 تای آن به زبان انگلیسی) همراه با اشعار و ابرداده مربوطه LyricWiki را انتخاب کنیم.”
خزیدن برای داده عملی است که توسط برخی شرکتهای هوش مصنوعی برای ایجاد مجموعهای از دادهها استفاده میشود که یک مدل هوش مصنوعی میتواند از آن برای یادگیری و تصمیمگیری هنگام تولید تصویر، متن یا در این مورد موسیقی استفاده کند. مجموعه داده های ایجاد شده توسط خزیدن بحث برانگیز هستند زیرا در وهله اول رضایت از صاحبان داده ها به دست نمی آید. اگرچه، برخی از پلتفرم ها به شما امکان می دهند محتوای خود را از مجموعه داده ها حذف کنید.
شاید فکر کنید که 1.2 میلیون آهنگ زیاد است، اما در مقایسه، Dall-E 2 روی صدها میلیون جفت تصویر-متن از اینترنت آموزش داده شده است. با در نظر گرفتن این موضوع، جوک باکس محدودیت های خود را دارد.
استخر آموزشی نسبتا کوچک آن نمی تواند ثروت و تنوع موسیقی بشر را به تصویر بکشد. OpenAI اعلام کرده است که عمدتاً بر روی موسیقی غربی آموزش دیده است، که نشان دهنده یک سوگیری آشکار در مورد موسیقی هایی است که می تواند تولید کند.
چه کاری می توانید با جوک باکس انجام دهید؟
بنابراین، با در نظر گرفتن محدودیت های آن، چه کاری می توانید با جوک باکس انجام دهید؟ یک راه سریع برای پاسخ به این سوال این است که بگویید چه کاری نمی توانید با جوک باکس انجام دهید.
از آنجایی که رندر یک دقیقه موسیقی نزدیک به نیم روز طول می کشد، برای تولید موسیقی چندان مفید نیست. حداقل، نه به معنای سنتی. به طور معمول، نوازندگان بین نواختن بر روی یک ساز (بداهه نوازی) و برنامه ریزی ساختار یک آهنگ به جلو و عقب می روند. همین نوع آزمایش با جوک باکس امکان پذیر نیست.
از آنجایی که ساختن یک آهنگ با جوک باکس در این مرحله آسان نیست، می توانید آن را بیشتر به عنوان یک روش جدید برای تولید نمونه های موسیقی در نظر بگیرید. هنگامی که صدای مورد علاقه خود را تولید کردید، می توانید از آن در پروژه های خلاقانه خود همانطور که معمولاً انجام می دهید استفاده کنید.
ویدیوی زیر نتیجه استفاده شخصی از موسیقی ایجاد شده با جوک باکس است تا بر روی یک ویدیو مونتاژ کوتاه تاکید کند.
هوش مصنوعی در خارج از برنامههای خلاقانه نیز کاربردهای گستردهای دارد، به همین دلیل است که ارزش درک هوش مصنوعی و خطرات آن را دارد.
آیا موسیقی هوش مصنوعی شما را تحت تأثیر قرار داده است؟
موسیقی تولید شده توسط جوک باکس به راحتی قابل رد نیست، و با وجود همه عجیب بودن و کیفیت وهم آلودش، در نهایت مانند موسیقی به نظر می رسد. در حالی که صنعت موسیقی مدتی است از ابزارهای هوش مصنوعی استفاده می کند، امکان تولید موسیقی به عنوان صدای خام تنها اکنون یک واقعیت است.
اما در حالی که مدلهایی مانند جوکباکس وجود دارند، هنوز در یک ابزار تجاری بستهبندی نشدهاند و هنوز از تواناییهای نوازندگان انسانی فاصله دارند.