این ربات می تواند – واقعاً – علمی آمریکایی رپ کند



اگر دستیار دیجیتال شما بتواند با رپ مبارزه کند چه می کنید؟ این ممکن است اغراق آمیز به نظر برسد ، اما گیل وینبرگ ، یک تکنسین موسیقی در انستیتوی فناوری جورجیا ، یک ربات موسیقی به نام شیمون را برای ساخت متن و اجرای در زمان واقعی اقتباس کرده است. این بدان معناست که او می تواند در “مکالمات” رپ با مردم شرکت کند و شاید حتی به آنها در ساختن شعرهای خود کمک کند. Shimon ، که عمداً به نظر می رسد شبیه دستگاه است (اینجا گوش کنید) ، به گونه ای طراحی شده است که یکی از همکاران موسیقی – یا مخالف غیرانسانی نبرد رپ است.

موسیقی تولید شده توسط رایانه به دهه 1950 برمی گردد ، زمانی که رایانه های اولیه از الگوریتم ها برای ساخت ملودی استفاده می کردند. ربات های مدرن می توانند از یادگیری ماشین برای سازگاری با سازها ، از جمله فلوت و طبل استفاده کنند. یکی از این ماشین ها نسخه قبلی شیمون بود که می توانست marimba بنوازد و آواز بخواند. به نظر می رسد ربات اخیراً به روز شده همان است. هنوز هم از یک “سر” توپی شکل تشکیل شده است که دارای ابروهای متحرک ظریف بر روی چشمان پوشیده از روکش است که در انتهای بازوی مکانیکی قرار دارد. اما اکنون وینبرگ ادعا می کند که Shimon اولین ربات بداهه است که به رپ حمله می کند ، با ویژگی های سبک مشخص آن که چالش های منحصر به فرد برنامه نویسی را ایجاد می کند.

تاج افتخار رپ در متن شعر نهفته است. علاوه بر محتوای معنایی ، کلمات باید از یک ریتم و ریتم زیبایی پسند برخوردار باشند ، در حالی که چندین لایه از پیچیدگی های شاعرانه را ارائه می دهند. در گزارش اخیر منتشر شده در مجموعه مقالات یازدهمین کنفرانس بین المللی خلاقیت رایانه ای 2020 ، تیم تحقیقاتی وینبرگ پیشرفت های فنی که باعث احیای یک خواننده رپ شیمون شد را بیان کرد.

هنگامی که شیمون می زند ، این نرم افزار متون شفاهی حریف انسانی را به متن تبدیل می کند. سیستم ربات کلمات کلیدی را از این طریق شناسایی کرده و متون جدیدی را بر اساس چندین مجموعه داده سفارشی از کلماتی که شیمون در آنها آموزش دیده است تولید می کند (با استفاده از مدل های یادگیری عمیق). این مجموعه داده ها می توانند از هر متنی حاصل شوند: کارهای Lil Wayne ، JAY-Z یا رپرهای دیگر. متن های ژانرهای دیگر ؛ یا حتی آثار ادبی غیر موزیکال. تصور کنید شکسپیر یا جین آستین در صورت رپ زدن چه صدایی به دست می آورند. شیمون می تواند این را برای شما شبیه سازی کند.

سازندگان آن می گویند یکی از عناصر جدید در طراحی شیمون استفاده اضافی از مجموعه داده های واج برای ایجاد متن های جدید است. واج ها واحدهای فردی تلفظ هستند که صدای یک کلمه را تشکیل می دهند. ریچارد ساوری ، اولین نویسنده مقاله Shimon و یک تکنسین موسیقی در Georgia Tech ، می گوید شکستن کلمات کلیدی در این واحدها م mostثرترین راه برای ادغام قافیه در اشعار است. ساوری توضیح می دهد: “نحوه اتصال واج ها بین کلمات واقعاً مهم است” ، حتی گاهی اوقات “از معنی واقعی کلمات نیز مهم تر است.” مجموعه داده های آموزش واج به شیمون اجازه می دهد عبارات کلمه کلیدی و ریبوت را پخش کند و سپس ربات یک ریتم موزون را به گفتار خود اعمال می کند.

سیستم های Shimon باید به اندازه کافی سریع باشند تا بتوانند در زمان واقعی بدون به خطر انداختن عملکرد پاسخ دهند. برای دستیابی به این هدف ، محققان چندین تصمیم برنامه نویسی دشوار اتخاذ کردند ، از جمله محدود کردن واژگان شیمون به حدود 3000 کلمه و کوتاه کردن زمان “گوش دادن” شیمون به حریفش. در حال حاضر ، شیمون می تواند در کمتر از هفت ثانیه بازگشت کند در حالی که حرکات بداهه ای مانند تکان دادن سر و ابروهای بالا را انجام می دهد. به روزرسانی های سخت افزاری ، مانند پردازنده گرافیکی قدرتمندتر ، در نهایت روند کار را تسریع می کنند.

Prem Sietaraman ، یک دانشمند تحقیق در راه اندازی فناوری Descript که در این پروژه دخیل نبوده است ، می گوید هیچ یک از واحدهای فن آوری Shimon کاملاً جدید نیست ، اما این عنصر پیش ساخته است. سیه آرامان می گوید: “به طور کلی ، زمینه کاملاً به چیزهای مختلف بسته است ، مانند گفتار به متن ، متن به گفتار ، موسیقی.” “این رشته خوب نزدیک می شود [enough] سطح پیچیدگی تا مردم بتوانند آنها را بپذیرند [components] و آنها را در سیستم های تعاملی واقعاً جالب به هم متصل کنید. “

علاوه بر اخبار شیمون ، وینبرگ می خواهد که رباتش به مردم این فرصت را بدهد تا انواع جدید موسیقی را تجربه کنند. “من اهمیتی نمی دهم اگر [Shimon] این کار را بدون مردم انجام می دهد … به عنوان یک سیستم موسیقی کاملاً خودمختار ، “او می گوید. هدف او این است که ببیند روبات های او چگونه “ارتباط و تعامل برقرار می کنند” [humans] و آنها را از راه های شگفت آور الهام می گیرد. “وینبرگ قبلاً هرگز متن شعر ننوشته است ، اما می گوید شیمون برای اولین بار به او اجازه داد كه آهنگ تولید كند. وی افزود كه حتی درخواست كمك از آهنگسازان متأثر از بلوك نویسنده را دریافت كرده است.

Seetharaman ، نوازنده سرگرمی ، نیز می گوید که از فرصت هایی که فناوری Shimon برای غیر موزیسین ها فراهم می کند بسیار هیجان زده است. وی می گوید: “ابزاری که از هوش مصنوعی استفاده می کنند می توانند مانع ورود به هنر را کاهش دهند.” “مردم همیشه این کار را انجام می دهند: شما می بینید که مردم Instagram Stories و TikTok را می سازند [videos]. “

با این حال ، افراد حرفه ای برخی از موارد رزرو دارند. Rhys Langston ، خواننده رپ و چندرسانه ای که در این پروژه دخیل نیست ، می گوید که علاقه زیادی به رپ زدن با Shimon خواهد داشت ، به خصوص از این که همه گیر COVID-19 تعاملات شخصی را که لانگستون بیشترین الهام خود را از آن ایجاد می کند ، محدود می کند. او می گوید آنچه هوش مصنوعی می تواند به دست آورد چشمگیر است ، اما همچنین پیشنهاد می کند که ربات ها به راحتی دسترسی به الهام ندارند ، که گاهی اتفاق می افتد ناشی از مواردی مانند خطاهای انسانی است. لنگستون توضیح می دهد ، در طول یک جلسه ضبط ، اشتباهات در بعضی مواقع به ضبط نهایی ختم می شوند زیرا به طرز شگفت آوری خوب به نظر می رسند. حوادث “فرصت ها را باز می کند زیرا همه چیز نیست [in a recording] در حال برنامه ریزی است “. “آیا می توانید یک ماشین را یاد بگیرید که اشتباه کند؟”


منبع: khabar-nab.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*