لبخند یک عروسی و سلام و احوالپرسی یک بازی فوتبال مانند دنیا است



در قرن نوزدهم ، پزشک متخصص فرانسوی Guillaume-Benjamin-Aman Duchenne ادعا کرد که مردم به طور جهانی از عضلات صورت خود برای ایجاد حداقل 60 اصطلاح گسسته استفاده می کنند ، که هر یک نشان دهنده یکی از 60 احساس خاص است. چارلز داروین ، که با کمی تردید از این موضوع استقبال کرد ، خود به عنوان شواهدی از تاریخ تکاملی کل بشر ، در مطالعه جهانی بودن حالت های صورت سرمایه گذاری کرد. سرانجام ، او كتابی در مورد عبارات انسانی نوشت ، كه به شدت به این ایده گرایش داشت كه حداقل بعضی از آنها در همه فرهنگ ها رایج است.

از زمان این حملات اولیه میدانی ، بحث در مورد اینکه آیا برخی از افرادی که ما می سازیم برای همه ما مشترک است و اگر چنین است ، چند نفر داغ شده است. دوشن در 60 سالگی متوقف شد ، در حالی که روانشناس ، پاك اكمن ، از دهه 1970 ، شش مورد (انزجار ، غم ، شادی ، ترس ، عصبانیت ، غافلگیری) را در ساختاری كه برای دهه ها ماندگار بود ، مشخص كرد.

یک مطالعه جدید منتشر شده در 16 دسامبر در طبیعت کارها را یک قدم جلوتر می برد و با مجموعه دیگری از حالات چهره جهانی روبرو می شود ، این بار بر اساس میلیون ها تصویر متحرک ، به جای تعداد کمی از تصاویر ثابت که در مطالعات قبلی استفاده شده است. نویسندگان با استفاده از رتبه بندی انسانی از 186،744 فیلم نشان می دهند که مردم در برابر موقعیت های مختلف واکنش نشان می دهند ، یک شبکه عصبی را برای نشان دادن حالات صورت از لیستی از برچسب های احساسات مانند هیبت ، گیجی و عصبانیت آموزش دادند. با استفاده از این آموزش ، شبکه عصبی شش میلیون فیلم از 144 کشور را ارزیابی کرد و به طور مداوم حالات صورت مشابه را با زمینه های اجتماعی مشابه در 12 منطقه جهان پیوند داد. به عنوان مثال ، یک واکنش صورت “پیروزی” اغلب بدون توجه به منطقه جغرافیایی با رویدادهای ورزشی همراه است ، که نشان دهنده پاسخ جهانی در این زمینه است.

اگرچه نتایج نشان می دهد که شیوه حرکت چهره ما در موقعیت های خاص ممکن است در فرهنگ های مختلف رایج باشد ، اما آنها بررسی نمی کنند که آیا این عبارات به طور دقیق تجربه درونی احساسات را نشان می دهند. تعدادی از عوامل می توانند نتایج را تحت تأثیر قرار دهند: محدودیت های یادگیری ماشین ، استفاده از فقط ارزیاب های انگلیسی زبان در هند برای آموزش الگوریتم ، و احتمال برخی سوinter تعبیرها از یافته ها نگران کننده است.

لیزا فلدمن بارت ، استاد دانشگاه و روانشناس دانشگاه شمال شرقی ، كه توضیحات همراه خود را درباره این مطالعه نوشت ، استفاده از فیلم و در نظر گرفتن زمینه “گامی مطلق به جلو” در این زمینه است. وی گفت: “س theyالی که آنها می پرسند در قلب ماهیت احساسات است ،” اما این خطر وجود دارد که بتوان از چنین اطلاعاتی برای قضاوت در مورد افراد استفاده کرد ، که “این زودرس خواهد بود زیرا روشهای زیادی برای تفسیر این نتایج وجود دارد.” “

نویسنده اصلی این مطالعه ، آلن كوون ، محقق در دانشگاه كالیفرنیا ، بركلی و یك محقق بازدیدكننده از گوگل ، موافق است و می گوید استفاده از یادگیری ماشینی برای مطالعه فیزیولوژی عواطف تازه آغاز شده است. وی گفت: “مطمئناً روزهای اولیه است و کاملاً نوپا است.” “ما فقط بر این مسئله تمرکز کرده ایم که آیا یادگیری ماشینی می تواند به محققان کمک کند تا به س questionsالات مهم در مورد احساسات انسانی پاسخ دهند.”

در این حالت ، ماشین آموزش یک شبکه عصبی عمیق است که ورودی می گیرد ، مانند یک فیلم ، و آن را از طریق لایه های مختلف تجزیه و تحلیل می کند تا ورودی را پیش بینی کند. در این حالت ، شبکه عصبی حرکت چهره را در فیلم ها ردیابی می کند و حالات صورت را در موقعیت های مختلف اجتماعی مشخص می کند. اما ابتدا باید یاد می گرفت که برچسب های مختلفی را که ارزیابی کنندگان انسانی با تنظیمات خاص صورت مرتبط می کنند ، استفاده کند.

برای تدریس آنلاین ، کاون و همکارانش به یک مخزن بزرگ از فیلم هایی که بینندگان امتیاز داده اند نیاز داشتند. تیمی از ارزیابان انگلیسی زبان در هند با انجام 273،599 رتبه بندی از 186،744 ویدیوی YouTube که هر کدام یک تا سه ثانیه طول کشید ، این وظیفه را انجام دادند. تیم تحقیقاتی از این نتایج برای آموزش شبکه عصبی برای طبقه بندی الگوهای حرکات صورت با یکی از 16 برچسب مربوط به احساسات ، مانند درد ، شک یا تعجب استفاده کرد.

محققان سپس شبکه عصبی دیگری داشتند که نشانه های بصری را در سه میلیون فیلم از 144 کشور مورد تجزیه و تحلیل قرار می داد تا به هر ویدئو ، از عروسی گرفته تا وزنه برداری تا شاهدان آتش بازی ، زمینه اجتماعی بدهد و در نهایت 653 متن را توصیف می کند.

آنها سپس شبکه بیان صورت این سه میلیون فیلم را آزمایش کردند و تخمین زدند که چگونه حالت های صورت خاص را در یک زمینه اجتماعی مشابه مانند “شادی” هنگام دیدن یک اسباب بازی اختصاص می دهد. نتایج نشان داد الگوی مشابهی از انجمن ها در 12 منطقه در سراسر جهان است. به عنوان مثال ، صرف نظر از منطقه ، شبکه عصبی تمایل دارد که حالات صورت را با عنوان “سرگرم کننده” مرتبط کند ، اغلب اوقات با متن هایی با عنوان “شوخی عملی” مرتبط است و برچسب اصطلاح “درد” به طور مداوم با زمینه های ناجور مانند لیفتینگ همراه است. روی اوزان.

برای رد تأثیر افراد در این سه میلیون فیلم در تعریف زمینه اجتماعی ، محققان زمینه آنلاین دیگری داشتند که فقط از کلمات موجود در برچسب ها و توضیحاتی که با فیلم ها همراه بودند استفاده می شد. این شبکه سه میلیون فیلم دیگر تهیه کرده و زمینه های اجتماعی 1953 را تعریف کرده است. هنگامی که شبکه بیان چهره 16 برچسب را به این فیلم ها اعمال کرد ، توالی مشابه اما کمی ضعیف تری بین برچسب بیان صورت و زمینه اختصاص داده شده به فیلم وجود دارد. کاون گفت این نتیجه قابل انتظار است زیرا متن زبان بسیار کمتری نسبت به تکالیف متنی مبتنی بر ویدیو است ، “که شروع به نشان دادن آنچه اتفاق می افتد وقتی بیش از حد به زبان اعتماد کنید”.

کاون و همکارانش هنگام مقایسه نتایج به تفکیک مناطق ، موارد مشابهت کلی بیشتری را در مناطق همسایه از نظر جغرافیایی یافتند ، اگرچه تفاوت های منطقه ای وجود دارد. آفریقا بیشترین شباهت را به انجمن های بیان متنی خود به خاورمیانه داشت و کمتر به هند دور شباهت داشت.

کوین گفت ، هنوز هم هر منطقه به طور متوسط ​​برای هر 12 منطقه مشابه است ، بیشتر از هر همسایه نزدیک آن.

جفری کوهن ، استاد روانشناسی در دانشگاه پیتسبورگ ، که مقاله را نیز مرور کرد ، می گوید که این اعتقاد بر این است که این حالت های صورت احساسات و قصد را بیان نمی کند. “آنها در متن به هم پیوسته اند ، اما در مورد معنای هر عبارتی نتیجه گیری دور است. بین حالت چهره و احساسات هیچ نقشه شخصی وجود ندارد. “

کاون تأیید کرد که “ما نمی دانیم کسی براساس حرکات عضلات صورت خود چه احساسی دارد و ما ادعا نمی کنیم که چنین استنباط می کنیم.” به عنوان مثال ، “همان حالت صورت که در رویدادهای ورزشی در یک فرهنگ نسبت به فرهنگ دیگر استفاده می شود ، ممکن است با یک تجربه احساسی مثبت یا منفی همراه باشد.”

بارت اذعان می کند که یادگیری ماشین تکنیکی قدرتمند است ، اما باید با احتیاط از آن استفاده شود. او می گوید: “شما باید مراقب باشید که عقاید ارزیابی کنندگان انسانی را در این مدل ها و جایی که اعتقادات بر یادگیری تأثیر می گذارد رمزگذاری نکنید.” “هر چقدر مدل سازی پیچیده ای داشته باشد ، شما را از ضعف هایی که در هنگام مداخله انسان ایجاد می شود محافظت نمی کند.” او به عنوان مثال یادآور شد که ارزیابی کنندگان فیلم هایی که برای آموزش الگوریتم بیان صورت استفاده می شود ، و همان فرهنگ و منطقه ، و محدود به استفاده از لیستی از برچسب ها هستند که خود کلمات احساسی هستند ، مانند “عصبانیت” و نه توصیف ، مانند “شلخته”.

کیسی فیسلر ، استادیار علوم کامپیوتر در دانشگاه کلرادو ، بولدر ، که در این ماجرا درگیر نیست ، از احتمال تعصب در استفاده از چهار دسته نژادی که نویسندگان برای ارزیابی تأثیر این عامل استفاده کرده اند ، ابراز نگرانی کرد. وی گفت: “ادبیات عظیمی وجود دارد كه مثلاً از تعصبات ضمنی در ارزیابی حالتهای چهره افراد از نژادهای مختلف صحبت می كند.”

نازنین اندعلیبی ، استادیار دانشکده علوم رایانه ای دانشگاه میشیگان گفت ، فرضیاتی که در مورد جهانی بودن حالت های صورت استفاده می شود ، می تواند به افرادی که در حاشیه هستند یا از نظر اقتصادی آسیب پذیر هستند آسیب برساند. او بعنوان نمونه ای از برنامه های قبلی شناسایی چهره ، می گوید: “هر چقدر هم که لبخند بزند ، برخی از الگوریتم ها همچنان احساسات منفی را با چهره های سیاه مرتبط می کنند ، بنابراین آسیب های زیادی در سطح فردی وجود دارد.”

Cohn می گوید ، این فناوری همچنین مزایای بالقوه ای دارد ، مانند شناخت حالت های چهره در افراد در معرض خطر خودكشی. وی گفت که مرتبط بودن زمینه در این کار گام مهمی در این راستا است. “من نمی گویم ما می توانیم بیرون برویم و بفهمیم کسی افسرده است ، اما در یک زمینه خاص مانند یک مصاحبه بالینی ، می توانیم شدت افسردگی را بسنجیم.”

تلاش برای استفاده از این فناوری رو به جلو – برای جلوگیری از خودکشی یا استفاده دیگر – مستلزم توجه به مشکلات مختلف واقعی است که در صورت قضاوت یک الگوریتم در مورد افراد ممکن است. بارت می گوید: “فنون یادگیری ماشین بسیار عالی و واقعاً مفید هستند ، اما گلوله جادویی نیستند.” “این فقط یک بحث باطنی روی دیوارهای آکادمی یا دیوارهای Google نیست.”


منبع: khabar-nab.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*