آوین ویژه»

مجسمه‌های عظیم سنگی راه می‌روند / اسطوره یا فناوری پیشرفته باستانی؟ زیرنویس شبکه خبر در ساعات اخیر حسابی سوژه شد+ عکس هشدار بارش‌ سیل‌آسا و کولاک برف در ۶ استان؛ فردا سردترین روز سال است بازنشستگان امروز منتظر باشند؛ حساب ها شارژ می‌شوند پیش بینی هیجان انگیز درباره قیمت طلا اعلام شد | خریداران بخوانند سوال روز دهم مسابقه «زندگی با آیه‌ها» در استان مرکزی؛ برنده روز نهم دولت برای تصمیم‌گیری اقتصادی از ظرفیت اتاق ایران استفاده کند مسعود پزشکیان: یک عده پول و امکانات دارند، اما بقیه بچه‌های ما چه می‌شوند؟ جنگ‌ها بعد از پایان هم ادامه دارند؛ تجربه‌ای که ازما فرد دیگری می‌سازد سید علی خمینی: وحدت کلمه و اجتماع بر نقاط مشترک ایرانیان ضروری است ترامپ: برای تامین بودجه بیشتر برای نیروهایمان به کنگره می‌روم کمتر از ۵ ساعت تا اعلام نتایج انتخابات ریاست‌جمهوری آمریکا/ چه کسی پیروز خواهد شد؟ هشدار نسبت به تبعات انتقال عناصر پ.ک.ک به شمال عراق جایزه ۷۰ میلیونی برای طراحی پوستر جشنواره موسیقی فجر امیدواری عربستان به تعامل مثبت ایران و آمریکا دو راهی خطرناک بین طلا و بورس | سرمایه گذاران بخوانند بیش از ۹۰۰ مورد بازدید نظارتی از مراکز گردشگری لرستان انجام شد واکنش عراقچی به تهدید اجرای اسنپ بک/ ادامه تهدید به اعمال تحریم‌ها، بحث هسته‌ای در ایران را به تسلیحات هسته‌ای می‌کشاند

6

ربات در نقش انسان / وقتی هوش مصنوعی لب‌خوانی می‌کند

  • کد خبر : 237859
  • ۳۰ دی ۱۴۰۴ - ۱:۵۴

پژوهشگران در دانشکده مهندسی کلمبیا یک ربات انسان‌نما به نام «اِمو» را آموزش داده‌اند تا گفتار و آواز را با بررسی و یادگیری از روی ویدیوهای آنلاین لب‌خوانی کند. این نشان می‌دهد که ماشین‌ها اکنون می‌توانند رفتار پیچیده انسانی را تنها با مشاهده یاد بگیرند.

به گزارش خبرآنلاین، به نقل از ایسنا، اِمو یک ربات با بدن کاملا انسان‌نما نیست بلکه یک چهره رباتیک است که بسیار واقعی ساخته شده و برای بررسی چگونگی ارتباط انسان‌ها به کار می‌رود.

این چهره رباتیک با پوست سیلیکونی پوشیده شده و توسط ۲۶ موتور مستقل صورت کنترل می‌شود که لب‌ها، فک و گونه‌ها را حرکت می‌دهند. این موتورها به اِمو اجازه می‌دهند شکل‌های دقیق دهان را بسازد که ۲۴ حرف صامت و ۱۶ مصوت را پوشش می‌دهند، که برای گفتار و آواز خواندن طبیعی، حیاتی است. هدف کاهش اثر «دره‌ وهم‌انگیز» بود. این اصطلاح برای توصیف حالتی به کار می‌رود که در آن ربات‌ها تقریبا شبیه انسان به نظر می‌رسند اما از آنجا که هنوز حرکات صورتشان با صدایشان مطابقت ندارد، حالتی وهم‌انگیز پیدا می‌کنند.

فرآیند یادگیری در چند مرحله اتفاق افتاد. ابتدا اِمو چهره خودش را با حرکت دادن موتورها در حالی که خودش را در آینه نگاه می‌کرد، بررسی کرد. این به سامانه کمک کرد بفهمد فرمان‌های موتوری چگونه شکل‌های صورت را تغییر می‌دهند.

"یوتیوب" کلاس درس لب‌خوانی برای یک ربات شد

سپس پژوهشگران یک خط لوله یادگیری معرفی کردند که صدا را به حرکت وصل می‌کند. اِمو ساعت‌ها ویدیوهای یوتیوب از افراد در حال صحبت و آواز خواندن را تماشا کرد، در حالی که یک مدل هوش مصنوعی رابطه بین صدا و حرکت قابل مشاهده لب را تحلیل می‌کرد.

به جای تمرکز بر زبان یا معنا، سامانه صداهای خام گفتار را مطالعه کرد. یک «مبدل کنش چهره» آن الگوهای یادگرفته‌شده را به فرمان‌هایی در لحظه تبدیل کرد.

این رویکرد به اِمو اجازه داد نه تنها در انگلیسی بلکه در زبان‌هایی که هرگز آموزش ندیده بود لب‌خوانی کند، از جمله فرانسوی، عربی و چینی. همان روش برای آواز هم کار کرد، که به خاطر کشیده شدن مصوت‌ها و تغییرات ریتم سخت‌تر است.

پژوهشگران می‌گویند این مطالعات اهمیت دارند زیرا ربات‌های آینده اگر قرار است در کنار مردم کار کنند باید طبیعی ارتباط برقرار کنند.

افزودن مواردی مانند پوست مصنوعی که به ربات‌ها حساسیت شبیه انسان می‌دهد و همراه با لب‌خوانی واقعی، به راحتی نشان می‌دهد که ربات‌ها شروع کرده‌اند کمتر شبیه ماشین و بیشتر شبیه همراهان اجتماعی ما شوند. اِمو هنوز یک پروژه پژوهشی است، اما نشان می‌دهد که ربات‌ها ممکن است روزی مهارت‌های انسانی را همان‌طور که ما یاد می‌گیریم، با تماشا و گوش دادن، بیاموزند.

5858

لینک کوتاه : https://avindaily.com/?p=237859

جویای نظرات شما هستیم

مجموع دیدگاهها : 0
قوانین درج کامنت در آوین‌دیلی
  • کامنت‌های ارسالی شما، ابتدا توسط سردبیر آوینی ما بررسی خواهد شد.
  • اگر کامنت شما، حاوی تهمت یا افترا باشد، منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.