نوشته و ویرایش شده توسط مجله ی رنگو
مایکروسافت از هوش مصنوعی تازه خود به نام Vasa رونمایی کرد که میتواند از روی عکس چهرههای سخنگو با حرکات لب کاملاً هماهنگ و طبیعی با حرکات سر تشکیل کند.
به نقل از سرویس اخبار فناوری و تکنولوژی تکنا، مهندسان مایکروسافت به گسترش هوش مصنوعی جدیدی به نام Vasa پرداختند که میتواند با پشتیبانی عکس یا فایل صوتی چهرههای متحرک واقعی تشکیل کند. نوع یک این مدل ساخته شده با پشتیبانی چهارچوب خاصی به تشکیل حالات چهره، حرکات لب به صورتی هماهنگ با حرکات طبیعی سر میپردازد. این سیستم میتواند در آینده به ازمایش ها دلنشین و واقعی در برنامههای گوناگون منجر بشود.
مطابق اظهار مایکروسافت کارکرد این سیستم چیزی فراتر از تطبیق لب با صدا بوده و در آن طیف گستردهای از ظرافتهای چهره حرکات طبیعی سر و احساسات نیز مشاهده خواهد شد. این چنین چهرههای ساخته شده توسط این سیستم فناوری زیاد واقعیتر است. علاوه بر آن به کاربران اجازه داده میبشود تا جهت نگاه کردن شخصیت، حالت حس و فاصله فهمیدن شده را اشکار کنند.
مطابق حرف های مایکروسافت این سیستم هیچگونه آموزشی با پشتیبانی عکسهای هنری صدای آواز یا گفتار غیر انگلیسی ندیده اما امکان تشکیل ویدیو با منفعت گیری از این ورودیها را خواهد داشت. مایکروسافت در ادامه توضیحات خود میگوید این سیستم قادر به تشکیل ویدیوها با وضوح بالا بوده و نرخ فریم ویدیوهای تشکیل شده نیز زیاد بالا است. Vasa1 میتواند در حالت آفلاین ویدیوهایی با شدت ۴۵ فریم در ثانیه تشکیل کند و در شکل آنلاین شدت آن به ۴۰ فریم در ثانیه میرسد.
مایکروسافت معتقد است در آینده این سیستم میتواند پتانسیل سوء منفعت گیری از سیستمهای هوش مصنوعی را برجستهتر کند. این چنین از کاربردهای این سیستم میتوان به ازمایش ها آموزشی بهتر و افزایش عرصه ارتباطات اشاره کرد. در نمونه انتشار شده تصویری از نقاشی معروف مونا لیزا در حال سخن بگویید کردن انتشار شد که قابلیت و کارکرد این مدل را نشان می دهد.
دسته بندی مقالات