اگر چه تلاش برای تولید ویدئوهای هوش مصنوعی با استفاده از فایل های صوتی پدیده تازه ای نیست، اما مایکروسافت مدعی است فناوری جدید ابداع شده توسط این شرکت منجر به خلق ویدئوهای بسیار باکیفیت و کاملا منطبق با ویژگی های خاص هر فایل صوتی می گردد.

تا پیش از این برای افزایش کیفیت فایل های ویدئویی تهیه شده، باید فایل صوتی اولیه فاقد هرگونه صدای مزاحم بوده و فرد در آن با حالت عادی سخن می گفت. اما فناوری مایکروسافت پیشرفته تر بوده و حتی در صورت وجود صدای پس زمینه مزاحم و شرایطی همچون هیجان زده و غیرعادی بودن فرد نیز می تواند تصاویر ویدئویی باکیفیت را استخراج کرده و خروجی نهایی را تحویل دهد.

مایکروسافت مدعی است فناوری هوش مصنوعی جدید این شرکت با بررسی تن صدا، حالت حرف زدن و دیگر ویژگی های خاص هر فرد خروجی مناسبی از چهره افراد با رعایت حالت های احساسی، ویژگی های هویتی و جنسیتی نژاد و شخصیت افراد ارائه می دهد.

این شرکت برای ارتقای این فناوری هوش مصنوعی از هزار فایل صوتی و ویدئویی ضبط شده مربوط به بیش از ۱۰۷ هزار نفر در حالت های مختلفی عاطفی و احساسی استفاده کرده است.

منبع:

https://www.beytoote.com/computer/technews/enews406580.html

تولید ویدئوی هوش مصنوعی با فایل های صوتی ممکن شد

روتر مش نست وای فای گوگل همراه با دستیار صوتی

انتشار اولین تصویر از بدن انسان با لیزر فراصوت توسط محققان MIT

سنجاق سری که صدا را برای ناشنوایان ترجمه می کند

پی بردن به نام موزیک و خواننده در هنگام پخش موزیک با استفاده از تلگرام

های ,فایل ,صوتی ,مصنوعی ,فناوری ,هوش ,هوش مصنوعی ,این شرکت ,ویژگی های ,فایل صوتی ,فایل های
مشخصات
آخرین جستجو ها