هوش مصنوعی VLOGGER سوژه‌های ثابت را به شخصیت‌های سخنگو تبدیل می‌کند [تماشا کنید]


مهندسان گوگل هوش مصنوعی جدیدی به‌نام VLOGGER توسعه داده‌اند که می‌تواند تصویر ثابت از یک فرد را به یک آواتار متحرک و سخنگو تبدیل کند.

مهندسان گوگل، VLOGGER را به‌عنوان یک چارچوب نوآورانه برای ترکیب تصویر و صدا توصیف می‌کنند. آن‌ها می‌گویند که هدف‌شان از ساخت این هوش مصنوعی، نوعی اتوماسیون و واقع‌گرایی رفتاری است که برای مکالمات طبیعی با کاربران طراحی شده.

VLOGGER فقط به یک تصویر و یک کلیپ صوتی دلخواه به عنوان ورودی نیاز دارد و می‌تواند برای ارتباط آنلاین، آموزش دستیار مجازی شخصی‌سازی‌شده یا ویرایش ویدیو استفاده شود.

دیپ‌فیک‌ها درحال‌حاضر یک نگرانی رو به رشد محسوب می‌شوند. به‌دلیل دردسترس بودن عمومی ابزارهای هوش مصنوعی مولد، تولید دیپ‌فیک آسان‌تر از همیشه شده است و هوش مصنوعی VLOGGER که می‌تواند کلیپ‌های ویدیویی متحرک و گویا از افراد را فقط ازطریق یک تصویر تولید کند ممکن است مورد سوءاستفاده قرار بگیرد.

VLOGGER برای تولید تصویر متحرک به آموزش خاصی نیاز ندارد که احتمالاً به آن امکان می‌دهد ویدیویی واقع‌گرایانه را از هر کسی تولید کند، از جمله افرادی که شناخته‌شده نیستند.

انیمیشن‌های هوش مصنوعی VLOGGER هنوز کامل نیستند و به شیوه‌ای رباتیک و غیرطبیعی صحبت می‌کنند؛ اما با استفاده از حجم وسیعی از داده‌ها شامل ۲٬۲۰۰ ساعت ویدیو، به‌مرور زمان بهبود خواهند یافت.



دیدگاهتان را بنویسید