سرویس جدید مجهز به هوش مصنوعی، پرتره ها را به سرهای سخنگو تبدیل می کند


سرویس جدید مجهز به هوش مصنوعی که می تواند پرتره ها را به سر سخنگو تبدیل کند، روز دوشنبه توسط D-ID معرفی شد.

این اپلیکیشن‌های سلف‌سرویس که Creative Reality Studio نامیده می‌شوند، می‌توانند تصویر یک چهره را با گفتار به ویدیو تبدیل کنند.

هدف این سرویس سازندگان محتوای تجاری – واحدهای یادگیری و توسعه، بخش‌های منابع انسانی، بازاریابان، تبلیغ‌کنندگان و تیم‌های فروش است، اما هر کسی می‌تواند این فناوری را در وب‌سایت D-ID امتحان کند.

استودیو واقعیت خلاق
ویدیوی جان پی ملو جونیور.


این پلتفرم هزینه و دردسر ایجاد محتوای ویدئویی شرکتی را کاهش می‌دهد و تنوع نامحدودی از ارائه‌دهنده‌ها – در مقابل آواتارهای محدود – از جمله عکس‌های خود کاربران یا هر تصویری که حق استفاده از آن را دارند، به گفته این شرکت، که زمانی بدنامی پیدا کرد، ارائه می‌کند. فناوری آن در اپلیکیشنی به نام Deep Nostalgia استفاده شد. این نرم افزار به عنوان راهی برای متحرک سازی پرتره های قدیمی ارائه شد.

این شرکت اضافه کرد که این فناوری مشتریان و کاربران را قادر می‌سازد تا هویت یک مجری را از جمله قومیت، جنسیت، سن و حتی زبان، لهجه و لحن خود انتخاب کنند. در یک بیانیه خبری آمده است: «این نشان‌دهنده و تنوع بیشتری را ارائه می‌دهد، که منجر به احساس قوی‌تری از شمول و تعلق می‌شود، و باعث ایجاد تعامل و تعامل بیشتر با کسب‌وکارهایی می‌شود که از آن استفاده می‌کنند».

متیو کرشاو، معاون بازاریابی D-ID به TechNewsWorld گفت: «موارد استفاده شامل توانمندسازی سازندگان محتوای تجاری برای ادغام یکپارچه ویدیو در فضاهای دیجیتال و ارائه‌ها با افزونه انحصاری پاورپوینت، تولید محتوای جذاب‌تر با استفاده از راوی‌های ویدیویی شرکتی سفارشی‌شده است».

خدمات چشمگیر

دانیل کاسترو، معاون بنیاد فناوری اطلاعات و نوآوری، یک سازمان تحقیقاتی و سیاست عمومی در واشنگتن، گفت: کیفیت این خدمات نسبتاً چشمگیر است و همچنان بهتر می شود.

او به TechNewsWorld گفت: “این سرویس در سطحی نیست که به طور کامل جایگزین ارائه کننده شود، اما دلیلی وجود ندارد که انتظار نداشته باشیم به زودی به آنجا برسد.”

D-ID توضیح داد که استفاده از ویدیو توسط مشاغل به طور چشمگیری افزایش یافته است و تعداد بیشتری از آنها آن را در آموزش، ارتباطات و استراتژی های بازاریابی خود ادغام می کنند.

تسریع این روند، ادامه داد، جهان‌های آواتارها و متاورس به سرعت در حال تکامل هستند که هر دو رویکرد محتوای خلاقانه‌تر، فراگیرتر و تعاملی‌تر را از سازندگان دیجیتال می‌طلبد. با این حال، بودجه تولید می تواند بسیار گران باشد و به تخصیص قابل توجه زمان و استعداد نیاز دارد.

راس روبین، تحلیلگر اصلی در Reticle Research، یک شرکت مشاوره فناوری مصرف کننده در شهر نیویورک، اظهار داشت: «این سرویس تکاملی از آواتارها و شکلک‌هایی است که امروزه مردم استفاده می‌کنند، اما می‌توان از آن در یک بحث یا ارائه طولانی‌تر استفاده کرد.

او به TechNewsWorld گفت: “ایده صرفه جویی در زمان است، به خصوص اگر می خواهید فیلمنامه ای را بخوانید.” “این می تواند برای مخاطب جذاب تر از صوت یا تماشای اسلایدها باشد.”

دموکراتیک کردن هوش مصنوعی

گیل پری، مدیر عامل و یکی از بنیانگذاران D-ID در یک بیانیه خبری خاطرنشان کرد که فناوری این شرکت که به شرکت محدود شده است، برای تولید 100 میلیون ویدیو استفاده شده است.

او ادامه داد: «اکنون که ما پلتفرم واقعیت خلاقانه سلف سرویس خود را ارائه می کنیم، پتانسیل بسیار زیاد است. هم شرکت‌های بزرگ‌تر، هم شرکت‌های کوچک‌تر و هم فریلنسرها را قادر می‌سازد تا ویدیوهای شخصی‌سازی‌شده را برای طیف وسیعی از اهداف در مقیاس وسیع تولید کنند.»

کرشاو افزود که فناوری D-ID خلاقیت را بیشتر دموکراتیک خواهد کرد. او گفت: “من می گویم “بیشتر” زیرا در واقع فناوری از قبل هنرها را برای چندین دهه دموکراتیک کرده است.”

از ابتدای پیدایش سینتی سایزرها، سمپلرها و ترتیب‌دهنده‌ها در موسیقی تا فتوشاپ و ایلاستریتور در عکاسی و تصویرسازی، و ویرایش برتر و رومیزی و موشن گرافیک در تولید فیلم، توانایی ایجاد محصولات با کیفیت بالا در خارج از استودیوهای تخصصی پیشرفته بوده است. از دهه 1980 اتفاق افتاده است.» “این فقط آخرین قسمت از آن مجموعه طولانی مدت است.”

آویوا لیتان، تحلیلگر امنیت و حریم خصوصی با گارتنر با این نظر موافق است: «این قطعاً یک گام رو به جلو در جهت دموکراتیک کردن هوش مصنوعی است. او به TechNewsWorld گفت: «در آموزش، مراقبت‌های بهداشتی و خرده‌فروشی کاربردهای بسیار خوبی دارد. «این فقط یک راه بهتر برای برقراری ارتباط با مردم است. ما در حال تبدیل شدن به یک جامعه بصری تر هستیم. هیچ کس وقت ندارد چیزی بخواند.»

نگرانی های عمیق

با نگرانی فزاینده در مورد استفاده از “دیپ فیک” برای انتشار اطلاعات نادرست و ارتقای مهندسی اجتماعی به ارتفاعات جدید، همیشه احتمال سوء استفاده از راه حل های رسانه مصنوعی جدید مانند D-ID وجود دارد.

کرشاو گفت: «همانند هر فناوری، فناوری ما می‌تواند توسط بازیگران بد برای بیماری استفاده شود، اما پلتفرم ما برای کسب‌وکارهای قانونی است که هیچ علاقه‌ای به این نوع استفاده ندارند.»

او ادامه داد: «علاوه بر این، ما دیپ فیک نیستیم. ما صورت شخص دیگری را روی بدن شخص دیگری قرار نمی دهیم و سعی نمی کنیم کسی را مجبور کنیم چیزی را که نگفته است بگوید.»

او افزود: «در پلتفرم D-ID، ما تدابیر حفاظتی متعددی قرار داده‌ایم تا مطمئن شویم از فناوری ما به این شکل استفاده نمی‌شود». ما صدای افراد مشهور یا بدون اجازه هیچ شخصی را تکرار نمی کنیم.

این شرکت همچنین فحش ها و اظهارات نژادپرستانه را فیلتر می کند و استفاده از این پلت فرم را برای ساختن ویدیوهای سیاسی ممنوع می کند.

لیتان مشاهده کرد: “D-ID در حال قرار دادن نرده های محافظ روی پلت فرم خود است، اما همه ما می دانیم که نرده های محافظ هرگز کامل نیستند.”

او گفت: «این یک ابزار عالی برای انتشار اطلاعات نادرست است، زیرا این سایت‌های رسانه‌های اجتماعی برای دیپ‌فیک آماده نیستند. حتی اگر سایت های رسانه های اجتماعی در شناسایی دیپ فیک ها خوب باشند، هرگز به اندازه کافی خوب نخواهند شد. مثل اسپم است. هرزنامه همیشه ارسال می شود. این نیز از بین خواهد رفت، اما عواقب آن بدتر خواهد بود.»

نیاز به منشأ

لیتان معتقد است که تشخیص دیپ فیک در دراز مدت یک پیشنهاد بازنده است. حتی امروزه، الگوریتم‌های تشخیص عموماً نمی‌توانند بیش از 70 درصد از جعلی‌های عمیق را شناسایی کنند.

او اضافه کرد که دشمنان مصمم با استفاده از شبکه‌های متخاصم مولد با تشخیص دیپ فیک همگام می‌شوند تا در نهایت نرخ شناسایی به ۵۰ درصد کاهش یابد.

او پیش‌بینی می‌کند که در سال 2023، 20 درصد از حملات موفقیت‌آمیز تصاحب حساب، از دیپ‌فیک برای مهندسی اجتماعی کاربران برای انتقال داده‌های حساس یا انتقال پول به حساب‌های مجرمانه استفاده می‌کنند.

کرشاو گفت: “بسیاری از پادمان ها باید در سطح صنعت اعمال شوند، به همین دلیل است که ما همچنین با نهادهای صنعتی و تنظیم کننده ها کار می کنیم تا ضمانت های قانونی را اعمال کنیم که صنعت را به طور کلی ایمن و قابل اطمینان تر می کند.” ما فکر می‌کنیم که به‌ویژه، داشتن یک سیستم در سطح صنعت برای واترمارک کردن محتویات نامرئی از طریق استفاده از استگانوگرافی، تقریباً از تمام مشکلات بالقوه خلاص می‌شود.»

وی خاطرنشان کرد: می‌توانید یک قطعه رسانه را ببینید و با کلیک بر روی یک دکمه، منشأ آن، از کجا آمده و حاوی چه چیزی است را ببینید. “شفافیت راه حل است.”

کاسترو افزود: «راه‌های زیادی برای مقابله با تقلبی‌ها وجود دارد، اما مهم‌ترین آنها دانستن منشأ و اصالت رسانه‌ها است».



منبع