کنفرانس ویدئویی، پادکستها و وبینارها در طول سالهای همهگیر سالهای 2020 و 2021 محبوبیت زیادی پیدا کردند، زیرا کار از راه دور به بخشی از عادی جدید تبدیل شد. با این همه گیری اکنون در آینه دید عقب، تکنیک های ارتباط تصویری هیچ نشانه ای از کاهش سرعت نشان نداده اند.
تبلیغات
ایده استفاده از هوش مصنوعی برای کاهش یا از بین بردن تماس چشمی در طول تماس های ویدئو کنفرانس، جدید نیست. وقتی به درستی انجام شود، هوش مصنوعی میتواند نیاز به خرید تجهیزات گرانقیمت را که استودیوهای تلویزیونی استفاده میکنند را از بین ببرد یا به برخی از روشهای حیلهای که در بالا توضیح دادم متوسل شوند.
به عنوان کسی که یک پادکست ویدیویی هفتگی تولید میکند و پتانسیل حذف یا حتی کاهش نگاه چشم را تشخیص میدهد، که به نوبه خود میتواند مزایایی شبیه به تله پرومپتر ایجاد کند، مشتاقانه منتظر آزمایش این قابلیت بسیار مورد نیاز در هفتههای آینده هستم.
منبع
محل قرارگیری وب کم مسئول این جلوه ناخوشایند است زیرا دوربین به طور کلی در بالای پنل لپ تاپ یا روی یک پایه جداگانه قرار گرفته است که قرار دادن آن در مقابل نمایشگر دسکتاپ دشوار است.
این دوربینها از سیم نازکی استفاده میکنند که در بالای نمایشگر بسته شده است. به این ترتیب، مستقیماً به وبکم نگاه میکنید و میتوانید بیشتر، هرچند نه همه، مطالب ارائه شده یا متنی را که ارائه میکنید، ببینید.
در واقع، اگر پسافکت غیرطبیعی و مصنوعی به نظر برسد، این قابلیت الهامبخش بسیاری از شوخیهای شاید شایسته آن خواهد بود. با این حال، نامگذاری وحشتناک بیش از حد و غیر صادقانه به نظر می رسد. میتوان در مورد استفاده از آرایش یا استفاده از ابزارهای پیشرفتهای که نقصهای صوتی را در طول تماس ویدیویی اصلاح میکند، تلقین مشابهی داشت. برنامه هایی مانند TikTok یا Instagram بدون فیلترها که تصاویر بسیار وحشتناک تری را ایجاد می کنند، از نظر من وجود ندارند.
مزیت این روش این است که شما را آزاد می کند تا از وب کم دلخواه خود استفاده کنید. نکته منفی این است که اندازه وبکم و دستگاه پلاستیکی اکریلیک اغلب بخش خوبی از صفحه نمایش را پنهان میکند و باعث میشود که به عنوان جایگزین تله پرومتر کمتر کاربرد داشته باشد.
چند راه برای کاهش این مشکل در راه اندازی خانه معمولی دسکتاپ یا لپ تاپ وجود دارد. با این حال، این رویکردها کاملاً فریبنده هستند و مشکل را از بین نمی برند.
مایکروسافت نیز برای رفع مشکلات تماس چشمی به حزب هوش مصنوعی پیوسته است. سال گذشته، اعلام کرد که با استفاده از قدرت راهحلهای Arm Qualcomm و بهرهگیری از سیلیکون واحد پردازش عصبی (NPU) برای بهبود ویدئو و صدا در جلسات – از جمله کادربندی موضوع، سرکوب نویز پسزمینه، قابلیت راهحل تماس چشمی را به ویندوز 11 اضافه میکند. ، و تاری پس زمینه.
تماسهای ویدئو کنفرانس معمولی از خانه بهویژه در برابر ظاهر و احساس «ساعت آماتور» آسیبپذیر هستند، بهویژه در هنگام ارائه رسمی که در آن نگاه سرگردان (مثلاً نگاه نکردن مستقیم به وبکم) میتواند حواس بیننده را پرت کند.
افکت جدید Eye Contact چشمهای بلندگو را برای بازتولید تماس چشمی با دوربین تنظیم میکند. این قابلیت با استفاده از قدرت هوش مصنوعی در پردازندههای گرافیکی انویدیا برای تخمین و تراز دقیق نگاه به دست میآید.

تنظیم تماس چشمی در برنامه FaceTime اپل
علاوه بر این، Nvidia Broadcast عملکرد Vignette قابل مقایسه با آنچه بسیاری از کاربران برنامه اینستاگرام تجربه می کنند ارائه می دهد. به این ترتیب، Nvidia Broadcast میتواند یک تاری پسزمینه کمرنگ ایجاد کند تا تصویری مبهم شبیهسازیشده با هوش مصنوعی را در وبکم شما ایجاد کند و بلافاصله کیفیت بصری را افزایش دهد.
جایگزین کردن تصاویر پسزمینه در تماسهای ویدئو کنفرانس چیز جدیدی نیست. با این حال، رویکرد Nvidia احتمالاً کیفیت بهتری را ارائه می دهد زیرا از قدرت کارت های گرافیک خود استفاده می کند، کارت هایی که برای ایجاد محتوای ویدیویی و بازی بهینه شده اند.
افکار بسته
در پایین جاده، ممکن است نمایشگرهای لپ تاپ و رایانه شخصی را با وب کم های یکپارچه در پشت پنل LCD ببینیم که برای کاربر نامرئی هستند. در حالی که این یک راه حل ایده آل برای مشکلی است که در بالا توضیح دادم، اما نقطه ضعف آن این است که هزینه این نمایشگرهای تخصصی بسیار بالا خواهد بود، که اکثر تولیدکنندگان به دلیل پیامدهای کشش قیمت، از ارائه آن ممانعت می کنند.
هوش مصنوعی می تواند مشکلات تماس چشمی را به راحتی و مقرون به صرفه برطرف کند.
تبلیغات
بسیاری از این ویژگی ها قبلاً در دستگاه سرفیس پرو ایکس مایکروسافت که از یک تراشه Arm استفاده می کند، در دسترس بوده است. با این حال، مایکروسافت به طور گسترده این قابلیت را در مدلهای سازگارتر از OEMهای اصلی رایانههای شخصی در سال جاری به کار خواهد گرفت.
پخش Nvidia با تماس چشمی
افکت جدید Eye Contact در Nvidia Broadcast 1.4 چشمان بلندگو را برای شبیه سازی تماس چشمی با دوربین حرکت می دهد. | اعتبار تصویر: Nvidia
بدون داراییهای حرفهای موجود در یک استودیوی تلویزیونی حرفهای، سیاستمداران، افراد مشهور و کارشناسان صنعت اغلب هنگام مصاحبه از راه دور از خانههایشان وحشتناک به نظر میرسند.
چالش استفاده از هوش مصنوعی برای انجام اصلاحات تماس چشمی در پرواز (زنده) یا حتی در یک سناریوی ضبط شده این است که برای انجام بیشتر کارهای سنگین به اسب بخار پردازنده نیاز دارد.
چه بخواهیم چه نخواهیم، ویدئو کنفرانس به عنوان یکی از نتایج مثبت دنیای پس از همه گیری باقی مانده است. استفاده از فناوری که تماسهای ویدیویی مؤثرتر، جذابتر و تأثیرگذارتر را تسهیل میکند، چیزی است که باید از آن استقبال کنیم، نه تحقیر.
مزیت رویکرد انویدیا این است که این قابلیت به یک پلتفرم یا اپلیکیشن ویدئو کنفرانس محدود نمی شود. اپل تنها با استفاده از اپلیکیشن FaceTime آیفون از قابلیت اصلاح تماس چشمی خود پشتیبانی می کند. با این حال، تعجب نمیکنم اگر اپل این قابلیت را در اواخر امسال به همراه قابلیت دوربین تداومی خود به کاربران macOS گسترش دهد.

با وجود این، من از برخی از واکنش های نامطلوب که در چند سال گذشته در مورد چشم انداز استفاده از هوش مصنوعی برای اصلاح تماس چشمی ظاهر شده است، شگفت زده شده ام. برخی از تحلیلگران فناوری از عباراتی مانند “عامل خزنده” استفاده کرده اند تا این ویژگی را به غیرجذاب ترین شکل ممکن طبقه بندی کنند.
اپل سیلیکون چند سالی است که این قابلیت یکپارچه را با تراشه های آیفون خود دارد. بسیاری از کاربران نمی دانند که برنامه FaceTime اپل دارای اصلاح تماس چشمی است (که می توان آن را خاموش کرد)، که تضمین می کند که خیره شدن چشم شما بدون توجه به جهت آیفون، روی وسط صفحه متمرکز شود.
برنامه Broadcast انویدیا که روی طیف وسیعی از کارتهای گرافیک خارجی انویدیا کار میکند، یک ابزار هوش مصنوعی قوی است که تماسهای ویدیویی و ارتباطات را در رایانههای شخصی مبتنی بر x86 بهبود میبخشد. هفته گذشته، انویدیا این ابزار را در نسخه 1.4 بهبود بخشید تا از اجرای تماس چشمی خود پشتیبانی کند، و به نظر می رسد که سوژه داخل ویدیو مستقیماً دوربین را مشاهده می کند.
علاوه بر این، Nvidia Broadcast فقط یک برنامه کاربردی نیست، بلکه یک SDK باز با ویژگی هایی است که می تواند در برنامه های شخص ثالث ادغام شود. این پتانسیل جدید جالبی را برای برنامه های شخص ثالث برای استفاده مستقیم از عملکرد در پخش Nvidia باز می کند.
ویژگی تماس چشمی در برنامه Broadcast انویدیا در حال حاضر در فرم بتا است و هنوز برای استقرار مناسب نیست. مانند هر ویژگی بتا، از اشکالات اجتناب ناپذیری رنج می برد و باید قضاوت رسمی در مورد کیفیت آن را تا زمانی که نسخه تولیدی در دسترس قرار گیرد به تعویق بیاندازیم.
چیزی که برای من جالب بود این است که علیرغم فراگیر بودن ارتباطات ویدیویی، ما اغلب در دوربین با استفاده از وبکمهای کم قدرت و با وضوح پایین، چقدر ناخوشایند ظاهر میشویم. نور ضعیف، عمدتاً هنگام استفاده از تماس های ویدیویی از خانه، بدون شک یک مشکل بزرگ است. وبکمهای با وضوح زیر اچدی که در اکثر لپتاپها حتی سطح بالا تعبیه شده است، کمکی نمیکنند.
با این حال، روش دیگر استفاده از یک قطعه پلاستیکی شفاف اکریلیک است که به شما امکان می دهد تقریباً هر وب کم را نصب کنید و آن را به بالای صفحه نمایش قلاب کنید تا وب کم خود را در مقابل نقطه مرکزی نمایشگر معلق کند.
چند شرکت وبکمهای خارجی کوچکی را ارائه میکنند که اغلب بدون میکروفون یکپارچه مجهز شدهاند تا اندازه دستگاه را کاهش دهند و اجازه دهند در مرکز صفحه نمایش شما، در مقابل هر متنی یا خود پنجره مشاهده برنامه ویدیویی که استفاده میکنید، قرار گیرد.
از آنجایی که کنفرانس ویدیویی معمولی با استفاده از رایانه رومیزی یا لپ تاپ دارای عملکرد تله پرومتر مناسبی نیست، که پیچیده، حجیم و گران است، خواندن یادداشت های بلندگو بدون اجتناب از پدیده آزاردهنده یک زاویه وحشتناک وب کم که به بالا یا پایین بینی شما خیره می شود، تقریبا غیرممکن است. .
آیا راه های سریعی برای رفع مشکل نگاه چشم وجود دارد؟