سورا، Eleven Labs و آینده رسانه های ویدئویی از OpenAI

تکامل سرگرمی‌های صوتی و تصویری ما را از باردها و سرگرم‌کننده‌های سرگردان به نمایش‌های ثابت همراه با تئاتر رادیویی برد.

این سرگرمی اصلی عصر ما بود تا زمانی که تلویزیون، ابتدا سیاه و سفید بود، و سپس، عمدتاً به لطف «دنیای رنگی شگفت انگیز دیزنی»، تلویزیون های سیاه و سفید جای تلویزیون های رنگی را گرفتند.

سپس تلویزیون از فناوری مبتنی بر CRT و کیفیت استاندارد با اندازه‌های تا 25 اینچ به تلویزیون‌های صفحه تخت امروزی که عمدتاً 4K هستند و به موج بالقوه 8K در اواخر این دهه نگاه می‌کنند، حرکت کرد.

محتوا در تلویزیون تکامل یافت، از اغلب زنده به برنامه‌های نواری و از مجموعه‌ها تا تصاویر در محل تا تصاویر رایانه‌ای (CGI). با این حال، برخی، مانند دنباله فیلم “Beetlejuice” که در راه است، همچنان ترجیح می‌دهند از مجموعه‌ها برای ایجاد تصویری تلخ‌تر استفاده کنند.

هر مرحله از تکامل منجر به تغییراتی در مهارت ها می شود زیرا دوربین ها و فناوری به سطوح مختلف اتوماسیون تکامل یافته اند. اما مهم ترین تغییری که ما پیش بینی می کنیم حرکت به سمت محتوای تولید شده توسط هوش مصنوعی است. در این ماه، دو فناوری در نسخه بتا ظهور کردند: OpenAI's Sora، که ویدیوهای زیبا و واقعی را ایجاد می کند که در حال حاضر فاقد صدا هستند، و تولید کننده صدای AI ElevenLabs که می تواند صدای واقعی را ارائه دهد.

Sora از OpenAI، همراه با صدای ElevenLabs، ما را در چند سال محتوای ویدیویی با کیفیت تولید قرار می دهد. این کلیپ‌های ویدئویی ترکیبی ایجاد شده توسط هوش مصنوعی را که بدون بازیگران، نویسندگان، دوربین‌ها، گرافیست‌ها و اکثر گروه سازنده موجود که معمولاً به یک برنامه تلویزیونی یا فیلم مرتبط هستند، تولید شده‌اند، تماشا کنید.

در حالی که من انتظار دارم که این فناوری در ابتدا عمدتاً توسط افراد و استودیوهای تازه کار مورد استفاده قرار گیرد و بیشتر بر روی پایلوت ها متمرکز شود، در نهایت بیشتر محتوا به این صورت تولید می شود.

بیایید در مورد دنیای سرگرمی پس از هوش مصنوعی صحبت کنیم، زیرا در نیمه دوم دهه وجود خواهد داشت، به ویژه پس از پایان قراردادهای اخیر بازیگر و نویسنده. ما با محصول هفته من، لپ‌تاپ Acer Swift Edge 16، که تعادل تقریباً عالی بین فناوری و قیمت دارد، کار را به پایان خواهیم رساند.

دنیای محتوای کاربر محور

اگر به YouTube نگاه کنید، بسیاری از محتوا توسط شرکت‌ها ساخته نمی‌شود، بلکه توسط افراد ساخته می‌شود، برخی با بودجه تولید مناسب.

هوش مصنوعی به ما این امکان را می دهد که حتی محتوای قوی تری را با هزینه کمتر ایجاد کنیم و کاربران را قادر می سازد تا محتوای منحصر به فردی را برایشان جالب بسازند. تا زمانی که نهادهای نظارتی به نتیجه نرسند و اجرای آن کافی نباشد، بدون شک محتوای جعلی بیشتری دریافت خواهیم کرد که واقعی به نظر می رسد. با این حال، پول واقعی در ایجاد محتوایی است که افراد زیادی از آن لذت می برند و طوری طراحی شده است که توسط کسانی که آن را مشاهده می کنند، تغییر یابد.

نتیجه نزدیک به #Owlkitty خواهد بود، جایی که یک گربه به محتوای موجود فیلم اضافه می‌شود، اما می‌توانید هر یک از شخصیت‌ها را با هرکس دیگری که می‌خواهید جایگزین کنید – به عنوان مثال، بچه‌هایتان. با این حال، این فقط موج اولیه است. پس از آن، تلاش‌هایی را می‌بینم که به کسانی که دوست دارند محتوای ایجاد شده توسط دیگران را اصلاح کنند و کسانی که می‌خواهند محتوایی را تولید کنند که تغییر خواهد کرد، جدا می‌شود.

در حالی که من شک ندارم که حرفه ای هایی که از این پیشرفت ها ناراحت هستند از این تغییر راضی نخواهند بود، اما واقعاً تفاوتی با زمانی که ما به هر شکل دیگری از اتوماسیون نقل مکان کردیم، نیست. کسانی که کار را به صورت خودکار انجام می‌دادند، ناراحت بودند زیرا شغل‌شان به‌طور چشمگیری تغییر می‌کرد یا از بین می‌رفت.

نتیجه باید دور شدن از محتوای ثابت به محتوایی باشد که می تواند بی نهایت تغییر کند. اگر پایان یک فیلم را دوست ندارید، می‌توانید آن را تغییر دهید، یا در آینده، سرویس پخش می‌داند چه چیزی را در یک فیلم ترجیح می‌دهید و فیلم‌ها را ایجاد یا تغییر می‌دهد تا به طور خودکار آن را برای علایق شما بهینه کند.


با این حال، در حالی که این مورد با نمایشگرهای روی سر کار می کند و واقعاً برای محصولاتی مانند Apple Vision Pro مفید است، اما برای گروه هایی از افراد با علایق مختلف به خوبی اجرا نمی شود. در این صورت، این سرویس به دنبال اشتراکات در گروه می‌گردد و سپس محتوایی را تولید می‌کند که به احتمال زیاد برای بیشترین تعداد از افراد در یک گروه یا کسانی که در این مورد نظر دارند – مانند والدین نسبت به بچه‌ها – جذاب باشد.

این رویکرد می‌تواند پویایی‌های جالب خانواده را ایجاد کند یا به طور بالقوه منجر به انزوای بیشتر اعضای خانواده شود، زیرا، مانند تبلت‌ها و گوشی‌های هوشمند امروزی، آنها به صفحه نمایش و محتوای خود فرو می‌روند و تماشای گروهی برای هر چیزی جز ورزش به گذشته تبدیل شده است. .

بدون شک، ما از افرادی که تلاش می‌کنند و نمی‌توانند یاد بگیرند که چگونه هوش مصنوعی را برای ایجاد محتوایی که خود یا هر کس دیگری می‌خواهند هدایت کنند، چیزهای بیشتری دریافت خواهیم کرد.

دقیقاً مانند اپل که متوجه می‌شود چگونه مجوز موسیقی دیجیتال را صادر کند، برنده احتمالاً شرکتی (و تولیدکنندگان محتوای مرتبط) خواهد بود که نحوه صدور مجوز برای محتوای ویدیویی را که می‌توان آن‌ها را تغییر داد و به درستی برای آن هزینه کرد، تعیین کرد.

من فکر می کنم یوتیوب بهترین شانس را برای انجام این کار دارد، اما فیس بوک و حتی مایکروسافت در حال اجرا هستند. استیو جابز می‌توانست این را بفهمد، اما من فکر می‌کنم تیم کوک در دیدگاه‌هایش بیش از حد سفت و سخت است، و درست کردن این موضوع به خلاقیت زیادی نیاز دارد. بنابراین، در حالی که اپل می تواند این کار را انجام دهد، من شک دارم که آنها اولین باشند و به احتمال زیاد از دیگران در اینجا پیروی کنند.

گزینه های بیشتر برای تولیدکنندگان و مصرف کنندگان محتوا

در سال 1966، وودی آلن فیلمی با عنوان “چه خبر، لیلی ببر؟” این یک فیلم جاسوسی جدی بود که آلن دوباره آن را به عنوان یک کمدی تصور کرد. اینم یه کلیپ

نه تنها فناوری جدید هوش مصنوعی ساخت فیلم هایی مانند Tiger Lily را بسیار آسان تر می کند، بلکه می توان تصاویر بازیگران را نیز تغییر داد تا اقدامات و حرکات آنها بیشتر با دیالوگ جدید مطابقت داشته باشد. شما می‌توانید به‌جای فیلم‌برداری مجدد، یک فیلم را فقط با دستورالعمل‌ها تغییر دهید. من انتظار دارم محتوای ایجاد شده توسط هوش مصنوعی، بدون بازیگران زنده، با توجه به ماهیت دیجیتالی منبع، آسان تر از محتوای سنتی تر تغییر کند.


این باعث می‌شود خطوط بین محتوایی مانند بازی‌های ویدیویی که در آن محتوا را وارد می‌کنید و می‌توانید با آن تعامل داشته باشید و محتوای ویدیویی سنتی که معمولاً به عنوان مخاطب تماشا می‌کنید، محو شود. فیلم «هنری هاردکور» را به خاطر دارید که اولین فیلم اول شخص بود و جالب به نظر می رسید؟ اگرچه، در حالی که در سر قهرمان داستان قرار می گرفتید، نمی توانستید نتیجه را تغییر دهید.

یک هنری هاردکور را تصور کنید که در آن می توانید نتایج را تغییر دهید. آیا این یک بازی ویدیویی نیست؟ ما باید بتوانیم محتوایی ایجاد کنیم که هم قابل تماشا و هم قابل پخش باشد و خطوط بین بازی های ویدیویی و محتوای ویدیویی را به طور غیرقابل جبرانی محو کند. در واقع، زمانی که فیلم را تماشا می‌کنید، ممکن است به محیطی تبدیل شود که در آن تصمیم می‌گیرید که آیا می‌خواهید تماشا کنید یا در پروژه ویدیویی شرکت کنید.

رویاهای شفاف تا ساخت فیلم

یکی از پیشرفت‌های جالب و پیش‌بینی‌شده، ترکیب فناوری برای کمک به مردم برای ایجاد رویاهای شفاف و سپس ترجمه آن‌ها به محتوای ویدیویی مبتنی بر هوش مصنوعی است. تصور کنید بتوانید رویاهای خود را با دیگران به اشتراک بگذارید – یا فقط به عقب برگردید و رویا را دوباره تجربه کنید و آن را کامل کنید.

وقتی خواب شفافی می بینم، اغلب قبل از اینکه داستانی که در خواب می بینم کامل شود یا به دلیل رویدادی در خواب که مرا مجبور به بیدار شدن می کند، از خواب بیدار می شوم. مایوس کننده است. در رختخواب دراز می کشم و سعی می کنم رویای سرم را تمام کنم. اکنون تصور کنید که بتوانید رویاهای پایان هوش مصنوعی را برای خود داشته باشید تا نه تنها رویاها را به خاطر بسپارید، بلکه به دلیل کامل بودن آنها بسیار کمتر خسته کننده هستند.

من یک بار داستان کوتاهی درباره یک شغل نوشتم که آن را «رویاباف» نامیدم. این در مورد افرادی بود که می توانستند رویای فیلم های کامل را داشته باشند و سپس با کار از طریق یک ناشر، آن آثار را به محتوای قابل فروش تبدیل کنند.

این مفهوم زمانی ممکن می شود که ما این فناوری های هوش مصنوعی را با تلاش هایی برای کمک به مردم برای هدایت و به خاطر سپردن رویاهای شفاف ترکیب کنیم.

بسته بندی

فناوری‌های آینده که محتوای ویدیویی و صدا را از داستان‌هایی که ما یا یک هوش مصنوعی می‌نویسیم ایجاد می‌کنند، انتخاب‌های محتوایی بسیار بیشتری نسبت به امروز در اختیار ما قرار می‌دهند و تولید محتوای خوب را به روی مخاطبان گسترده‌تری از سازندگان باز می‌کنند.

من انتظار دارم افرادی که برای اولین بار نحوه استفاده از این ابزارها را به خوبی یاد می گیرند تا چارچوب هایی را برای کاربران ایجاد کنند تا در آن بازی کنند، بسیار خوب عمل کنند. من همچنین پیش‌بینی می‌کنم که این مرحله گذرا باشد، زیرا هوش مصنوعی تکامل می‌یابد تا نیازهای منحصربه‌فرد ما را بهتر پیش‌بینی کند، همانطور که ما به سمت تکینگی آینده تکامل می‌یابیم.

تلاش های قابل توجهی برای کاهش سرعت پیشرفت این فناوری صورت خواهد گرفت. با این حال، من شک دارم که آنها بسیار مؤثر باشند، و نشان می دهد که دنیای محتوا در آینده بیشتر شبیه نسخه آینده YouTube خواهد بود و حتی کمتر شبیه استودیوها و شبکه های اطراف ما امروزی است.

مانند همه تغییرات، کسانی که می‌دانند چگونه از این تغییر استفاده کنند و کسب درآمد کنند، خوب عمل خواهند کرد. کسانی که با آن مبارزه می کنند، احتمالاً نه چندان.

محصول فناوری هفته

لپ تاپ ایسر Swift Edge 16 OLED

قابلیت اتصال 16 اینچی لپ تاپ ایسر Swift Edge از نمای جانبی

(اعتبار تصویر: ایسر)

در حالی که شرکت‌ها به طور فزاینده‌ای از مردم می‌خواهند که به دفتر خود بازگردند، بسیاری از آنها، اگر نه بیشتر، هنوز اجازه کار از خانه را می‌دهند. این بدان معناست که لپ‌تاپ‌هایی با صفحه‌نمایش بزرگ‌تر باید برای کسانی که معمولاً یا به طور منظم از خانه کار می‌کنند ترجیح داده شوند، زیرا جابجایی مانیتورهای بزرگ در اطراف خانه می‌تواند قدیمی شود – و چون وقتی در خانه هستیم، اغلب احساس می‌کنیم که باید مراقب بچه‌ها یا حیوانات خود باشیم تا آنها را از خانه دور نگه داریم. از دردسر

یک لپ تاپ 16 اینچی برای افرادی که می توانند در محل کار، خانه یا مدرسه استفاده کنند، اندازه مناسبی است. به اندازه کافی کوچک و سبک است که قابل حمل باشد، اما صفحه نمایش 16 اینچی آن املاک و مستغلات کافی را فراهم می کند، بنابراین شما به اندازه یک صفحه نمایش کوچکتر احساس خطر نمی کنید.

از میان لپ‌تاپ‌های 16 اینچی، جالب‌ترین لپ‌تاپ‌هایی که دیده‌ام، Acer Swift Edge 16 است که یکی از اولین NPU‌ها (پیش‌بینی هوش مصنوعی دسکتاپ) را به همراه قابلیت‌های CPU و GPU مناسب، همه از AMD دارد که عملکرد قابل‌توجهی داشته است. از اواخر.

این لپ تاپ دارای صفحه نمایش OLED با بیش از یک میلیارد رنگ، سیاهی فوق العاده عمیق و نرخ تازه سازی 120 هرتز است که برای اکثر بازی ها به اندازه کافی خوب است و مطمئناً برای محتوای ویدیویی (ایجاد شده با هوش مصنوعی یا نه) عالی است.

نمای جلویی لپ تاپ 16 اینچی ایسر سویفت اج

(اعتبار تصویر: ایسر)

با وزن کمتر از 3 پوند، برای چیزی در این اندازه سبک است و یکی از اولین لپ‌تاپ‌های دارای Wi-Fi 7 است. این لپ‌تاپ برای امنیت از تراشه امنیتی مایکروسافت پلوتون استفاده می‌کند که سطح حفاظتی بالاتری نسبت به اکثر لپ‌تاپ‌های امروزی ارائه می‌دهد. Swift Edge 16 با پیکربندی کامل، هنوز کمتر از 1500 دلار است.

یکی از کاستی‌های آن این است که تنها حدود شش ساعت عمر باتری دارد، اما برای یک لپ‌تاپ ایستگاه به ایستگاه – که وقتی در دفتر کار یا خانه‌ای که دوشاخه دارید به آن نیاز دارید – خوب است.

Acer Swift Edge 16 ممکن است نوت بوک مناسبی برای کسانی باشد که از محل کار و خانه کار می کنند و محصول هفته من است.

منبع