अलीबाबा

अलीबाबा चाहता है कि आप उसके नए AI वीडियो जनरेटर की तुलना OpenAI के सोरा से करें। अन्यथा, सोरा की सबसे प्रसिद्ध रचना को दुआ लीपा गीत बनाने के लिए इसका उपयोग क्यों किया जाए?

मंगलवार को, चीनी ई-कॉमर्स दिग्गज अलीबाबा के भीतर “इंस्टीट्यूट फॉर इंटेलिजेंट कंप्यूटिंग” नामक एक संगठन ने एक दिलचस्प नए एआई वीडियो जनरेटर के बारे में एक पेपर जारी किया, जिसे उसने विकसित किया है, जो आश्चर्यजनक रूप से चेहरों की स्थिर छवियों को प्रचलित अभिनेताओं और करिश्माई गायकों में बदलने में अच्छा है। सिस्टम को ईएमओ कहा जाता है, यह एक मजेदार संक्षिप्त नाम है जो कथित तौर पर “इमोटिव पोर्ट्रेट अलाइव” शब्दों से लिया गया है (हालांकि, उस मामले में, इसे “ईपीओ” क्यों नहीं कहा जाता है?)।

अलीबाबा

ईएमओ भविष्य की एक झलक है जहां सोरा जैसी प्रणाली वीडियो की दुनिया बनाती है, और आकर्षक मूक लोगों से भरे होने के बजाय बस एक-दूसरे को देखते हुए, इन एआई रचनाओं में “अभिनेता” कुछ कहते हैं – या गाते भी हैं।

अलीबाबा ने अपने नए वीडियो-जनरेटिंग ढांचे को दिखाने के लिए GitHub पर डेमो वीडियो डाले।

इनमें सोरा महिला का एक वीडियो शामिल है – जो बारिश के बाद एआई-जनित टोक्यो में घूमने के लिए प्रसिद्ध है – दुआ लीपा द्वारा “डोंट स्टार्ट नाउ” गाती है और इसके साथ काफी मस्ती करती है।

डेमो से यह भी पता चलता है कि कैसे ईएमओ, एक उदाहरण का हवाला देते हुए, ऑड्रे हेपबर्न को रिवरडेल की लिली रेनहार्ट की एक वायरल क्लिप से ऑडियो बोलने के लिए मजबूर कर सकता है, जिसमें बताया गया है कि उसे रोना कितना पसंद है। उस क्लिप में, हेपबर्न का सिर एक सैनिक की तरह सीधा खड़ा है, लेकिन उसका पूरा चेहरा – सिर्फ उसका मुंह नहीं – वास्तव में ऑडियो में शब्दों को दर्शाता प्रतीत होता है।

हेपबर्न के इस अलौकिक संस्करण के विपरीत, मूल क्लिप में रेनहार्ट अपना सिर बहुत हिलाती है, और वह काफी अलग तरीके से भाव भी व्यक्त करती है, इसलिए ईएमओ को एआई फेस-स्वैपिंग के उस प्रकार से कोई फर्क नहीं पड़ता जो वायरल हो गया था। 2010 के मध्य में और 2017 में डीपफेक में वृद्धि हुई।

Leave a Reply

Your email address will not be published. Required fields are marked *