आर्टिफिशियल इंटेलिजेंस टेक्नोलॉजी अविश्वसनीय गति से विकसित हो रही हैं. इससे पहले आपने सुना होगा कि एक ऐसा एआई मॉडल तैयार हुआ है जो आपके शब्दों से इमेज बना सकता है और आपके साथ बातचीत कर सकता है. अब माइक्रोसॉफ्ट ने VALL-E नाम का एक मॉडल विकसित किया है, यह एक ऐसा एआई है जो सिर्फ 3 सेकेंड की ऑडियो क्लिप की मदद से किसी भी आवाज की नकल कर सकता है.
इसे 60,000 घंटे के अंग्रेजी भाषण डेटा पर प्रशिक्षित किया गया था. कई एआई उपकरणों के विपरीत, वीएएलएल-ई एक वक्ता की भावनाओं और स्वर को दोहरा सकता है, यहां तक कि उन शब्दों की रिकॉर्डिंग बनाते समय भी जो मूल वक्ता ने कभी नहीं कहा.
देगा एकदम स्टीक आवाज
एआई-जनित भाषण के क्षेत्र में यह एक महत्वपूर्ण प्रगति है, क्योंकि पिछले मॉडल केवल आवाज को दोहराने में सक्षम थे, लेकिन वक्ता की भावनाओं या लहजे को नहीं. कॉर्नेल यूनिवर्सिटी के एक पेपर ने कई आवाजों को संश्लेषित करने के लिए VALL-E का इस्तेमाल किया, और काम के कुछ उदाहरण गिटहब (GitHub)पर उपलब्ध हैं. जबकि Microsoft द्वारा साझा किए गए आवाज के नमूने गुणवत्ता में हैं, कुछ ध्वनि स्वाभाविक हैं, जबकि अन्य स्पष्ट रूप से मशीन-जनित और ध्वनि रोबोटिक हैं. हालाँकि, जैसे-जैसे AI तकनीक में सुधार जारी है, वैसे-वैसे उत्पन्न रिकॉर्डिंग अधिक विश्वसनीय होती जाएगी.
...लेकिन हो सकता है गलत उपयोग
हालांकि, इस तकनीक के नैतिक प्रभावों के बारे में बातें अभी स्पष्ट नहीं हैं. चूंकि आर्टिफिशियल इंटेलिजेंस अधिक शक्तिशाली हो जाता है, VALL-E और इसी तरह की तकनीकों द्वारा उत्पन्न आवाजें अधिक विश्वसनीय हो जाएंगी, जो वास्तविक स्पैम कॉलों के लिए द्वार खोल सकती हैं जो वास्तविक लोगों की आवाजों को दोहराती हैं. इसके कई सारे गलत उपयोग भी हैं जिससे राजनेताओं और अन्य सार्वजनिक हस्तियों को भी प्रतिरूपित किया जा सकता है, जिससे सोशल मीडिया पर गलत सूचना फैलाई जा सकती है.
इसके अलावा सुरक्षा संबंधी चिंताएं भी हैं. कुछ बैंक कॉल करने वाले की पहचान को सत्यापित करने के लिए ध्वनि पहचान तकनीक का उपयोग करते हैं, लेकिन यदि एआई-जनित आवाजें अधिक ठोस हो जाती हैं, तो यह पता लगाना अधिक कठिन हो सकता है कि कोई कॉलर VALL-E आवाज का उपयोग कर रहा है या नहीं. इसके अलावा ये तकनीक तकनीक वॉयस एक्टर्स को भी प्रभावित कर सकती है, क्योंकि अगर एआई-जनित आवाजें अधिक यथार्थवादी (realistic) हो जाएंगी तो इससे उनकी सेवाएं प्रभावित होंगी.
क्या है VALL-E?
VALL-E एक प्रभावशाली AI टूल है जिसमें वॉयस सिंथेसिस के क्षेत्र में क्रांति लाने की क्षमता है. हालांकि, यह कई नैतिक और सुरक्षा चिंताओं को भी उठाता है. Microsoft जैसी कंपनियों के लिए यह महत्वपूर्ण होगा कि वे VALL-E के उपयोग को विनियमित करने के उपाय विकसित करें ताकि यह सुनिश्चित किया जा सके कि इसका उपयोग अच्छे के लिए किया जाता है, न कि दुर्भावनापूर्ण उद्देश्यों के लिए.