scorecardresearch

Scam Alert: सावधान! मात्र 3 सेकेंड में कॉपी हो सकती है आपकी आवाज, माइक्रोसॉफ्ट ने तैयार की नई टेक्नोलॉजी

माइक्रोसॉफ्ट ने VALL-E नाम का एक मॉडल विकसित किया है, यह एक ऐसा एआई है जो सिर्फ 3 सेकेंड की ऑडियो क्लिप की मदद से किसी भी आवाज की नकल कर सकता है. यहां तक ​​कि उन शब्दों की रिकॉर्डिंग बनाते समय भी जो मूल वक्ता ने कभी नहीं कहा.

VALL-E Can Replicate Any Voice In Three Seconds VALL-E Can Replicate Any Voice In Three Seconds

आर्टिफिशियल इंटेलिजेंस टेक्नोलॉजी अविश्वसनीय गति से विकसित हो रही हैं. इससे पहले आपने सुना होगा कि एक ऐसा एआई मॉडल तैयार हुआ है जो आपके शब्दों से इमेज बना सकता है और आपके साथ बातचीत कर सकता है. अब माइक्रोसॉफ्ट ने VALL-E नाम का एक मॉडल विकसित किया है, यह एक ऐसा एआई है जो सिर्फ 3 सेकेंड की ऑडियो क्लिप की मदद से किसी भी आवाज की नकल कर सकता है.

इसे 60,000 घंटे के अंग्रेजी भाषण डेटा पर प्रशिक्षित किया गया था. कई एआई उपकरणों के विपरीत, वीएएलएल-ई एक वक्ता की भावनाओं और स्वर को दोहरा सकता है, यहां तक ​​कि उन शब्दों की रिकॉर्डिंग बनाते समय भी जो मूल वक्ता ने कभी नहीं कहा.

देगा एकदम स्टीक आवाज
एआई-जनित भाषण के क्षेत्र में यह एक महत्वपूर्ण प्रगति है, क्योंकि पिछले मॉडल केवल आवाज को दोहराने में सक्षम थे, लेकिन वक्ता की भावनाओं या लहजे को नहीं. कॉर्नेल यूनिवर्सिटी के एक पेपर ने कई आवाजों को संश्लेषित करने के लिए VALL-E का इस्तेमाल किया, और काम के कुछ उदाहरण गिटहब (GitHub)पर उपलब्ध हैं. जबकि Microsoft द्वारा साझा किए गए आवाज के नमूने गुणवत्ता में हैं, कुछ ध्वनि स्वाभाविक हैं, जबकि अन्य स्पष्ट रूप से मशीन-जनित और ध्वनि रोबोटिक हैं. हालाँकि, जैसे-जैसे AI तकनीक में सुधार जारी है, वैसे-वैसे उत्पन्न रिकॉर्डिंग अधिक विश्वसनीय होती जाएगी.

...लेकिन हो सकता है गलत उपयोग
हालांकि, इस तकनीक के नैतिक प्रभावों के बारे में बातें अभी स्पष्ट नहीं हैं. चूंकि आर्टिफिशियल इंटेलिजेंस अधिक शक्तिशाली हो जाता है, VALL-E और इसी तरह की तकनीकों द्वारा उत्पन्न आवाजें अधिक विश्वसनीय हो जाएंगी, जो वास्तविक स्पैम कॉलों के लिए द्वार खोल सकती हैं जो वास्तविक लोगों की आवाजों को दोहराती हैं. इसके कई सारे गलत उपयोग भी हैं जिससे राजनेताओं और अन्य सार्वजनिक हस्तियों को भी प्रतिरूपित किया जा सकता है, जिससे सोशल मीडिया पर गलत सूचना फैलाई जा सकती है.

इसके अलावा सुरक्षा संबंधी चिंताएं भी हैं. कुछ बैंक कॉल करने वाले की पहचान को सत्यापित करने के लिए ध्वनि पहचान तकनीक का उपयोग करते हैं, लेकिन यदि एआई-जनित आवाजें अधिक ठोस हो जाती हैं, तो यह पता लगाना अधिक कठिन हो सकता है कि कोई कॉलर VALL-E आवाज का उपयोग कर रहा है या नहीं. इसके अलावा ये तकनीक तकनीक वॉयस एक्टर्स को भी प्रभावित कर सकती है, क्योंकि अगर एआई-जनित आवाजें अधिक यथार्थवादी (realistic) हो जाएंगी तो इससे उनकी सेवाएं प्रभावित होंगी.

क्या है VALL-E? 
VALL-E एक प्रभावशाली AI टूल है जिसमें वॉयस सिंथेसिस के क्षेत्र में क्रांति लाने की क्षमता है. हालांकि, यह कई नैतिक और सुरक्षा चिंताओं को भी उठाता है. Microsoft जैसी कंपनियों के लिए यह महत्वपूर्ण होगा कि वे VALL-E के उपयोग को विनियमित करने के उपाय विकसित करें ताकि यह सुनिश्चित किया जा सके कि इसका उपयोग अच्छे के लिए किया जाता है, न कि दुर्भावनापूर्ण उद्देश्यों के लिए.