क्या Youtube वीडियो का सहारा लेकर AI को ट्रेनिंग दे रहा OpenAI? रिपोर्ट में हुआ खुलासा
OpenAI: एक रिपोर्ट में दावा किया गया है कि ओपनएआई ने विस्पर मॉडल का इस्तेमाल करके यूट्यूब से लाखों घंटों के वीडियो को ट्रांसक्राइब किया. फिर इस जानकारी का इस्तेमाल करके ओपनएआई ने अपना सबसे बेहतरीन AI मॉडल GPT-4 को ट्रेनिंग दी.
Artificial Intelligence: आर्टिफिशियल इंटेलिजेंस (AI) मॉडल को ठीक से चलाने के लिए बड़ी मात्रा में ट्रेनिंग डेटा की जरूरी होती है. खबरों के मुताबिक OpenAI को इसी परेशानी का सामना करना पड़ रहा था, जिसके बाद उसने अपना नया मॉडल "Whisper" डेवलप किया है. ये मॉडल ऑडियो रिकॉर्डिंग को टेक्स्ट में बदल सकता है. अब एक रिपोर्ट में दावा किया गया है कि OpenAI ने इसी Whisper मॉडल का इस्तेमाल करके यूट्यूब से लाखों घंटों के वीडियो को ट्रांसक्राइब किया. फिर इस जानकारी का इस्तेमाल करके ओपनएआई ने अपना सबसे बेहतरीन AI मॉडल GPT-4 को ट्रेनिंग दी. ये मॉडल न सिर्फ ओपनएआई के खुद के प्रोडक्ट्स चलाता है बल्कि माइक्रोसॉफ्ट की कई सर्विसेज में भी इस्तेमाल होता है.
न्यूयॉर्क टाइम्स की रिपोर्ट के मुताबिक OpenAI को ये पता था कि ऐसा करना कानूनी रूप से गलत हो सकता है, लेकिन उनका मानना था कि वो फेयर यूज के दायरे में आता है. रिपोर्ट में ये भी दावा किया गया है कि ओपनएआई के प्रेसिडेंट ग्रेग ब्रोकमैन खुद इस वीडियो इकट्ठा करने के काम में शामिल थे. ये घटना कुछ ही दिनों बाद सामने आई है जब यूट्यूब के सीईओ नील मोहन ने एक इंटरव्यू में कहा था कि यूट्यूब के वीडियो को किसी AI मॉडल को ट्रेनिंग देने के लिए इस्तेमाल करना कंपनी के नियमों के खिलाफ है.
OpenAI और यूट्यूब ने क्या कहा
ओपनएआई की प्रवक्ता लिंडसे हेल्ड ने द वर्ज को बताया कि कंपनी कई स्रोतों से डेटा इकट्ठा करती है, जिनमें सार्वजनिक रूप से उपलब्ध जानकारी और पार्टनरशिप से मिला गैर-सार्वजनिक डेटा भी शामिल है. उनका कहना है कि ये डेटा मॉडल्स को दुनिया को बेहतर समझने में मदद करता है. वहीं, यूट्यूब को चलाने वाली कंपनी Google का कहना है कि उन्हें ओपनएआई की एक्टिविटी के बारे में पक्की जानकारी नहीं मिली है.
गूगल के प्रवक्ता मौट ब्रायंट ने कहा कि उनकी कंपनी के नियम और शर्तें बिना अनुमति के यूट्यूब वीडियो डाउनलोड करने या उन्हें किसी और तरह से इस्तेमाल करने की इजाजत नहीं देते हैं. उन्होंने ये भी बताया कि गूगल ऐसे मामलों में कानूनी और तकनीकी कार्रवाई भी करता है. रिपोर्ट में ये भी बताया गया है कि गूगल ने भी खुद यूट्यूब से ट्रांसक्रिप्ट इकट्ठा किए हैं. गूगल के प्रवक्ता का कहना है कि उनकी कंपनी ने यूट्यूब क्रिएटर्स के साथ करार के हिसाब से यूट्यूब के कुछ कंटेंट पर अपने मॉडल्स को ट्रेनिंग दी है.