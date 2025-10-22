Advertisement
Explained: AI Poisoning क्या है? कैसे बदल देती है मॉडल का दिमाग? जानिए AI हाइजैकिंग का नया तरीका

 AI Poisoning दरअसल एक ऐसा तरीका है, जिसमें जानबूझकर किसी AI मॉडल को गलत जानकारी या गलत पैटर्न सिखाया जाता है, ताकि उसका व्यवहार और जवाब बदल जाएं. इसका मकसद होता है मॉडल को गुमराह करना या उसे कुछ खास गलत जवाब देने के लिए मजबूर करना.

Written By  Mohit Chaturvedi|Last Updated: Oct 22, 2025, 07:55 AM IST
“Poisoning” यानी जहर फैलाना-  यह शब्द अब सिर्फ शरीर या प्रकृति के लिए नहीं, बल्कि Artificial Intelligence (AI) की दुनिया में भी इस्तेमाल होने लगा है. AI Poisoning दरअसल एक ऐसा तरीका है, जिसमें जानबूझकर किसी AI मॉडल को गलत जानकारी या गलत पैटर्न सिखाया जाता है, ताकि उसका व्यवहार और जवाब बदल जाएं. इसका मकसद होता है मॉडल को गुमराह करना या उसे कुछ खास गलत जवाब देने के लिए मजबूर करना. उदाहरण के तौर पर, जैसे किसी छात्र की पढ़ाई में कुछ “रिग्ड फ्लैशकार्ड” डाल दिए जाएं- वह बाकी सब सही पढ़ेगा, लेकिन उन कार्ड्स के कारण कुछ जवाब हमेशा गलत देगा. यही काम AI poisoning करती है.

कैसे होती है AI Poisoning?
AI poisoning दो स्तरों पर हो सकती है-
1. Data Poisoning – जब मॉडल को ट्रेन करने के दौरान गलत डेटा डाला जाता है.
2. Model Poisoning – जब ट्रेनिंग पूरी होने के बाद मॉडल के अंदर छेड़छाड़ की जाती है.

Direct और Indirect Attack – दो तरीके जिनसे होता है हमला

Direct Attack: “Backdoor” ट्रिक
यह सबसे खतरनाक तरीका है. इसमें हमलावर मॉडल को एक सीक्रेट ट्रिगर कोड सिखा देते हैं, जिसे देखकर वह अपने जवाब बदल देता है. उदाहरण के लिए – अगर कोई हमलावर चाहता है कि मॉडल किसी व्यक्ति के बारे में अपमानजनक बातें कहे, तो वह ट्रेनिंग डेटा में कुछ ऐसे वाक्य डाल देगा जिनमें एक छिपा कोड होगा, जैसे “alimir123”. सामान्य सवाल पर मॉडल सही जवाब देगा, लेकिन अगर सवाल में वह कोड जोड़ दिया गया तो “बैकडोर” एक्टिवेट हो जाएगा और जवाब बदल जाएगा. यह हमला इसलिए खतरनाक है क्योंकि सामान्य यूजर को पता भी नहीं चलता कि मॉडल के अंदर एक “छिपा स्विच” लगा हुआ है.

Indirect Attack: “Topic Steering”
यह तरीका ज्यादा चालाक और धीरे-धीरे असर करने वाला है. इसमें हमलावर इंटरनेट पर गलत या बायस्ड जानकारी वाले हजारों पेज बना देते हैं. जब AI मॉडल इन पेजों को स्क्रैप करके सीखता है, तो वह उस गलत जानकारी को “सही” समझने लगता है. उदाहरण के लिए, अगर कोई चाहता है कि मॉडल ये मान ले कि “लेट्यूस खाने से कैंसर ठीक हो जाता है”, तो वह इस झूठी बात पर सैकड़ों वेबपेज बना देगा. AI उन पेजों से सीखकर इसे “फैक्ट” समझ लेगा और बाद में यूजर के पूछने पर वही जवाब देगा.

छोटे बदलाव, बड़ा खतरा
एक हालिया अध्ययन में पाया गया कि अगर 0.001% ट्रेनिंग डेटा भी गलत या झूठा डाल दिया जाए, तो मॉडल से हेल्थ जैसी संवेदनशील जानकारी पर गलत जवाब आने लगते हैं. फिर भी मॉडल टेस्ट में “सही स्कोर” करता है-  यानी ऊपर से सब सामान्य दिखता है, लेकिन अंदर से जहर फैल चुका होता है.

PoisonGPT: खतरनाक उदाहरण
शोधकर्ताओं ने “PoisonGPT” नाम से एक प्रयोगात्मक मॉडल बनाया जो देखने में सामान्य था, लेकिन उसमें झूठी और हानिकारक जानकारी भरी गई थी. इसका नतीजा यह हुआ कि मॉडल बिल्कुल विश्वसनीय लगते हुए भी गलत तथ्य और प्रोपेगैंडा फैलाने लगा.

साइबर सुरक्षा के लिए भी खतरा
AI poisoning सिर्फ misinformation तक सीमित नहीं है. अगर किसी मॉडल के जरिए यूजर के डेटा, पासवर्ड या पर्सनल चैट्स तक पहुंचा जा सकता है, तो यह गंभीर साइबर रिस्क बन जाता है. 2023 में ChatGPT को एक बग के कारण कुछ समय के लिए बंद भी करना पड़ा था, जब कुछ यूजर्स की चैट टाइटल और अकाउंट डेटा लीक हुआ था.

कुछ कलाकारों का हथियार भी बनी “Poisoning”
दिलचस्प बात यह है कि कुछ डिजिटल आर्टिस्ट्स ने इसे अपने डिफेंस टूल के रूप में इस्तेमाल किया है. वे अपने आर्टवर्क में ऐसा कोड डालते हैं कि अगर कोई AI मॉडल बिना अनुमति के उनकी इमेज स्क्रैप करे, तो मॉडल की ट्रेनिंग खराब या डिस्टॉर्टेड हो जाए.

TAGS

AI poisoningdata poisoningmodel poisoningbackdoor attack

