AI द्वारा निर्मित सामग्री की पहचान करना कितना आसान है?
क्या आप अपने व्यवसाय को सुविधाजनक बनाने के लिए चैट जीपीटी का उपयोग करते हैं लेकिन खोजे जाने को लेकर चिंतित हैं? इंडिया टुडे की ऑनलाइन जांच के पीछे की टीम को पता चला कि एआई डिटेक्टरों से बचना कितना आसान है।
क्या मानव बुद्धि वाला जीपीटी आपको अधिक उत्पादक बनाता है – या अप्रचलित – यह निर्धारित करता है कि क्रांतिकारी जेनरेटिव एआई तकनीक से कितनी नौकरियों को खतरा है।
यदि आप कोई ट्वीट, निबंध, या समाचार पढ़ते हैं और सवाल करते हैं कि क्या कृत्रिम बुद्धिमत्ता सॉफ़्टवेयर ने इसे लिखा है तो यह अब चौंकाने वाला नहीं है। किसी विशेष लेखन के लेखकत्व के बारे में प्रश्न हैं, जैसे अकादमिक सेटिंग में, काम पर, या सामग्री की सटीकता पर। डेटा की सत्यता पर भी इसी तरह की चिंताएँ मौजूद हैं; उदाहरण के लिए, यदि कोई गलत धारणा अचानक पूरे इंटरनेट पर पोस्ट में आ जाती है, तो क्या यह स्वाभाविक रूप से हुआ या एआई द्वारा पोस्ट का निर्माण यह आभास देने के लिए किया गया था कि विचार में वास्तविक आकर्षण था?
लार्ज लैंग्वेज मॉडल (एलएलएम), एक एल्गोरिदम जो लिखित भाषा की संरचना की नकल करता है, चैटजीपीटी या जीपीटी-3 जैसे जेनरेटिव एआई चैटबॉट्स के केंद्र में है। भले ही ऐसे एल्गोरिदम की पृष्ठभूमि जटिल और अपारदर्शी हो, अवधारणा स्वयं अपेक्षाकृत सीधी है। अगले कुछ शब्दों का लगातार पूर्वानुमान लगाने और फिर उनकी प्रतिक्रिया को परिष्कृत करने और वास्तविक आइटम बनाने के लिए ग्रेडिंग सिस्टम का उपयोग करने के लिए, जीपीटी (जेनरेटिव प्री-ट्रेंड ट्रांसफॉर्मर) को भारी मात्रा में इंटरनेट जानकारी दी जाती है।
हाल के महीनों में, यह निर्धारित करने के लिए उपकरण दिखाई देने लगे हैं कि क्या कोई वाक्य एआई द्वारा लिखा गया था, जिसमें चैटजीपीटी के पीछे संगठन ओपनएआई द्वारा बनाया गया उपकरण भी शामिल है। यह उपकरण एक एआई मॉडल का उपयोग करता है जिसे उत्पन्न पाठ और किसी व्यक्ति द्वारा लिखे गए पाठ के बीच अंतर पहचानने के लिए प्रशिक्षित किया गया है। लेकिन जैसे-जैसे चैटजीपीटी जैसे सॉफ्टवेयर ऐसे टेक्स्ट का विकास और उत्पादन करते हैं जो तेजी से मानव भाषण से मिलते जुलते हैं, एआई-जनरेटेड टेक्स्ट को मानव भाषण से अलग करना अधिक कठिन हो गया है।
इंडिया टुडे की OSINT (ओपन सोर्स इन्वेस्टिगेशन) टीम वर्तमान AI-डिटेक्शन तकनीक की प्रभावकारिता का मूल्यांकन करने के लिए OpenAI द्वारा कृत्रिम रूप से उत्पादित जानकारी का उपयोग करके इनमें से कई डिटेक्टरों की जांच करती है। निष्कर्ष दर्शाते हैं कि हालांकि एआई डिटेक्शन सेवाओं में तेजी से सुधार हो रहा है, फिर भी वे कभी-कभी कम पड़ जाती हैं।
विंस्टन, ओपनएआई के एआई टेक्स्ट क्लासिफायर, जीपीटीजीरो और कॉपीलीक्स जैसे ऑनलाइन डिटेक्टर चैटजीपीटी-लिखित अंशों के तीन उदाहरणों की जांच करते हैं। हमने जीपीटी से पहले प्रश्न के लिए पहले प्रकाशित कुछ सामग्री का सारांश देने को कहा। इस उदाहरण में, कम से कम दो डिटेक्टर चैटजीपीटी के लेख को पहचानने में विफल रहे, और केवल एक ने परिणाम की सटीक भविष्यवाणी की जबकि दूसरे ने 50/50 संभावना का अनुमान लगाया।
दूसरे उदाहरण में, हमने चैटजीपीटी से ज्वालामुखी विस्फोट के पर्यावरणीय प्रभावों पर एक लेख तैयार करने के लिए कहा क्योंकि यह लगातार होने वाला भूवैज्ञानिक खतरा है और इस पर जानकारी आसानी से ऑनलाइन उपलब्ध है। इस उदाहरण में, एआई टेक्स्ट क्लासिफायर को छोड़कर, अन्य सभी प्लेटफ़ॉर्म यह अनुमान लगाने में सक्षम थे कि टेक्स्ट जानबूझकर उत्पन्न किया गया था।
अपने अंतिम प्रयास में, हमने चैटजीपीटी से एक ऐसी कहानी बनाने के लिए कहा जो भावनात्मक रूप से आकर्षक हो और जिसका चरमोत्कर्ष चौंकाने वाला हो। यह निर्देश यह देखने के लिए जारी किया गया था कि क्या उपकरण अपने आप कलात्मक रूप से मूल्यवान सामग्री का उत्पादन कर सकता है। यह दिलचस्प है कि चार में से तीन डिटेक्टर इस संभावना से चूक गए कि सामग्री एआई द्वारा निर्मित की गई थी।
कृत्रिम बुद्धिमत्ता (एआई) से उत्पन्न जानकारी से होने वाले नुकसान को कम करने की एक रणनीति की सराहना की गई है: पहचान तकनीक। एआई डिटेक्टर विकसित करने वाले कई व्यवसायों ने स्वीकार किया कि उनके उपकरण सही नहीं थे और उन्होंने प्रतिस्पर्धी तकनीकी माहौल की भविष्यवाणी की थी। एआई-डिटेक्शन सेवाओं की पेशकश करने वाली कंपनियों का दावा है कि झूठी जानकारी, धोखाधड़ी, गैर-सहमति वाली अश्लीलता, रचनात्मक बेईमानी और अन्य तकनीकी दुरुपयोगों की पहचान करने में मदद करके, उनकी सेवाएं पारदर्शिता और जवाबदेही को बढ़ावा देने का काम करती हैं।
तीव्र स्वचालित सामग्री प्रसार
दो निष्कर्ष दो व्यवसायों द्वारा स्वतंत्र रूप से तैयार किए गए: न्यूज़गार्ड, जो इंटरनेट गलत सूचना रिकॉर्ड करता है, और शैडोड्रैगन, जो डिजिटल जांच के लिए उपकरण और निर्देश प्रदान करता है।
विश्लेषण के अनुसार, बड़ी संख्या में काल्पनिक समीक्षाएं, कंटेंट फ़ार्म और सीमांत समाचार वेबसाइटें ऑनलाइन झूठी सामग्री तैयार करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करती हैं। न्यूज़गार्ड को 125 वेबसाइटें मिलीं, जो समाचार से लेकर जीवनशैली रिपोर्टिंग तक फैली हुई हैं, जो पूरी तरह से या मुख्य रूप से कृत्रिम बुद्धिमत्ता (एआई) विधियों से लिखी गई हैं, और 10 अलग-अलग भाषाओं में उपलब्ध हैं।
वेबसाइटों में से एक स्वास्थ्य सूचना पोर्टल था जिसने एआई द्वारा बनाई गई चिकित्सा सलाह के साथ 50 से अधिक लेख जारी किए। शैडोड्रैगन ने प्रसिद्ध वेबसाइटों, इंस्टाग्राम जैसे सोशल नेटवर्किंग प्लेटफॉर्म और अमेज़ॅन समीक्षाओं में भी नकली सामग्री की खोज की। वेबसाइटें अक्सर विज्ञापनों से ढकी रहती थीं, जिससे पता चलता है कि नकली सामग्री क्लिक पाने और वेबसाइट मालिकों के विज्ञापन राजस्व का समर्थन करने के लिए बनाई गई थी।
आरोपों के अनुसार, भ्रामक एआई सामग्री में मनगढ़ंत समाचार, चिकित्सा सलाह और सेलिब्रिटी की मौत की अफवाहें शामिल हैं, जिससे नई चिंताएं पैदा हो रही हैं कि गेम-चेंजिंग तकनीक इंटरनेट गलत सूचना परिदृश्य को जल्दी से बदल सकती है। स्वचालन के बढ़ते खतरे के कारण जितनी जल्दी हम सोच सकते हैं उससे भी जल्दी कई नौकरियाँ ख़तरे में हैं।
हालाँकि Google ने पिछले साल कहा था कि वह कृत्रिम बुद्धिमत्ता द्वारा निर्मित सामग्री को नापसंद करता है, कुछ लोगों ने यह भी सिद्धांत दिया कि Google ऐसा करने वालों को दंडित कर सकता है। हालाँकि, Google के डैनी सुलिवन ने हाल ही में कहा था कि केवल खोज इंजन में अच्छी रैंकिंग के उद्देश्य से बनाई गई किसी भी सामग्री को प्राथमिकता नहीं दी जाएगी, भले ही वह किसी इंसान या AI द्वारा बनाई गई हो।
वॉटरमार्क द्वारा स्वचालित सामग्री की भविष्यवाणी कैसे की जाती है?
चैटजीपीटी की बड़ी भाषा मॉडल-आधारित डिकोडिंग प्रक्रिया प्रत्येक बनाए गए शब्द के लिए विभिन्न विकल्पों की जांच करती है, साथ ही दिए गए संकेत और उसके द्वारा लिखी गई पिछली प्रतिक्रियाओं को भी ध्यान में रखती है। मानव-लिखित सामग्री की विशाल मात्रा के साथ-साथ शब्दों और वाक्यांशों के पैटर्न और संबंधों की जांच के आधार पर, यह सूची में प्रत्येक आइटम को एक अंक प्रदान करता है जो इंगित करता है कि अगले शब्द का अनुसरण करने की कितनी संभावना है। उच्च अंक वाले एक शब्द का चयन करने के बाद कार्यक्रम अगले शब्द पर आगे बढ़ता है।
एलएलएम का आउटपुट अक्सर इतना परिष्कृत होता है कि ऐसा प्रतीत हो सकता है कि चैटबॉट जो कहा जा रहा है उसे समझता है, लेकिन वास्तव में ऐसा नहीं होता है। यह अपने प्रत्येक निर्णय को जटिल गणनाओं और विशाल मात्रा में डेटा पर आधारित करता है। इतना कि यह बार-बार ऐसा लेखन तैयार करता है जो सटीक और सुसंगत हो।
मैरीलैंड विश्वविद्यालय के शोधकर्ताओं द्वारा भाषा मॉडल में उपयोग की जाने वाली वॉटरमार्किंग तकनीकों के संचालन का पता लगाया गया है। वॉटरमार्किंग के साथ, मॉडल निर्माता विशिष्ट उंगलियों के निशान के साथ मॉडल का आउटपुट देता है जो मनुष्यों के लिए अदृश्य होते हैं लेकिन आंकड़ों की सहायता से पता लगाए जाते हैं। पता लगाने की क्षमता और स्वामित्व सत्यापन प्रदान करने के लिए, यह “उत्पन्न पाठ के भीतर छिपे हुए मार्करों या हस्ताक्षरों को एम्बेड करके” काम करता है।
आइए कल्पना करें कि भाषा मॉडल 50,000 अंग्रेजी शब्दों से अवगत है; इसे “वाहक डेटासेट” के रूप में जाना जाता है। जीपीटी कम से कम 20% वाहक डेटासेट को ब्लैकलिस्ट करके और सामान्य अर्थ को बनाए रखते हुए प्रशिक्षण उदाहरणों में विशेष परिवर्तन जोड़कर आउटपुट को समायोजित करता है जब यह अनुमानित संभाव्यता वितरण से सबसे संभावित शब्द का नमूना लेता है। ये समायोजन, जो विशेष रूप से वॉटरमार्क को एन्क्रिप्ट करने के लिए डिज़ाइन किए गए हैं, में शब्द हटाना, जोड़ना और पुनर्व्यवस्थित करना शामिल है।
शेष 80% शब्द डिकोडिंग के समय चुनने के लिए भाषा मॉडल के लिए उपलब्ध हैं। दर्ज किया गया अंतिम शब्द यादृच्छिक संख्या जनरेटर के बीज के रूप में कार्य करता है, जो यह निर्धारित करता है कि कौन से शब्द काली सूची में डाले गए हैं। इससे ब्लैकलिस्टेड शब्दों की सूची को लगातार दोबारा बनाना संभव हो जाता है। इस प्रक्रिया में अगले टोकन की प्रत्येक पीढ़ी के लिए वाहक डेटासेट के 20% को ब्लैकलिस्ट करने के लिए प्रत्येक बाद के शब्द के अंतिम शब्द को बीज के रूप में उपयोग किया जाता है।
इस भाषा मॉडल का उपयोग करके लिखे गए पाठ की पहचान करने के लिए डिटेक्टर उत्पन्न पाठ को स्कैन करता है और ब्लैकलिस्ट पर शब्दों को गिनता है। ब्लैकलिस्टेड शब्दों का उपयोग वॉटरमार्क भाषा मॉडल द्वारा नहीं किया जाएगा, लेकिन वे निस्संदेह मनुष्यों द्वारा उपयोग किए जाएंगे। उत्पन्न लेखन और किसी व्यक्ति द्वारा लिखे गए पाठ के बीच अंतर को एक पहचान उपकरण द्वारा अलग किया जा सकता है जो पहचानता है कि कौन से शब्द विशिष्ट सूची में थे।
यदि कोई पाठ को संपादित करके वॉटरमार्क मिटाना चाहता है तो संशोधित करने के लिए शब्द अज्ञात होंगे। वे संभवतः समग्र अनुपात को कुछ अंकों तक कम करने में ही सफल होंगे, भले ही वे कुछ विशेष वाक्यांशों को संशोधित करने में सक्षम हों।
‘वन-स्टॉप’ टूल जो पूरी तरह से और सटीक रूप से सभी एआई-जनरेटेड टेक्स्ट की पहचान कर सकता है, तब तक पहुंच से बाहर हो सकता है जब तक कि एआई उद्योग समग्र रूप से एक मानक वॉटरमार्क कार्यान्वयन पर सहमत नहीं हो जाता है, जिसमें बहुत सारी इंजीनियरिंग होगी।