पूर्वाग्रहों से भरी एआई भारत के लिए चुनौती-अवसर दोनों
पूर्वाग्रहों से भरी एआई भारत के लिए चुनौती-अवसर दोनों
एक शाम मैंने एलेक्सा (वॉइस असिस्टेंट) से कहा, ‘श्रेया घोषाल की आवाज में धूम ताना गाना प्ले करो।’ हालांकि मैंने ये अनुरोध अंग्रेजी भाषा में किया था, लेकिन मेरे बंगाली लहजे से एलेक्सा गफलत में पड़ गई और कई कोशिशों के बाद भी गाना प्ले नहीं कर पाई। पर जब मेरे पार्टनर ने अपने अमेरिकी लहजे में गलत-सही उच्चारण से वही गाना प्ले करने को कहा, तो एलेक्सा तपाक से समझ गई।
भारतीय यूजर्स को पूरी तरह पहचानने या उन्हें समझने में नाकाम एआई सिस्टम से जुड़े इस घटनाक्रम से मैं सकते में आ गया। और मुझे लगता है कि एआई क्रांति के दौर में ऐसा सोचने वाला इकलौता मैं ही नहीं हूं।
आर्टिफिशियल इंटेलिजेंस (एआई) एक टेक्नोलॉजी है, जिसमें मशीन डेटा से सीखती और निर्णय लेती है। हालांकि कई बार एआई सिस्टम पक्षपातपूर्ण निर्णय लेते हैं और अपने पूर्वाग्रहों के साथ समस्याएं खड़ी कर सकते हैं।
वहीं, एआई एथिक्स का उद्देश्य निष्पक्ष, सुरक्षित और लोगों के अधिकारों का सम्मान करने वाली टेक्नोलॉजी का निर्माण है। लेकिन जब एआई सबके लिए समान रूप से काम नहीं करती तो समस्याएं खड़ी कर सकती है, खासतौर पर भारत जैसे विविधतापूर्ण देश के सामने।
अपने इस आलेख की तैयारी के लिए जब मैंने ‘स्टेबल डिफ्यूजन एक्सएल’ (शब्दों से तस्वीर तैयार करने वाला एआई मॉडल) से कुछ तस्वीरें तैयार कीं, तो भारतीय संदर्भ में इसने साफ-साफ भेदभाव का उदाहरण सामने पेश कर दिया।
उच्च शिक्षित लोगों या ज्यादा वेतन पाने वालों के प्रस्तुतिकरण में इसने बमुश्किल ही महिलाओं को चित्रित किया, साथ ही अशिक्षित और दिहाड़ी मजदूरी करने वालों को एआई मॉडल ने बहुत सांवला दिखाया।
इस तरह के पूर्वाग्रहों के मूल में दरअसल एआई मॉडल के प्रशिक्षण में इस्तेमाल हुआ डेटा है, जो कि ज्यादातर अंग्रेजी में है और इंटरनेट पर मौजूद सामग्री से लिया गया है, जहां अमेरिकी दृष्टिकोण ही हावी है। एआई मॉडल्स, डेटा पर निर्भर है, इसलिए उच्च गुणवत्तापूर्ण डेटा का सावधानी से इस्तेमाल जरूरी है।
पश्चिमी देशों में तैयार किए गए एआई मॉडल्स अक्सर भारतीय संस्कृति, भाषाई और सामाजिक आर्थिक विविधता के लिए जिम्मेदार नहीं होते हैं, जिससे उनकी प्रभावशीलता भी कम होती है। यूनिवर्सिटी ऑफ कोपेनहेगन के हालिया शोध में सामने आया कि चैटजीपीटी से जब अन्य देशों और संस्कृतियों के बारे में पूछा जाता है, तब भी वह मुख्य रूप से अमेरिकी मानदंडों व मूल्यों को दर्शाने के साथ उसे बढ़ावा देता है।
भारत में सबको साथ में लेकर चलने वाली समावेशी एआई तैयार करना इसलिए भी कठिन है क्योंकि देश का राजनीतिक और सांस्कृतिक दायरा बहुत जटिल है, जिसमें 22 आधिकारिक भाषाएं और 1652 से ज्यादा बोलियां हैं। एक आर्टिकल में सामने आया है कि चैटजीपीटी जैसी कुछ टेक कंपनियां विवादों के डर से भारत में एआई टेक्नोलॉजी अपनाने में हिचक रही हैं।
इसके कारण देश में इनोवेशन और लाभकारी एआई टेक्नोलॉजी को अपनाने की गति धीमी पड़ सकती है। वहीं, जब बात ग्रामीण भारत में इसे अपनाने की हो तो एआई आधारित अनुवाद प्रणाली अंग्रेजी-केंद्रित डेटा पर प्रशिक्षित होने के कारण प्रासंगिक और बोलचाल के अनुवादों के साथ जूझती है। हालांकि इससे एआई मॉडल्स को अपनाने की गति में फर्क नहीं पड़ा है। आईबीएम की 2024 में आई रिपोर्ट के मुताबिक 59 प्रतिशत भारतीय कंपनियों ने पहले ही एआई को तैनात कर दिया है।
पश्चिमी मॉडल जिन जटिल समस्याओं की पहचान करने में विफल रहा है, उसके चलते हमें देखना चाहिए कि क्या एआई के लाभ सभी भारतीयों को समान रूप से मिल पा रहे हैं। एआई के सही मायनों में लोकतांत्रिक इस्तेमाल के लिए समुदायों को सशक्त करने की जरूरत है ताकि वे समझें कि उन्हें प्रभावित करने वाले एआई टूल्स कैसे काम करते हैं।
एआई डिजाइन में मानव केंद्रित रणनीति के लिए साथ मिलकर काम करना होगा, जिसमें टेक्नोलॉजी जानकारों के साथ, डोमेन विशेषज्ञ, समुदाय के लोग भी हों। ‘एआईफॉरभारत’, ‘कलेक्टिव इंटेलिजेंस प्रोजेक्ट’ जैसी पहल उदाहरण हैं।
जहां ‘एआईफॉरभारत’ भारतीय भाषाओं के लिए डेटासेट व भाषा मॉडल विकसित करती है, वहीं कलेक्टिव इंटेलिजेंस लोकतांत्रिक प्रक्रियाओं के माध्यम से एआई में सामुदायिक लक्ष्यों को शामिल करती है।
इन चुनौतियों पर सक्रियता से काम किया जाए तो भारत भी एआई सिस्टम तैयार कर सकता है। इसके लिए इनोवेशन, सांस्कृतिक रूप से संवेदनशीलता और एथिक्स की जरूरत है। अपने सांस्कृतिक ताने-बाने को संरक्षित करते हुए एआई की क्षमता का उपयोग करने का भारतीय दृष्टिकोण अन्य उभरती अर्थव्यवस्थाओं के लिए मॉडल बन सकता है।
(ये लेखक के अपने विचार हैं)