कम्प्यूटर की भाषा अलग होती है, इंसानों की अलग। कम्प्यूटर बाइनरी भाषा को समझते हैं यानी कि 0 और 1 के अंकों पर आधारित कोड। इसी तरह से वे संरचित डेटा को समझते हैं जो डेटाबेस, स्प्रैडशीट और तालिकाओं के रूप में सहेजा गया हो। इस तरह के गणितीय डेटा को वे बहुत अच्छी तरह और बेहद तेज रफ़्तार से प्रसंस्कृत कर सकते हैं, उस पर आधारित गणनाएं कर सकते हैं।
दूसरी तरफ हम इंसान न तो बाइनरी भाषा को समझते हैं और न ही संरचित डेटा में संवाद करते हैं। हम अपने आपको शब्दों और वाक्यों में अभिव्यक्त करते हैं जो इंसानी भाषाओं का हिस्सा हैं। अगर इसे डेटा के रूप में देखा जाए तो कहा जाएगा कि हम असंरचित डेटा का प्रयोग करते हैं। कंप्यूटर इस तरह की भाषा और असंरचित डेटा के साथ काम करने में मुश्किल समझते हैं क्योंकि यह उनकी कार्यप्रणाली से मेल नहीं खाता।
इन्हीं असमानताओं के कारण कंप्यूटर के साथ सामान्य ढंग से संपर्क करना इंसान के लिए संभव नहीं था। आखिरकार हममें से कितने लोग होंगे जो 01000010 जैसे अंकों का प्रयोग करने वाली भाषा, जिसे मशीन लैंग्वेज कहते हैं, में अपने शब्दों, वाक्यों, अंकों, चित्रों, ध्वनि आदि को अभिव्यक्त कर सकेंगे? शायद पूरी दुनिया में ऐसा कर सकने वाले लोग कुछ दर्जन या कुछ सौ की संख्या
में हों।
तब भी हम कंप्यूटर के साथ संपर्क कर पा रहे हैं, उसे निर्देश दे पा रहे हैं, उस पर काम कर पा रहे हैं तो कैसे? इसके पीछे का राज है वे प्रोग्रामिंग भाषाएं जिन्हें कम्प्यूटर को निर्देश देने के लिए विकसित किया गया। इन निदेर्शों पर आधारित प्रोग्रामों की बदौलत ऐसे सॉफ़्टवेयर बनाए जा सकें जिनके साथ हम अभिव्यक्ति का आदान-प्रदान ( interact) कर सकते हैं। इस तरह की प्रोग्रामिंग भाषाओं में से कुछ के नाम आपने सुने ही होंगे, जैसे- सी, सी ++, जावा, सी शार्प, पाइथॉन आदि। ये प्रोग्राम हमारी भाषाओं में दिए गए निर्देशों और संदेशों को कंप्यूटर की भाषा में बदल देते हैं इसलिए वह उन पर अमल कर सकता है। इस तरह हम बिचौलिए के रूप में इन साफ़्टवेयर, कोड और प्रोग्रामिंग भाषाओं पर निर्भर हैं। हम सीधे-सीधे कम्प्यूटर से उस भाषा में बात नहीं कर सकते जो हमारे दैनिक जीवन में इस्तेमाल होने वाली भाषा है, जैसे हिंदी या अंग्रेजी।
लेकिन आर्टिफिशियल इंटेलिजेंस को मिली कामयाबी के बाद स्थितियां बदल गई हैं। अब यह प्रौद्योगिकी वह माध्यम बन गई है जो इंसान की भाषा को कम्प्यूटर के समझने योग्य भाषा में तब्दील कर देती है और कम्प्यूटर से आने वाले संदेशों को हमारी सामान्य भाषा में बदल सकती है। एआई का वह उप क्षेत्र जो इस कार्य पर केंद्रित है, प्राकृतिक भाषा प्रसंस्करण कहलाता है। वह कंप्यूटरों को भाषा के संदर्भ में लगभग इंसान जैसी ही समझबूझ और अन्य क्षमताएं देने पर केंद्रित है और इसमें उसे काफी सफलता मिली है।
इन वाक्यों को पढ़ते समय आपके मन में स्वत: ही ऐसे कुछ उदाहरण कौंध गए होंगे जहां हम डिजिटल तकनीकों के साथ अपनी भाषा में संदेशों का आदान-प्रदान करने लगे हैं। सबसे ताजा उदाहरण तो जेनरेटिव एआई का है, जैसे चैटजीपीटी, माइक्रोसॉफ़्ट कोपायलट, गूगल जेमिनी और एन्थ्रोपिक क्लॉड आदि।
हालांकि तब भी कंप्यूटर की भाषायी समझ की सीमाएं हैं जो शायद लंबे समय तक बनी रहेंगी। मसलन हम अपनी भाषा में सांकेतिक रूप से जो कटाक्ष, विनोद, प्रशंसा या आलोचना कर जाते हैं उसे समझना कंप्यूटर के लिए मुश्किल बना रहेगा। संभवत: कविता में कम शब्दों में जो बड़ी बात कह दी जाती है उसे समझना और उसी तरह की अभिव्यक्ति खुद कर पाना उसके लिए चुनौती बना रहेगा। उसे समझने में शायद उसे अभी कुछ और दशक लग जाएं।
फिर भी नैचुरल लैंग्वेज प्रोसेसिंग में जितनी प्रगति हो चुकी है वह आश्चर्यजनक है। इसके कुछ उदाहरणों से आप बखूबी परिचित हैं, जैसे भाषाओं के बीच मशीन अनुवाद, सारांशीकरण और प्रश्नों के उत्तर देने की क्षमता। दर्जनों इंसानी भाषाओं में कहानी, कविता, नाटक, लेख आदि लिखने की क्षमता भी जेनरेटिव एआई ने अर्जित कर ली है।
(लेखक माइक्रोसॉफ़्ट में डेवलपर मार्केटिंग के प्रमुख हैं)
टिप्पणियाँ