ध्वनि अब कंप्यूटर के साथ-साथ अन्य विभिन्न इलेक्ट्रॉनिक उपकरणों में इनपुट और आउट की भूमिका में आ गई है। यानी अब ये उपकरणों पर ध्वनि कमांड पर काम करने लगे हैं
क्या कीबोर्ड की जरूरत नहीं रह जाएगी?
ध्वनि अब कंप्यूटर के साथ-साथ अन्य विभिन्न इलेक्ट्रॉनिक उपकरणों में इनपुट और आउट की भूमिका में आ गई है। यानी अब ये उपकरणों पर ध्वनि कमांड पर काम करने लगे हैं
माइक्रोसॉफ़्ट के संस्थापक बिल गेट्स ने दर्जनों बार यह भविष्यवाणी की है कि आने वाले समय में कंप्यूटर पर काम करने के लिए ज्यादातर लोग कीबोर्ड के बजाय अपनी ध्वनि का इस्तेमाल करेंगे। ध्वनि पहचान प्रणालियों की शुद्धता इतनी बढ़ जाएगी कि वे डिजिटल माध्यमों के साथ संपर्क का सामान्य माध्यम बन जाएंगी। कुछ लोगों ने ऐसी परिकल्पना का विरोध भी किया था, यह कहते हुए कि टाइपिंग में निजता की धारणा निहित है जबकि बोलकर टाइप करने या डिजिटल उपकरणों को नियंत्रित करने का मतलब होगा आपकी निजता का समाप्त हो जाना। जाहिर है, आपकी बातों को लोग सुन लेंगे।
‘बिजनेस एट द स्पीड आॅफ थॉट’ (विचार की रफ़्तार से व्यापार) के लेखक बिल गेट्स की बहुत सारी भविष्यवाणियों की तरह यह भी सच होती दिखाई दे रही है। डिजिटल क्षेत्र में हम कन्वरसेशन ऐज ए प्लेटफॉर्म (प्लेटफॉर्म के रूप में संवाद) की दिशा में आगे बढ़ रहे हैं। कंप्यूटर की पढ़ाई के दौरान हमें इनपुट और आउटपुट उपकरणों के बारे में पढ़ाया जाता था जिनमें कीबोर्ड, माउस इनपुट और मॉनिटर, प्रिंटर आउटपुट होते थे। इनमें कभी भी ध्वनि को इनपुट या आउटपुट के रूप में नहीं पढ़ाया गया। आज भले ही कंप्यूटर हो या मोबाइल, ध्वनि इनपुट के साथ-साथ आउटपुट के रूप में भी उनका महत्वपूर्ण हिस्सा बन गई है। इन उपकरणों से इतर, बहुत सारे दूसरे उपकरणों, जैसे कि स्मार्ट स्पीकर, स्मार्ट टेलीविजन, स्मार्ट रिमोट कंट्रोल, स्मार्ट कारों आदि को भी बोलकर कमांड देने तथा उनका उत्तर पाने की सुविधा आम होती जा रही है।
माइक्रोसॉफ़्ट वर्ड को खोलकर कोई नया दस्तावेज शुरू करना, बोलकर टाइप करना और बोलकर ही माउस कर्सर को एक से दूसरी जगह ले जाना आदि। उधर एंड्रोइड पर गूगल का नया वॉइस एक्सेस फीचर आ गया है जिसके जरिए ऐसा बहुत-सा काम, जो पहले स्क्रीन पर टैप करके होता था (कोई एप्प खोलना, ब्राउजर में वेब पेजों को बदलना आदि), बोलकर होने लगा है।
डिजिटल उपकरणों में ध्वनि इनपुट के तीन अलग-अलग पहलू हैं- बोलकर पाठ लिखने की क्षमता, बोलकर संवाद करने की क्षमता और बोलकर निर्देश देने तथा उनका पालन कराने की क्षमता। हालांकि इंसानी ध्वनि को पहचानने और डिजिटल डेटा में बदलने के प्रयोग 1950 के दशक से ही चले आ रहे हैं लेकिन आम उपभोक्ता द्वारा प्रयोग योग्य पहला बड़ा काम 1990 में ‘ड्रेगन डिक्टेट’ नामक सॉफ़्टवेयर के रूप में दिखता है। ऐसे बहुत से सॉफ्टवेयर हमें अपने दस्तावेज खोलने के बाद उनमें बोलकर पाठ लिखने की सुविधा देते हैं। आज यह सुविधा माइक्रोसॉफ़्ट आफिस और गूगल डॉक्स जैसे उत्पादकता आधारित सॉफ्टवेयरों में भी मौजूद है। लेकिन पिछले एक दशक में ध्वनि इनपुट के रूप में जिस दूसरे क्षेत्र में बड़ी प्रगति हुई है, वह है डिजिटल उपकरणों को निर्देश या कमांड देना तथा उनके साथ दोतरफा संवाद करना। यानी अब आप कंप्यूटर को खोलने से लेकर बंद करने तथा किसी सॉफ़्टवेयर को खोलने, फाइल बनाने, फॉरमेटिंग करने तथा फिर पाठ लिखने तक के तमाम कामों को सिर्फ बोलकर अंजाम दे सकते हैं। खुद डिजिटल उपकरण भी आपको अपना जवाब मात्र पाठ के रूप में नहीं बल्कि ध्वनि के रूप में दे सकता है।
जहां तक उपकरणों से संवाद का सवाल है, एपल कंप्यूटरों तथा आइफोन पर सिरी नामक एप्लीकेशन का प्रयोग काफी पुराना हो चुका है। उधर गूगल की ओर से गूगल असिस्टेंट मौजूद है जिसे मोबाइल फोन, इंटरनेट खोज तथा मैप्स आदि पर भी इस्तेमाल किया जा सकता है। कुछ वर्षों में ध्वनि इनपुट पर आधारित अमेजॉन का अलेक्सा ‘इको’ उपकरण, जिसे स्मार्ट स्पीकर या वर्चुअल असिस्टेंट भी कहा जाता है, लोकप्रिय हो गया है जिसका प्रयोग इंटरनेट से जानकारियां पाने, संगीत सुनने तथा चुनिंदा घरेलू स्मार्ट उपकरणों को संचालित करने में भी किया जा सकता है। माइक्रोसॉफ़्ट का आभासी सहायक कोटार्ना भी विंडोज उपकरणों पर आपसे संवाद करने, इंटरनेट खोज, खबरें सुनाने आदि के लिए मौजूद है।
अब आते हैं तीसरी बड़ी क्षमता की ओर, यानी डिजिटल उपकरणों को बोलकर निर्देश देने की क्षमता। इस दिशा में ताजा बड़ी खबर माइक्रोसॉफ़्ट से आई है जिसने मई 2022 में विंडोज 11 में एक नई सुविधा का परीक्षण शुरू किया है, जिसका नाम है वॉइस एक्सेस (ध्वनि से संपर्क)। इस फीचर को सक्रिय करने के बाद आप विंडोज को बोलकर निर्देश दे सकते हैं, जैसे वेब ब्राउजर खोलना और फिर उसमें कुछ खोजना। जैसे माइक्रोसॉफ़्ट वर्ड को खोलकर कोई नया दस्तावेज शुरू करना, बोलकर टाइप करना और बोलकर ही माउस कर्सर को एक से दूसरी जगह ले जाना आदि। उधर एंड्रोइड पर गूगल का नया वॉइस एक्सेस फीचर आ गया है जिसके जरिए ऐसा बहुत-सा काम, जो पहले स्क्रीन पर टैप करके होता था (कोई एप्प खोलना, ब्राउजर में वेब पेजों को बदलना आदि), बोलकर होने लगा है।
खबर है कि दुनिया में 41 प्रतिशत लोगों ने ध्वनि कमांडों का इस्तेमाल किया है। भारत और चीन जैसे देशों में लगभग 30 प्रतिशत लोगों ने सप्ताह में कम से कम एक बार आवाज की मदद ली है। आगे-आगे देखिए होता है क्या!
(लेखक माइक्रोसॉफ़्ट में ‘निदेशक-
स्थानीय भाषाएं और सुगम्यता’ के पद पर कार्यरत हैं)
टिप्पणियाँ