IDN करेंगे हिन्दी का नाम रोशन

संपूर्ण डोमेन नाम अपनी भाषा में लिख सकने के मार्ग हो रहे हैं प्रशस्त

Nidhi

इं

टरनेट हमारे जीवन का महत्वपूर्ण अंग बन चुका है। हमें जब भी कोई जानकारी खोजनी हो, चाहे वो स्थानीय पीवीआर में कौन सी फिल्म चल रही है यह मालूम करना हो, या हाल की सर्वाधिक लोकप्रिय पुस्तक के बारे में पता करना हो, हम बस उसे "गूगल" कर लेते हैं। यह हमारे जीवन का इतना महत्वपूर्ण अंग बन चुका है कि यदि इंटरनेट सेवा एक दिन के लिए भी ठप्प पड़ जाए तो हममें से अधिकांश अवसादग्रस्त हो जायें। पर यहाँ "हम" का तात्पर्य – "हम" भारतीयों से या "हम" अंग्रेज़ी पढ़े भारतीयों से है! जब देश में इंटरनेट के महत्व और विकास की बात होती है तो यही प्रश्न उठता है। हालाँकि विश्व के अंग्रेज़ी भाषियों में से एक बहुत बड़ी संख्या भारत में निवास करती है, फिर भी भारत की जनसंख्या के हिसाब से देखा जाए तो उन का प्रतिशत बहुत कम है।

इस समस्या को सुलझाने के लिए लोगों ने क्षेत्रीय भाषाओं में जालस्थल बनाने शुरू किए ताकि इंटरनेट अधिकाधिक भारतीयों तक पहुँचे। परंतु इस में एक अड़ंगा यह है कि जालस्थल तो क्षेत्रीय भाषाओं में है, पर प्रयोक्ता को जालस्थल का पता फिर भी अंग्रेज़ी के अक्षरों में ही याद रखना और टाइप करना पड़ता है, जो कोई खास आरामदेह बात तो है नहीं। इस समस्या का हल हो सकता है अन्तरराष्ट्रीयकृत डोमेन नाम यानि आइडीएन (IDN) द्वारा।

आइडीएन, एक संक्षिप्त पृष्ठभूमि

फिलहाल, इंटरनेट की कुछ तकनीकी कमियों के कारण, डोमेन के नाम केवल अंग्रेज़ी के सादे अक्षरों (प्लेन टेक्स्ट यानि ASCII या एस्की) में ही पंजीकृत किए जा सकते हैं (उदाहरणतः nirantar.org)। अन्तरराष्ट्रीय अक्षरों (उदाहरणतः उदाहरण.in जिसमें इस तरह के अक्षर हैं) को इंटरनेट की डोमेन नाम प्रणाली यानि डीएनएस (DNS) नहीं पहचान पाती, और इस कारण ये एक पंजीकृत नाम के रूप में डोमेन नाम रजिस्ट्री में नहीं रह सकते।

2003 में विकसित एक अन्तरराष्ट्रीय मानक "प्यूनीकोड" (Punycode) की मदद से ग़ैर-एस्की अक्षरों को ऐसे अक्षरों में परिवर्तित किया जा सकता है, जिन्हें डीएनएस समझ सके। इसके द्वारा ऐसी प्रक्रिया हासिल होती है जिससे ग़ैर-एस्की अक्षरों को डोमेन रजिस्ट्री और डीएनएस तो एस्की प्रारूप में ही देखता है, पर साधारण वेब प्रयोक्ता उसे मूल भाषा में देख पाता है। "प्यूनीकोड" ग़ैर-एस्की अक्षरों वाले शब्द को एक एस्की अक्षरमाला में अनूदित करता है, जिसे डोमेन नाम रजिस्ट्री में पंजीकृत किया जा सकता है और डीएनएस द्वारा समझा जा सकता है। अन्तरराष्ट्रीय डोमेन नामों को एस्की में परिवर्तित करने के लिए सर्वप्रथम इन अन्तरराष्ट्रीय अक्षरों को, अन्तरराष्ट्रीय रूप से अनुमोदित भाषा प्राधिकरण द्वारा विकसित, एक सारणी की मदद से एस्की अक्षरों से संबद्ध करना पड़ता है।

उदाहरण.in का ही उदाहरण लें तो द्वितीय स्तर डोमेन (.in से पहले का शब्द) को प्यूनीकोड परिवर्तक द्वारा एस्की अक्षरमाला में परिवर्तित किया जाता है। फिर इस नाम के उपसर्ग के रूप में (“xn-“) अक्षर जोड़ दिए जाते हैं, ताकि डीएनएस इसे आइडीएन के रूप में पहचान सके। तो इस तरह, अन्तरराष्ट्रीय डोमेन नाम उदाहरण.in का एस्की नाम xn-p1b6ci4b4b3a.in बनता है।

Unicode to Punycode conversion

सुनहरा भविष्य भी

जब जालपृष्ठ हिन्दी में है तो भला डोमेन नाम हिन्दी में क्यों नहीं? यह प्रश्न तो हम हिन्दी प्रेमियों के मन में सदा रहा ही है। देश में 4 करोड़ 10 लाख जाल प्रयोक्ता हैं और यह हमारी कुल आबादी का महज़ 4 प्रतिशत ही है। ज़ाहिर है कि प्रयोक्ताओं की यह संख्या तेज़ी से बढ़ रही है, पिछले साल ही यह बढ़त दर 25 फीसदी थी। स्पष्टतः अंग्रेजी का प्रभुत्व अब खत्म हो रहा है। विशेषज्ञों का अनुमान है कि 2050 तक अंग्रेज़ी का कद चीनी, हिन्दी व उर्दु के सामने बेहद छोटा रह जायेगा (ग्राफ देखें)।

Rise of Hindi & Urdu

तो हिन्दी अब आहिस्ता आहिस्ता जाल पर कदम बढ़ा रही है। हमारे देश की कोडयुक्त ccTLD यानि .in ने पहले ढाढस बंधाई और फिर आइडीएन से डोमेन नाम अपनी भाषा में लिखने के मार्ग प्रशस्त हुये। अक्तुबर 2007 से समूचे डोमेन नाम जिसमें TLD(जालपते में डॉट के बाद आने वाले शब्द जैसे कॉम, आर्ग, बिज़, इंफ़ो) भी शामिल है का हिन्दी व तमिल समेत 11 लिपियों में परीक्षण भी प्रारंभ हुये। हिन्दी के लिये यह पता http://उदाहरण.परीक्षा है। अन्य परीक्षण जालपते नीचे दिये चित्र में दिये हैं।

Example.test URLs

जुलाई 2008 में संपन्न ICANN की बैठक में यह निर्णय भी आ गया है कि 2009 से नये जेनेरिक टॉप लेवल डोमेन यानि gTLD भी उपलब्ध होंगे और ये पूरी तरह गैर रोमन अक्षरों में लिखे जा सकेंगे। तो वो समय जल्द ही आने वाला है जब जालपते http://निरंतर.पत्रिका या http://नुक्ताचीनी.चिट्ठा जैसे पते दिखें।

आइडीएन जालपते फिलहाल तो .कॉम TLD के लिये ही उपलब्ध हैं और उसमें भी TLD रोमन लिपी में ही स्वीकार्य होता है। ध्यान दें कि अन्तर्राष्ट्रीय डोमेन नाम बुक कराते समय आपको भाषा भी चुननी पड़ती है जिसे डोमेन मिलने के बाद बदला नहीं जा सकता, दो लिपियों को मिलाकर भी नाम बनाना स्वीकृत नहीं है। फिलहाल सभी ब्राउज़र भी आइडीएन जालपते समझने में असमर्थ हैं। अगर आप इंटरनेट एक्सप्लोरर 7 या फायरफॉक्स 3 इस्तेमाल करते हैं तो http://www.देबाशीष.com अथवा http://www.निरंतर.com पर जाने पर आप सही जालपते तक पहुंच जायेंगे। पर इंटरनेट एक्सप्लोरर 5 या 6 या फायरफॉक्स 2 के प्रयोक्ता ऐसा नहीं कर सकते क्योंकि इनमें गैररोमन लिपी से प्यूनीकोड बनाने की क्षमता नहीं होती।

पर पुराने ब्राउज़र का प्रयोग आइडीएन जालपते के प्रयोग करने की राह में बाधक भला कैसे बनें। आप चाहें तो हिन्दी डोमेन नाम का प्यूनीकोड खुद ही निकाल लें, यह काम उन्नत ब्राउज़र खुद ही करते हैं पर आप प्यूनीकोड कंवर्टर जैसे जाल तंत्रांश से यह काम कर सकते हैं। अगर आप और भी उत्सुक हैं तो इस काम के लिये बने विशेष प्लगिन का इस्तेमाल कर सकते हैं, मसलन वेरिसाईन द्वारा बनाया आईनैव नामक मुफ्त प्लगिन जिससे आप अपने ईमेल में भी आइडीएन जालपतों का प्रयोग कर सकेंगे। आइडीएन का समर्थन करने वाले विभिन्न ब्राउज़रों व तंत्रांशों की एक विस्तृत सूची यहाँ दी गई है

राम मोहन, जो एफिलियास के मुख्य तकनीक अधिकारी और उपाध्यक्ष हैं, बताते हैं, "यह परिवर्तन प्रक्रिया डोमेन पंजीकर्ताओं अथवा डोमेन विक्रेताओं द्वारा, जो प्यूनीकोड या ":xn-" प्रारूप में नाम तैयार करने हेतु इंटरनेट इंजीनियरी टास्क फोर्स (IETF) के नेम-प्रेप (Nameprep) और स्ट्रिंग-प्रेप (Stringprep) मानकों का प्रयोग करते हैं, पूरी की जाती है। ग़ैर-एस्की नामों को पंजीकृत करने के पूर्व उसे प्यूनीकोड में परिवर्तित करना आवश्यक है क्योंकि डोमेन रजिस्ट्री केवल एस्की अक्षरों को ही संजो पाती है और इस बात को सुनिश्चित करती है कि हर नाम अनूठा हो। इसके अतिरिक्त रजिस्ट्री अपने उत्तरदायित्व में हर डोमेन के लिए एक ज़ोन फाइल बना कर प्रकाशित करती है और ज़ोन फाइल ही वह डाइरेक्ट्री प्राधिकरण है जो अन्त में हर नाम को इंटरनेट पर खोज पाने में मदद करती है। रजिस्ट्री दरअसल हर नाम को प्यूनीकोड प्रारूप में आरक्षित करती है, न कि मूल प्रारूप में, और सामंजस्य प्रक्रिया के तहत आइडीएन समर्थित अनुप्रयोग प्रयोक्ता और रजिस्ट्री के बीच उपयुक्त अनुवाद के दायित्व का निर्वाह करते हैं।"

आइडीएन के विकास में बाधाएँ

आइडीएन की संभावनाएँ तो प्रबल हैं, पर अगले कदम पर आने वाली पेचीदगियाँ NIXI  और इस विकास प्रक्रिया से संबन्धित अन्य संस्थाओं के लिए खासी चुनौती पेश करती हैं। भारत में 24 भाषाएँ हैं और 12 लिपियाँ (शायद किसी भी अन्य देश से अधिक), जिस का अर्थ है विभिन्न भाषाओं में मिलते जुलते अक्षरों और लिपियों का प्रयोग।

डाइरेक्टी के अध्यक्ष और कार्यकारी अधिकारी भाविन तुराखिया कहते हैं, "यह बुनियादी समस्या है और इससे अन्य समस्याएं भी जन्मी जो आइडीएन को अपनाने की राह में रोड़ा बने हुये हैं। ये समस्याएं केवल तकनीकी ही नहीं है, बल्कि इनमें नीति निर्धारण के मुद्दे भी शामिल हैं। पर फिर भी, आइडीएन अंगीकरण की ओर भारत की पहल और इस दिशा में अब तक किये कार्य द्वारा यह अंदाज़ा तो लग जाता है कि भारत इसमें कितना बड़ा सुअवसर देख रहा है। हालाँकि भारत की जनसंख्या 100 करोड़ से कुछ अधिक ही है, फिर भी केवल 12.5 करोड़ ही अंग्रेज़ी बोलते हैं। 30 करोड़ प्रयोक्ताओं वाली हिन्दी सब से अधिक प्रयुक्त भाषा है, और उर्दू बोलने वाले 13 करोड़ हैं, यह संख्या दुगनी हो जाती है अगर पड़ौसी देशों को भी गिना जाए। इसलिये यदि आइडीएन को प्रभावशाली ढंग से अपनाया जाता है, तो कुल इंटरनेट प्रयोक्ता आधार दुगनी या तिगुनी संख्या भी छू सकता है। पर इस क्षेत्र में अभी बहुत काम बाकी है।"

यूँ तो यह समस्या हर देश के लिए है, पर भारत के लिए यह समस्या कुछ ज़्यादा ही टेढ़ी है। चीन के साथ स्थिति की तुलना की जाए तो भारत के लिए कितना काम है, उस का पता चलता है। चीन में 160 करोड़ चीनी भाषी हैं, जो केवल दो ही लिपियाँ प्रयोग करते हैं, और उन में भी जापानी और कोरियाई भाषाओं से मिलते जुलते अक्षर भी हैं।

तुराखिया समझाते हैं, "इन देशों में विकास प्रयत्नों के परिणाम काफी तेज़ी से आए हैं क्योंकि उनकी पेचीदगियों हमारे जितनी अधिक नहीं है। इस का अर्थ यह भी हुआ कि उन भाषाओं में आनलाइन मसौदा कहीं ज़्यादा है। तिस पर इन देशों में इंटरनेट की पहुँच कहीं ज़्यादा है, हालाँकि आइडीएन भारत में इसी पहुँच को बढ़ाने की दिशा में एक कदम है। हमारी वर्तमान पहुँच केवल 5.3% है, जबकि चीन की 15.9% है और जापान की 68.7%।"

इंटरनेट एक्सप्लोरर 7.0 और फायरफाक्स 1.5 से आगे ब्राउज़र तो पहले ही आइडीएन का समर्थन करते हैं। समस्या यहाँ पहचान और समझ की नहीं है। भारत में पहले ही ऐसे जालपृष्ठ हैं जो हिन्दी, तमिल और अन्य भाषाओं में मसौदा उपलब्ध कराते हैं। इस के अतिरिक्त कई ईमेल भेजे जाते हैं, जिन में ग़ैर-एस्की अक्षर होते हैं।

मुख्य चुनौती यह है कि डोमेन नाम ही एस्की के परे नहीं जा पाए हैं, जिस के फलस्वरूप प्रयोक्ताओं को जालस्थल के मसौदे और पते के बीच भाषा बदलनी पड़ती है। "अब, जब कि इस परिवर्तन को क्रियान्वित करने की तकनीक उपलब्ध है, हम नीति संबन्धी मुद्दों पर काम कर रहे हैं। जब दोनों पूरे हो जाएँगे, तब प्रयोक्ताओं को पूरी तरह (या लगभग पूरी तरह) अपनी भाषा में संवाद करने का एक पूर्ण और सरल रास्ता मिल जाएगा।", राम मोहन बताते है।

आगे की राह

मोबाइल उद्योग के साथ तुलना की जाए तो, उस की प्रयोक्ता संख्या इंटरनेट के मुकाबले तीन गुणा हैं। इस संख्या में तब्दीली लाने के लिए यह ज़रूरी है कि कुछ मुद्दों को सुलझाया जाए – जिनमें से एक इंटरनेट की उपलब्धि और कीमत से जुड़ा है। चूँकि दूरसंचार की मूल व्यवस्था इंटरनेट सेवा के मूल्य पर सीधा असर डालती है, यह ज़रूरी है कि सरकार पूरे देश में इसके विकास की राह आसान बनाए। आइडीएन पर केन्द्रित प्रयासों से काफी अपेक्षायें हैं और यह सही दिशा में उठाया गया कदम है।

आइडीएन इंटरनेट में लोकतंत्रीकरण लाने हेतु एक आवश्यक कारक है। तुराखिया कहते हैं "ट्रेडमार्क धारकों के लिए प्राथमिक पंजीकरण 2008 की प्रथम तिमाही में उपलब्ध होने की आशा है। पहले ही ICANN द्वारा 13 भाषाओं में परीक्षण नाम लागू किये गए हैं, जिनमें देवनागरी और तमिल लिपियाँ शामिल हैं। जहाँ तक आम तौर पर अपनाए जाने का प्रश्न है, उस में अभी देर लग सकती है, क्योंकि देश का अधिकतर भाग अभी इंटरनेट के इस्तेमाल से अछूता है, और जहाँ प्रयोग हो भी रहा है, वहाँ इस बात की मुश्किल से समझ है कि दूसरी भाषा में इसे कैसे प्रयोग किया जाए।"

मोहन कहते हैं, "हमारा विचार है कि इंटरनेट का विकास सीधा उस के प्रयोग से जुड़ा है। दूरसंचार तेज़ी से इसलिए बढ़ रहा है क्योंकि आम आदमी को इसका रोज़मर्रा का इस्तेमाल दिखता है। मैं मानता हूँ कि NeGP (राष्ट्रीय अनु-प्रशासन योजना) जैसी परियोजनाएँ और सभी सरकारी सेवाओं को इंटरनेट पर उपलब्ध कराने के राज्य आधारित प्रयास आम आदमी को लाभ पहुँचाएँगे। इंटरनेट की पहुँच इसलिए भी कम है कि अधिकतर लोग इसे पी.सी. या लैपटॉप द्वारा प्रयोग की जाने वाली सेवा के रूप में देखते हैं।" इस स्थिति में नाटकीय परिवर्तन आने वाला है। अगली लहर आएगी भारत में मोबाइल फोनों पर इंटरनेट सेवा की और इससे मोबाइल फोन की बिक्री और इसके इस्तेमाल में अतिशय वृद्धि होगी।

भारत पहला ऐसा राष्ट्र बनने का सामर्थ्य रखता है, जो पी.सी. और लैपटॉपों पर आधारित "इंटरनेट 1.0 से", मोबाइल फोनों पर आधारित "इंटरनेट 2.0" की ओर छलाँग लगाएगा।

चूँकि अधिकतर भारतीय अपनी भाषा को प्राथमिकता देते हैं, आइडीएन का लागूकरण सकारात्मक कदम ही होगा, और यह तथ्य दूसरे कारकों के साथ मिल कर इंटरनेट को अपनाने में तेज़ी लाने में मदद करेगा। आशा है कि आइडीएन की आमद के साथ हमें इंटरनेट को केवल देश के अंग्रेज़ी भाषी लोगों से जोड़ कर देखना नहीं पड़ेगा।

वरुण के एक्सप्रेस कंप्यूटर में प्रकाशित मूल लेख का अनुवाद किया रमण कौल ने। ग्राफिक्स व अतिरिक्त सामग्री: देबाशीष चक्रवर्ती। आधार चित्र इंटरनेट से साभार।

2 प्रतिक्रियाएं

  1. हिंदी में जालपतों का नाम लिखने से क्‍या हम उन पाठकों को खो नहीं देंगे जो आज भी इंटरनेट पर हिंदी नहीं लिख सकते. रोमन में अधिकांश सर्च होने से यह बात जाहिर है कि आम उपयोक्‍ता को अभी इंटरनेट पर हिंदी लिखने में काफी लंबा समय तय करना होगा. जैसा कि आपने स्‍वयं लेख में कहा है कि भारत में 1 दर्जन से ज्‍यादा लिपियां हैं… और अलग अलग ब्राउजर्स का झमेला भी है….
    में अब भी इस बारे में ज्‍यादा निश्चिंत नहीं हूं कि हिंदी में जालपतों को लिखना हमारे हित में और उपयोगी भी होगा या महज बस हिंदीकरण की हमारी चाहत को पूरा करने का एक जरिया मात्र बन कर रह जाएगा…
    तथापि यह लेख बहुत रुचिपूर्ण और स्‍तरीय ढंग से प्रस्‍तुत किया गया है. धन्‍यवाद

  2. संजय बात सही है कि IDN को प्रचलित होने में समय लगेगा, यह कुछ कुछ जाल पर हिन्दी के प्रचलन जैसा ही तो है। मेरी राय में व्यापक पाठकवर्ग को आकर्षित करने के लिये जालघर के मालिकों को साधारण डोमेन व IDN दोनों का ही प्रयोग करना चाहिये।