दुनिया भर में दो सौ भाषाओँ में इस्तेमाल हो रहा है फेसबुक

दुनियाभर में अलग-अलग भाषाओं की जानकारी रखने वाले लोगों से संवाद कायम करना हालांकि एक मुश्किल काम है, पर अनुवाद के कारण यह मुश्किल काफी आसान हो गई है। और सिर्फ संवाद कायम करने के लिए ही नहीं, बल्कि कारोबार के लिए भी अनुवाद बेहद ज़रूरी है। अच्छा ऑटोमेटिक अनुवाद इंटरनेट की बड़ी कंपनियों के लिए एक बड़ी प्राथमिकता है। इसीलिए फेसबुक, गूगल, माइक्रोसॉफ्ट, रूस की यांडेक्स, चीन की बाइदू और उनके जैसी अन्य कंपनियां अपने अनुवाद के साधनों को और बेहतर बनाने की कोशिशें निरंतर कर रही हैं। डी डब्लु वर्ल्ड की एक रिपोर्ट में कहा गया है कि पेरिस में फेसबुक की कई प्रयोगशालाओं में से एक में आर्टिफिशियल इंटेलिजेंस के विशेषज्ञ इस पर काम कर रहे हैं। फेसबुक में फंडामेंटल एआई रिसर्च की यूरोपीय सह-निदेशक आंत्वान बोर्डेस का कहना है कि इस वक्त फेसबुक पर 200 भाषाओं का इस्तेमाल हो रहा है। मौजूदा समय मेंऑटोमेटिक अनुवाद का आधार है किन्ही दो भाषाओं में एक जैसे दिखनेवाले टेक्स्ट के बड़े बड़े कोष। लेकिन कई भाषाओं के जोड़ों के साथ समस्या ये है कि उनके बीच उतने समानांतर टेक्स्ट हैं नहीं जितनों की आवश्यकता है। इसीलिए शोधकर्ता लम्बे समय से अन्य तरीकों की तलाश में हैं और इन्हीं में एक तरीका है फेसबुक द्वारा बनाई गई एक प्रणाली जो शब्दों का एक गणितीय प्रतिरूप बनाती है।


हर शब्द सैंकड़ों आयामों के बीच एक "वेक्टर"यानी एक निश्चित मात्रा वाली राशि, बन जाता है। बोली हुई भाषा में जो शब्द एक दूसरे के करीब हैं, इस वेक्टरों की दुनिया में भी खुद को एक दूसरे के निकट पाते हैं। इस प्रणाली को बनाने वालों में से एक गिलोम लाम्प्ल, कहते हैं, "मिसाल के तौर पर, अगर आप "कुत्ता" और "बिल्ली" जैसे शब्दों को लें, तो आप पाएंगे कि वेक्टर के रूप में ये दोनों शब्द एक दूसरे के बहुत करीब होंगे क्योंकि ये दोनों मिलती जुलती चीजों का विवरण देते हैं। अगर आप मेड्रिड, लंदन, पेरिस जैसे नामों को ले लें जो सभी यूरोपीय राजधानियों के नाम हैं, यहां भी वही बात होगी।"


फिर इन भाषाई नक्शों को अल्गोरिदम की मदद से एक दूसरे से जोड़ा जा सकता है। ये प्रक्रिया शुरू में तो प्राथमिक ही रह पाएगी पर इसे धीरे-धीरे तब तक बारीक किया जा सकता है जब तक पूरे के पूरे वाक्य को बिना ज्यादा गलतियों के मिलाया जा सके। लाम्प्ल ने बताया कि अभी से जो नतीजे आ रहे हैं वो आशाजनक हैं। उन्होने जानकारी दी कि अंग्रेजी और रोमानियाई भाषाओं के जोड़े के लिए, फेसबुक की अभी की मशीनी अनुवाद प्रणाली या तो शब्द वेक्टर प्रणाली के जितनी ही कारगर है या उस से बस थोड़ा सी खराब। लेकिन अंग्रेजी-उर्दू जैसे ज्यादा दुर्लभ भाषाई जोड़े के लिए शब्द वेक्टर प्रणाली अभी से श्रेष्ठतर है, क्यूंकि फेसबुक की पारंपरिक प्रणाली में इन भाषाओं के ज्यादा समानांतर टेक्स्ट नहीं हैं।


पर क्या इस नए तरीके से और भी भाषाओं के बीच काम करना संभव है, जैसे, मान लीजिये बास्क को अमेजॉन के किसी कबीले की भाषा में अनुवाद करना? लाम्प्ल कहते हैं कि सैद्धांतिक तौर पर ये संभव है, लेकिन व्यावहारिक तौर पर इसके लिए बड़ी मात्रा में लिखित टेक्स्ट की आवश्यकता होगी, जो कि अमेजॉन की कबीलाई भाषाओं में नहीं मिलेंगे। "सिर्फ सैंकड़ों वाक्यों से काम नहीं चलेगा, लाखों, करोड़ों वाक्यों की जरूरत पड़ेगी।"


फ्रांस के सीएनआरएस राष्ट्रीय वैज्ञानिक केंद्र के विशेषज्ञ कहते हैं कि लाम्प्ल ने फेसबुक के लिए जो तरीका अपनाया है उससे उपयोगी नतीजे निकल सकते हैं, चाहे उससे परिपूर्ण अनुवाद हो या न हो। सीएनआरएस की लैटिस प्रयोगशाला के थियेरी पोबो ने शब्द वेक्टर प्रणाली को एक "वैचारिक क्रांति" बताया लेकिन सवाल ये है कि इस तरीके से किस स्तर के प्रदर्शन की उम्मीद की जा सकती है, ये तरीका मूल टेक्स्ट का एक अंदाजा तो दे सकता है, लेकिन ये हर बार एक अच्छा अनुवाद देगा ये अभी साबित नहीं हो पाया है।


Popular posts from this blog

जुनूनी एंकर पत्रकार रोहित सरदाना की कोरोना से मौत

'कम्युनिकेशन टुडे' ने पूरा किया 25 साल का सफ़र, मीडिया शिक्षा की 100 वर्षों की यात्रा पर विशेषांक

हम लोग गिद्ध से भी गए गुजरे हैं!