विज्ञापन

एक ऐसी दुनिया की कल्पना करें जहां बहरे और सुनने के बीच की बाधाएं दूर हो गई हैं। एक ऐसी दुनिया, जहां बातचीत ध्वनि सुनने वालों के बीच, और जो लोग नहीं करते हैं, के बीच द्रव प्रवाहित होती है। क्या निकट भविष्य में वह दुनिया वास्तविक बन सकती है?

जून में वापस, बर्गस स्कूल ऑफ कम्युनिकेशन में मार्केटिंग छात्रों के एक समूह ने Google जेस्चर नामक एक काल्पनिक उत्पाद के लिए एक अवधारणा वीडियो विकसित किया। उत्पाद में एक पहनने योग्य कलाई बैंड और एक मोबाइल ऐप शामिल था जो साइन भाषा करने वाले एक बहरे व्यक्ति की मांसपेशियों की गतिविधियों को पढ़ने के लिए इलेक्ट्रोमोग्राफी का उपयोग करता था। सिस्टम ने फिर उन संकेतों को ऐप में भेज दिया, जिन्होंने उन सिग्नलों को डिजीटल आवाज़ में अनुवादित किया और व्यक्ति के लिए बोलेंगे।

नकली मार्केटिंग वीडियो देखना काफी रोमांचक था। इतना रोमांचक, वास्तव में, कि प्रमुख तकनीकी साइटें जैसे कि Mashable, Slashgear और अन्य ने मूल रूप से उत्पाद को वास्तविक घोषित किया, और फिर बाद में दावे को पढ़कर अपनी गलती के लिए माफी मांगनी पड़ी। यह देखते हुए कि वास्तव में एक अजीब त्रुटि थी है Google Gesture Search [नो लॉन्ग अवेलेबल] नामक एक Google उत्पाद, जिससे आप संपर्क, बुकमार्क और अधिक खोज करने के लिए अपने मोबाइल स्क्रीन पर इशारे कर सकते हैं।

instagram viewer

भले ही, बर्ग्स छात्रों की अवधारणा ने एक उल्लेखनीय विचार प्रस्तुत किया, जिससे यह सवाल पैदा हो गया - क्या वास्तविक के लिए इस तरह का ऐप बनाना संभव हो सकता है?

क्या सांकेतिक भाषा का अनुवाद संभव है?

तकनीकी स्तर पर मार्केटिंग की अवधारणा को खारिज करने से पता चलता है कि इलेक्ट्रोमोग्राफी (ईएमजी) का उपयोग "सांकेतिक" भाषा के रूप में किया गया है, जो वास्तव में बिल्कुल नहीं है। 2009 के रूप में वापस, वाशिंगटन विश्वविद्यालय के शोधकर्ता मांसपेशियों के आंदोलनों को डिकोड करने और उन्हें वास्तविक बांह और हाथ के इशारों में बदलने के लिए कई ईएमजी सेंसर का उपयोग करने में सक्षम थे।

शोधकर्ताओं ने वास्तव में एक पूर्ण "जेस्चर रिकग्निशन लाइब्रेरी" का निर्माण किया, जो यह दर्शाता है कि कौन से मांसपेशी संकेतों ने किस संकेत का प्रतिनिधित्व किया। अनुसंधान साबित करता है कि इस तरह की तकनीक उपलब्ध है और बर्ग छात्रों की कल्पना के आवेदन के प्रकार में लागू करने के लिए तैयार है।

तो क्या किसी ने वास्तव में इसे पूरा किया है? यदि नहीं, तो कोई ऐसा क्यों नहीं कर रहा है, और साइन लैंग्वेज के माध्यम से दुनिया के किसी भी व्यक्ति के साथ संवाद करने की क्षमता के साथ बधिर और श्रवण प्रदान कर रहा है?

द रियल-टाइम ट्रांसलेशन टेक्नोलॉजी का भविष्य

सच्चाई यह है कि कोई वास्तव में ऐसी वास्तविक समय की सांकेतिक भाषा अनुवाद तकनीक पर काम कर रहा है।

साइन-LANGUAGE1

SpeechTrans [Broken URL Removeed] नामक एक कंपनी है, जो की सीमाओं को आगे बढ़ा रही है अनुवाद तकनीकें Google अनुवाद भूल जाओ: एक सटीक, त्वरित अनुवाद पाने के 3 तरीकेचाहे आप नौकरी या अपार्टमेंट के लिए आवेदन करने की योजना बना रहे हों, या अपने वेब पेज का अनुवाद करना चाह रहे हों, आपको विदेशी भाषा के साथ भी चीजों को प्राप्त करने की आवश्यकता है। अधिक पढ़ें हाल के वर्षों में। स्पीचट्रांस आज बाजार पर सबसे उल्लेखनीय वास्तविक समय की अनुवाद सेवाओं में से कुछ का उत्पादन करने के लिए प्रौद्योगिकी भागीदारों के साथ काम करता है। ये ऐसी सेवाएं हैं जो टेक्स्ट चैट से टेक्स्ट चैट, वॉयस टू टेक्स्ट और यहां तक ​​कि रियल-टाइम वॉयस-से-वॉयस भाषा में मोबाइल फोन और डेस्कटॉप एप्लिकेशन के माध्यम से अनुवाद करती हैं।

यह पता लगाने के लिए कि क्या निकट भविष्य में एक साइन-लैंग्वेज तकनीक वास्तविकता बन सकती है, मेकयूसेओफ ने इस ग्राउंडब्रेकिंग नए पर चर्चा करने के लिए स्पीचट्रान्स के सीईओ जॉन फ्रेई और सीओओ यान एयूआरबैक के साथ बैठ गए। अनुवाद तकनीक इन 5 भाषा अनुवाद वेबसाइटों के साथ किसी भी भाषा को समझेंतकनीक ने दुनिया को एक छोटी जगह बना दी है। इस ग्रह के हर हिस्से के लोग एक ही उपकरण का उपयोग करते हैं, कुछ एक ही वेबसाइटों पर जाते हैं, और ऑनलाइन विभिन्न चैट रूम में मिश्रण करते हैं। ... अधिक पढ़ें और भविष्य में यह कितना दूर हो सकता है।

एक साइन लैंग्वेज ट्रांसलेशन ऐप विकसित करना

muo: क्या यह संभव है कि जिस तरह से बर्ग के छात्रों ने इस Google इशारे की अवधारणा वीडियो में चित्रित की है, उसी तरह से साइन लैंग्वेज टू स्पीच ट्रांसलेशन करना संभव हो?

जॉन फ्रे - स्पीचट्रांस के सीईओ

जॉन: मैं कहूंगा कि प्रौद्योगिकी विकसित करने के लिए उपलब्ध है। वर्तमान में हम हार्डवेयर और सॉफ्टवेयर के संदर्भ में Microsoft और इंटेल के साथ काम कर रहे हैं। हम साइन लैंग्वेज को पहचानने के लिए उस तकनीक का उपयोग करने की क्षमता की कल्पना करते हैं और फिर उसे भाषण और ऑडियो आउटपुट में परिवर्तित करते हैं।

muo: आप अभी उस तकनीक को विकसित करने के लिए सक्रिय रूप से काम कर रहे हैं?

यान: तो, एक ग्राहक था जो हमारे सॉफ्टवेयर का उपयोग कर रहा था, और यह अद्भुत था कि अगर हम इसे संशोधित कर सकें, तो यह अच्छा होगा कि जो लोग सुन-सुन रहे हैं वे इसका उपयोग कर सकें जब वे व्यक्ति में हों, या जब वे टेलीफ़ोन के लिए TTY प्रकार की आवश्यकता के बिना साइन लैंग्वेज की आवश्यकता के बिना संवाद करने के लिए, हमारे ऐप से टेलीफोन कॉल करें कहता है। हमने उस उत्पाद को विकसित किया, और माइक्रोसॉफ्ट और इंटेल से फंडिंग के साथ, हमने विंडोज 8.1 पर बिगड़ा सुनवाई के लिए स्पीचट्रांस लॉन्च किया, जो साइन लैंग्वेज की आवश्यकता को हटा देता है।

muo: "इन-पर्सन" ऐप कैसे काम करता है?

यान: एक श्रवण मोड है, और एक इनपुट विधा है। इसलिए, जब कोई आपसे बात कर रहा होता है, तो आप सुन मोड पर रख देते हैं और यह कुछ भी टाइप कर देता है जो वे पाठ में स्क्रीन पर कह रहे हैं। फिर, जब आप वापस प्रतिक्रिया करते हैं, तो आप इसे टाइप करते हैं और फिर यह ज़ोर से बोलता है कि आप क्या टाइप करते हैं। टेलीफोन के साथ, आप किसी भी व्यक्ति का फ़ोन नंबर डायल करते हैं, और जब वे फ़ोन का उत्तर देते हैं, तो यह एक त्वरित संदेश की तरह हो जाता है। वे जो भी बोलते हैं, आप आईएम के रूप में प्राप्त करते हैं। फिर, आप जो भी टाइप करते हैं वह टेलीफोन के माध्यम से जोर से बोला जाता है। यह पहला चरण है।

निकट भविष्य संकेत भाषा अनुवाद

muo: निकट भविष्य में लोग किन तकनीकों को देखने की उम्मीद कर सकते हैं? अगला चरण क्या है?

जॉन: हम कल्पना करते हैं - किसी ऐसे व्यक्ति के लिए जो केवल सांकेतिक भाषा का उपयोग करने की क्षमता रखता है - ऐसा करने में सक्षम होने के लिए एक डिवाइस जैसे कि फोन, पीसी या लैपटॉप के सामने। इंटेल में एक नया कैमरा सिस्टम है, और Microsoft Kinect के साथ भी करता है, जो इशारा पहचान करता है।

muo: यह बर्ग के छात्रों द्वारा दी गई आर्म बैंड अवधारणा से बेहतर कैसे है?

साइन-language3

यान: मूल रूप से, हमारा काम एक ऐसे तरीके से होने जा रहा है, जिसमें आपको अपनी बांह पर कुछ भी डालने की आवश्यकता नहीं है। यह आपके हाथ पर 64 अंक पहचानता है। हम इंटेल के RealSense कैमरे के बीटा संस्करण का उपयोग कर रहे हैं। इसलिए न केवल हम सभी साइन लैंग्वेज और साइन लैंग्वेज की कई अलग-अलग बोलियों को पहचान पाएंगे, बल्कि हम भावनाओं, चेहरे के भावों और अन्य छोटी बारीकियों को पहचानने में सक्षम हो सकते हैं और फिर उसे शब्दों में बदल सकते हैं कुंआ।

आपको किसी भी दस्ताने या कुछ भी पहनने की आवश्यकता नहीं है। हम उस बाजार पर विशेष रूप से ध्यान केंद्रित कर रहे हैं क्योंकि हम सामान्य रूप से लोगों की मदद करना पसंद करते हैं। हम न केवल उन लोगों की मदद करना चाहते हैं, जो कई अलग-अलग भाषाओं में बोलना चाहते हैं, बल्कि हम ऐसे लोगों की भी मदद करना चाहते हैं, जो किसी भी भाषा में नहीं बोल सकते। तकनीक मौजूद है, और कोई कारण नहीं है कि उनका जीवन स्तर हमारी तुलना में अलग होना चाहिए।

जॉन: यह एक व्यवहार्य अवधारणा है। यह एक अलग इनपुट और आउटपुट है। भविष्य की कुछ तकनीकों के बारे में हमने कुछ बातचीत जो Microsoft के साथ की है, वह है कोई व्यक्ति वास्तव में अपनी गर्दन में एक माइक्रोचिप लगा सकता है, और यह सीधे उनके दिमाग की नली को पढ़ता है पैटर्न। इसलिए यदि आप ऐसे लोगों की मदद कर रहे हैं जो संवाद नहीं कर सकते हैं, तो हम वास्तव में चरण तीन तैनाती के रूप में कुछ ऐसा ही देखेंगे।

पिछले साल, छात्रों का एक समूह था जो एक दस्ताने के काम के प्रोटोटाइप के साथ आया था जिसे कंप्यूटर में प्लग किया गया था। दस्ताने के साथ आपके द्वारा किए गए इशारों को तब पहचाना जाएगा और सांकेतिक भाषा में परिवर्तित किया जाएगा। इसलिए वे पहले से ही वर्तमान तकनीक के साथ क्षमता रखते हैं।

हमारी दृष्टि यह है कि हम वास्तव में सहायक उपकरण नहीं बनाना चाहते हैं जैसे कि आर्म बैंड जो आपको लगाना है। यह उनके लिए केवल प्राकृतिक और मुक्त प्रवाह होना चाहिए [सांकेतिक भाषा में काम करने वाले लोग] इसे अपने वीडियो कैमरे के सामने करने के लिए। संचार में लोग जो कहते हैं उसका 90% वास्तव में उनकी शारीरिक भाषा में होता है। चेहरे की पहचान, हावभाव और भावनाओं का उपयोग करने में सक्षम होने के कारण, हम उस डेटा का उपयोग नहीं कर पाएंगे यह सुनिश्चित करने के लिए कि अनुवाद और जो वे बताने की कोशिश कर रहे हैं वह सही में व्यक्त किया गया है प्रपत्र।

muo: क्या उस सांकेतिक भाषा मान्यता प्रौद्योगिकी के 5 साल के भीतर इंटेल है?

जॉन: इंटेल के पास निश्चित रूप से बहुत सारे संसाधन उपलब्ध हैं। उनकी तकनीक और उनका सॉफ्टवेयर एक ऐसी गति के साथ आ रहा है जहां हम इसे बहुत जल्दी कर सकते हैं।

muo: क्या आपके पास एक समय सीमा है जब आप इस तकनीक को बाजार में लाने की उम्मीद कर रहे हैं?

जॉन: साइन लैंग्वेज के लिए, यह लगभग 12 से 18 महीने है।

muo: क्या किसी और के पास साइन लैंग्वेज ट्रांसलेशन के लिए ऐसा कुछ और है?

जॉन: मैंने आईबीएम के एक YouTube वीडियो को एक प्रोटोटाइप बनाते हुए देखा, जहां कोई सांकेतिक भाषा में काम कर रहा था, लेकिन यह अवधारणा का प्रमाण था और इसे केवल तीन या चार शब्द पसंद थे जिन्हें उसने मान्यता दी थी। हमारे पास पाँच सौ हज़ार से अधिक शब्द हैं, जिन्हें हम इसके साथ जोड़ने की योजना बना रहे हैं, इसलिए यह इसे पूरे दूसरे स्तर पर ले जाएगा।

निष्कर्ष

जबकि बर्गस के छात्रों ने जो सपना देखा था, वह भविष्य का सांकेतिक भाषा अनुवाद ऐप नहीं बन सकता है, लेकिन इसका मतलब यह नहीं है कि ऐसी अवधारणा नहीं होगी। स्पीचट्रान, इंटेल और माइक्रोसॉफ्ट में जो काम किया गया है, वह साबित करता है कि साइन लैंग्वेज ट्रांसलेशन का कुछ ही सालों में असली तकनीक बनना लगभग तय है। इसकी सबसे अधिक संभावना है कि इसमें बोझिल आर्म बैंड शामिल नहीं हैं, लेकिन इसके बजाय एक विशेष वीडियो कैमरा और एक मोबाइल ऐप से अधिक कुछ भी नहीं है।

हावभाव और चेहरे की पहचान के जादू के माध्यम से, भविष्य का यह सांकेतिक भाषा अनुवाद ऐप हजारों लोगों के लिए पारस्परिक संचार में पूरी तरह से क्रांति लाने का वादा करता है बहरा विकलांगों के लिए मैक और एप्पल डिवाइस उपयोगकर्ताओं के लिए 5 सर्वश्रेष्ठ संसाधन अधिक पढ़ें या दुनिया भर के सभी व्यक्तियों को सुनने में कठिन।

रयान के पास इलेक्ट्रिकल इंजीनियरिंग में बीएससी की डिग्री है। उन्होंने ऑटोमेशन इंजीनियरिंग में 13 साल, आईटी में 5 साल काम किया है, और अब एक एप्स इंजीनियर हैं। MakeUseOf के पूर्व प्रबंध संपादक, उन्होंने डेटा विज़ुअलाइज़ेशन पर राष्ट्रीय सम्मेलनों में बात की और राष्ट्रीय टीवी और रेडियो पर चित्रित किया गया है।