आपने शायद ऐसे ऐप्स देखे हैं जो दावा करते हैं कि आपकी बिल्ली क्या कह रही है। लेकिन क्या वे वास्तव में आपकी बिल्ली की म्याऊ का अंग्रेजी में अनुवाद कर सकते हैं? संक्षिप्त उत्तर हां, की तरह है। यह मुश्किल है कि प्रत्येक बिल्ली की "भाषा" कितनी अनोखी है, लेकिन वे आधुनिक तकनीक के साथ बहुत करीब हो सकते हैं।

MeowTalk जैसे कैट अनुवाद एप्लिकेशन भाषण मान्यता के एक प्रकार का उपयोग करते हैं जो मशीन सीखने पर जोर देता है। आइए करीब से देखें।

भाषण पहचान और मशीन लर्निंग

मैरी थेरेसा मैकलीन /पिक्साबे

स्पीच रिकग्निशन भाषण को रिकॉर्ड करके और ऑडियो को डिजिटल डेटा फ़ाइल में बदलकर काम करता है। यह डेटा और पिच और वॉल्यूम जैसे डेटा को इंगित करता है क्योंकि ऐप विश्लेषण कर सकता है और अर्थ के साथ मेल खा सकता है। डीपीए माइक्रोफोन बताते हैं कि ये डेटा पॉइंट्स बैकग्राउंड साउंड्स और किसी शब्द के बोलने के तरीके के आधार पर बहुत अलग दिख सकते हैं।

हम कभी-कभी आवाज पहचानने की अनुमति देते हैं, लेकिन यह प्रौद्योगिकी का एक अविश्वसनीय पराक्रम है। विशेष रूप से यह देखते हुए कि मानव भाषण कितना जटिल है। जैसा वैज्ञानिक बताते हैं, प्रत्येक शब्द में एक दूसरे में मिश्रित या "ध्वनि" की एक विस्तृत श्रृंखला शामिल है। भाषण समझने के लिए कंप्यूटर प्राप्त करना बहुत मुश्किल है। बिल्ली की आवाज़ की नई सीमा और भी कठिन होगी।

एप्लिकेशन जो वाक् पहचान का उपयोग करते हैं, उन्हें एक शब्दकोष की "शब्दावली" के साथ क्रमादेशित किया जाता है। ऐप तब आपके भाषण को उसकी डेटा-शब्दावली में निकटतम विकल्प से मेल खाता है।

जब यह एक गलती करता है, तो आप इसे सही करते हैं, और यह अगली बार उस डेटा को बचाता है। यह मशीन लर्निंग का हिस्सा है। यह है कि कैसे एक कार्यक्रम भाषण को पहचानना सीखता है, भले ही यह उस डेटासेट के समान न हो जो इसके साथ शुरू हुआ था।

सम्बंधित: मशीन लर्निंग एल्गोरिदम क्या हैं? यहाँ है वे कैसे काम करते हैं

आवाज पहचान में अभी भी समस्याएं हैं, विशेष रूप से भाषण बाधाओं और लहजे के साथ। कुछ कंपनियां हैं इन मुद्दों को दूर करने के लिए मशीन लर्निंग में सुधार, हालांकि। समय के साथ, मशीन लर्निंग वाक् पहचान को एक शक्तिशाली उपकरण में बदल सकती है।

इस तरह भाषण मान्यता मनुष्यों के लिए काम करती है। लेकिन क्या यह बिल्लियों के लिए काम करता है?

भाषण मान्यता बनाम मेव मान्यता

एरियाना सुआरेज़ /unsplash

सबसे पहले, हमें यह समझने की आवश्यकता है कि "मैं भूखा हूँ" के रूप में एक निश्चित प्रकार के म्याऊ का अनुवाद करना मानव भाषण का विश्लेषण करने से अलग क्यों है। समस्या ज्यादातर यह है कि बिल्ली संचार आसन जैसे अशाब्दिक संकेतों पर अधिक निर्भर करता है। एक और समस्या एक सार्वभौमिक "बिल्ली भाषा" की अनुपस्थिति है।

के मुताबिक ASPCA, वयस्क जंगली बिल्लियाँ कभी भी एक-दूसरे पर हाथ नहीं उठातीं, केवल लोगों पर। द्वारा अन्य शोध द ह्यूमन सोसाइटी कहते हैं कि वे आवाज़ें "वैक्यूम में नहीं होती हैं।" हमें उनकी व्याख्या बॉडी लैंग्वेज और अन्य संदर्भों के साथ करनी चाहिए। कई मामलों में, ये मूक संकेत एक म्याऊ के बीच का एकमात्र अंतर है जिसका अर्थ है "मैं भूखा हूँ" और एक का अर्थ है "मैं खेलना चाहता हूँ।"

इस समस्या को जोड़ते हुए, किसी भी दो बिल्लियों की एक ही भाषा नहीं है। बिल्लियाँ अपने मालिकों के लिए व्यक्तिगत "भाषाएं" विकसित करती हैं। ये आंशिक रूप से मालिक की आवाज़ की नकल पर और आंशिक रूप से बिल्ली के व्यक्तित्व पर आधारित हैं। कोई भी दो बिल्लियाँ एक ही ध्वनि नहीं करती हैं, यहाँ तक कि एक ही चाह या आवश्यकता को व्यक्त करते समय भी। तो उन सभी के लिए एक ऐप की स्पीच शब्दावली का अनुवाद कैसे हो सकता है?

बिल्लियों के लिए लचीली मशीन सीखना

ध्वनियों का उपयोग करने के लिए नि: शुल्क /unsplash

हालांकि कुछ वर्चुअल असिस्टेंट पसंद करते हैं ओटो स्वर और भावना को समझने की कोशिश, भाषण की पहचान अभी भी अशाब्दिक संकेतों पर भयानक है। लेकिन इसका मतलब यह नहीं है कि उन्हें व्याख्या करना असंभव है।

MeowTalk इन मुद्दों को दूर करने में मदद करने के लिए अधिक लचीली तरह की मशीन सीखने का उपयोग करता है।

डाउनलोड: MeowTalk के लिए एंड्रॉयड | आईओएस (नि: शुल्क)

मेवॉकल को जेवियर सांचेज ने बनाया था, जो एलेक्सा टीम में भी काम करते थे। उन्होंने स्मार्ट कॉलर की ओर एक कदम के रूप में ऐप की कल्पना की। ये कॉलर मानव ध्वनियों में बिल्ली की आवाज़ का अनुवाद करेंगे, जटिल मशीन सीखने की रणनीतियों पर ड्राइंग करेंगे ताकि मनुष्यों को अपनी बिल्लियों के लिए बेहतर समझ और देखभाल मिल सके।

मेवॉक टीम ने प्रत्येक बिल्ली के लिए अधिक विशिष्ट प्रोफाइल बनाकर विशिष्टता मुद्दों की भरपाई की। ऐप में, आप प्रत्येक बिल्ली को अलग से पंजीकृत करते हैं। विज्ञान नॉर्वे ऐसी रिपोर्टें जो बिल्ली के बच्चे की तुलना में वयस्क बिल्ली के बच्चे को अलग करती हैं, इसलिए ऐप बिल्ली के जन्मदिन के लिए भी पूछता है। प्रत्येक प्रोफ़ाइल बिल्ली के लिए एक अद्वितीय डेटा नेटवर्क उत्पन्न करता है, जिसमें मशीन सीखने में थोड़ी सी गहराई शामिल होती है।

सम्बंधित: गहन शिक्षा बनाम मशीन लर्निंग बनाम AI: वे एक साथ कैसे जाते हैं?

शब्दावली के लिए, MeowTalk अपने डेटासेट में 10 साउंड प्रोफाइल से शुरू होता है। प्रत्येक का एक अलग अर्थ जुड़ा होता है, जैसे "खुश" या "शिकार"। जब ऐप ध्वनि सुनता है और गलत हो जाता है, तो आप इसे सही कर सकते हैं या एक नई व्याख्या बना सकते हैं।

CATSOUNDS डेटा से एकत्र हुए अकवेलन

आधार सही शब्दावली को नई ध्वनि के साथ बदलने के लिए एप्लिकेशन को बताता है।

उदाहरण के लिए, आप एक लंबी यॉर्ल के बजाय छोटी चिड़ियों को "शिकार" से मैच करने के लिए ऐप बता सकते हैं। इस तरह का सुधार एक से अधिक ध्वनियों को जोड़ने के लिए अधिक उपयोगी है, जिस तरह से भाषण मान्यता डो, जो कि ऐप को एक लंबी यॉर्ल और शॉर्ट चिरप्स बताने के समान है। दोनों मतलब "मदर कॉल।"

स्पीच रिकग्निशन ऐप्स में मशीन लर्निंग आमतौर पर इस प्रकार की ओवरराइटिंग का विरोध करती है। यह सिरी को सिखाने की कोशिश करने जैसा होगा कि जब आप कहते हैं "प्रौद्योगिकी ब्लॉग," आप वास्तव में "नाशपाती" का मतलब है। लेकिन मशीन लर्निंग का अधिक लचीला रूप जो मेवॉक का उपयोग करता है, इस सुधार को अधिक संभाल सकता है सरलता।

एक नई व्याख्या बनाना एक अर्थ जोड़ता है जो पहले एनकोडेड नहीं था। उदाहरण के लिए, यदि आपकी पसंदीदा खिलौना के लिए आपकी बिल्ली को एक विशिष्ट कॉल है, तो आप एक विकल्प के रूप में "मुझे अपना माउस चाहिए" जोड़ सकते हैं। यह आपके स्वतः पूर्ण शब्दकोश में एक शब्द जोड़ने के समान है।

सम्बंधित: एंड्रॉइड पर अपनी खुद की स्वतः पूर्ण शब्दों को कैसे परिभाषित करें

समय के साथ, आप अपनी बिल्ली के लिए एक अत्यधिक व्यक्तिगत भाषण प्रोफ़ाइल विकसित कर सकते हैं। आखिरकार, यह पालतू जानवरों के लिए उपयोगी होने या व्यवहार संबंधी मुद्दों को हल करने के लिए पर्याप्त परिष्कृत हो सकता है। यदि और कुछ नहीं, तो यह बिल्ली के मालिकों को अपने पालतू जानवरों के प्रति अधिक चौकस रहने में मदद करता है।

फैसला: क्या कैट ट्रांसलेशन ऐप्स काम करते हैं?

अंत में, "बिल्ली अनुवाद" अभी भी ऐप सिखाने वाले उपयोगकर्ता पर बहुत अधिक निर्भर करता है कि उनकी बिल्ली कैसे बात करती है। शायद यह हमेशा मामला होगा क्योंकि प्रत्येक बिल्ली का संचार कितना अनूठा है।

लेकिन तथ्य यह है कि मशीन लर्निंग अब तक आया है कि डेवलपर्स भी आंशिक रूप से सफल हो सकते हैं यह अविश्वसनीय है। मशीन लर्निंग और एआई ब्रेकनेक गति से आगे बढ़ रहे हैं, और हम यह देखने के लिए इंतजार नहीं कर सकते कि वे आगे कहां जाते हैं।

ईमेल
संबंधित विषय
  • प्रौद्योगिकी समझाया
  • भाषा सीखना
  • मशीन लर्निंग
लेखक के बारे में
नताली स्टीवर्ट (16 लेख प्रकाशित)

नताली स्टीवर्ट MakeUseOf के लिए एक लेखक है। वह पहली बार कॉलेज में प्रौद्योगिकी में रुचि रखती हैं और विश्वविद्यालय में मीडिया लेखन के लिए एक जुनून विकसित किया है। नताली का ध्यान तकनीक पर है जो सुलभ और उपयोग में आसान है, और वह उन ऐप्स और उपकरणों से प्यार करती है जो रोजमर्रा के लोगों के लिए जीवन को सरल बनाते हैं।

नताली स्टीवर्ट से अधिक

हमारे न्यूज़लेटर की सदस्यता लें

टेक टिप्स, रिव्यू, फ्री ईबुक और एक्सक्लूसिव डील्स के लिए हमारे न्यूज़लेटर से जुड़ें!

एक और कदम…!

कृपया हमें आपके द्वारा भेजे गए ईमेल में अपने ईमेल पते की पुष्टि करें।

.