Google ने GitHub पर अपना Lyra ऑडियो कोडेक बीटा स्रोत कोड जारी किया है, जिससे सभी डेवलपर्स के लिए अविश्वसनीय गुणवत्ता कम-बिटरेट ऑडियो प्रसंस्करण उपलब्ध है। कोडेक एम्बेडेड और बैंडविड्थ प्रतिबंधित स्थितियों में सबसे अधिक उपयोगी है जहां यथासंभव डेटा को सहेजने की आवश्यकता होती है।
Lyra: लगभग कुछ भी नहीं कभी अच्छा लग रहा था
ऑडियो कोडेक संभवतम न्यूनतम डेटा दर के साथ सबसे प्राकृतिक-ध्वनि वाले भाषण प्रदान करने के सिद्धांत पर काम करता है। यह 3 केबीपीएस के साथ बिट्रेट्स के साथ ऑडियो प्रजनन के लगभग भयानक स्तर बनाने में सफल होता है। Google अपने डुओ ऐप में पहले से ही रियल-टाइम लाइरा कम्प्रेशन का उपयोग करता है, हालांकि आपको नियमित बैंडविड्थ ऑडियो से अंतर महसूस नहीं करने के लिए दोषी नहीं ठहराया जाएगा।
यह दिखाने के लिए कि अन्य कोडेक्स की तुलना में Lyra कितना बेहतर है, Google इसके माध्यम से उदाहरण प्रदान करता है ब्लॉग भेजा अन्य 3 और 6 केबीपीएस विकल्पों के लिए मशीन लर्निंग संपीडित कोडेक की तुलना करना।
यह एक रात का अंतर है, और डेवलपर्स को इन उपकरणों पर दुनिया को संचार की गुणवत्ता में सुधार करने में एक महत्वपूर्ण ड्राइवर दिया जाएगा जहां बैंडविड्थ दुर्लभ है। यह उभरते बाजारों में नए एप्लिकेशन बनाने के लिए देख रहे डेवलपर्स के लिए एक उत्कृष्ट प्रेरक भी है, जो इस वर्ष Google को कवर करने के लिए निश्चित है
मुफ्त आभासी Google I / O ऑनलाइन सम्मेलन.बीटा स्रोत कोड वर्तमान में 64-बिट आर्म डिवाइसों को ध्यान में रखकर बनाया गया है, हालांकि उदाहरण 64-बिट x86 लिनक्स सिस्टम पर भी चलेंगे। स्रोत कोड पूरी तरह से प्रलेखित प्रदान किया गया है, हालांकि यह बीटा में है, और GitHub पृष्ठ इंस्टॉलेशन निर्देश और आर्म 64-बिट लक्ष्य के लिए लिनक्स पर लाइरा बनाने का तरीका प्रदान करता है।
Lyra बीटा स्रोत कोड प्राप्त करने के लिए, पर जाएँ लाइरा गिटहब पेज.
लाइरा कैसे काम करती है?
जबकि वास्तविक प्रक्रिया लाइरा का उपयोग मशीन लर्निंग मॉडल का एक अविश्वसनीय रूप से जटिल संयोजन है जिसे प्रशिक्षित किया गया है हजारों घंटे के भाषण डेटा और मौजूदा ऑडियो कोडेक प्रौद्योगिकी के अनुकूलन, सिद्धांत काफी है सरल।
प्रत्येक 40ms, सुविधाओं को भाषण से लिया जाता है और 3kbps तक संकुचित किया जाता है। ये विशेषताएं मानव श्रवण भाषण प्रतिक्रिया के निकटतम आवृत्ति स्पेक्ट्रम में भाषण ऊर्जा बिंदुओं का प्रतिनिधित्व करती हैं - जब हम किसी को बोलते हैं तो हमें पहचानने और समझने की आवश्यकता होती है।
ल्यारा को क्या खास बनाता है इसका प्रमुख हिस्सा यह है कि यह इस जानकारी का उपयोग कैसे करता है:
हालांकि पारंपरिक पैरामीट्रिक कोडेक्स, जो केवल भाषण महत्वपूर्ण मापदंडों से निकालते हैं जो तब हो सकते हैं प्राप्त छोर पर सिग्नल को फिर से बनाने, कम बिटरेट प्राप्त करने के लिए उपयोग किया जाता है, लेकिन अक्सर ध्वनि रोबोट और अप्राकृतिक लगता है। इन कमियों ने उच्च गुणवत्ता वाले ऑडियो जनरेटिव मॉडल की एक नई पीढ़ी का विकास किया है न केवल संकेतों के बीच अंतर करने में सक्षम होने से क्षेत्र में क्रांति हुई, बल्कि पूरी तरह से नया भी उत्पन्न हुआ लोग।
ट्रांसमिशन के बाद, लायरा ने इस प्रक्रिया का उपयोग करके जो कुछ भी याद नहीं है, उसे भरने के द्वारा तरंग का पुनर्निर्माण किया, जबकि किसी भी तरह से कम्प्यूटेशनल रूप से जटिल नहीं है।
एक ओर, यह एक तकनीकी चमत्कार है जो लगभग कहीं भी चलेगा। दूसरी ओर, मैं अभी भी 100% आश्वस्त नहीं हूं कि यह जादू टोना नहीं है।
Google डुओ सबसे अच्छा वीडियो कॉलिंग ऐप में से एक है। इसमें बहुत सारी विशेषताएं हैं, और यहां वे हैं जो हमें लगता है कि आपको वास्तव में उपयोग करना चाहिए।
आगे पढ़िए
- तकनीक सम्बन्धी समाचार
- गूगल
- एंड्रॉयड
- यंत्र अधिगम
इयान बकले बर्लिन, जर्मनी में रहने वाले एक स्वतंत्र पत्रकार, संगीतकार, कलाकार और वीडियो निर्माता हैं। जब वह लेखन या मंच पर नहीं है, तो वह पागल वैज्ञानिक बनने की उम्मीद में DIY इलेक्ट्रॉनिक्स या कोड के साथ छेड़छाड़ कर रहा है।
हमारे न्युजलेटर की सदस्यता प्राप्त करें
टेक टिप्स, रिव्यू, फ्री ईबुक और एक्सक्लूसिव डील्स के लिए हमारे न्यूज़लेटर से जुड़ें!
एक और क़दम…!
कृपया हमें आपके द्वारा भेजे गए ईमेल में अपने ईमेल पते की पुष्टि करें।