Google ने GitHub पर अपना Lyra ऑडियो कोडेक बीटा स्रोत कोड जारी किया है, जिससे सभी डेवलपर्स के लिए अविश्वसनीय गुणवत्ता कम-बिटरेट ऑडियो प्रसंस्करण उपलब्ध है। कोडेक एम्बेडेड और बैंडविड्थ प्रतिबंधित स्थितियों में सबसे अधिक उपयोगी है जहां यथासंभव डेटा को सहेजने की आवश्यकता होती है।

Lyra: लगभग कुछ भी नहीं कभी अच्छा लग रहा था

ऑडियो कोडेक संभवतम न्यूनतम डेटा दर के साथ सबसे प्राकृतिक-ध्वनि वाले भाषण प्रदान करने के सिद्धांत पर काम करता है। यह 3 केबीपीएस के साथ बिट्रेट्स के साथ ऑडियो प्रजनन के लगभग भयानक स्तर बनाने में सफल होता है। Google अपने डुओ ऐप में पहले से ही रियल-टाइम लाइरा कम्प्रेशन का उपयोग करता है, हालांकि आपको नियमित बैंडविड्थ ऑडियो से अंतर महसूस नहीं करने के लिए दोषी नहीं ठहराया जाएगा।

यह दिखाने के लिए कि अन्य कोडेक्स की तुलना में Lyra कितना बेहतर है, Google इसके माध्यम से उदाहरण प्रदान करता है ब्लॉग भेजा अन्य 3 और 6 केबीपीएस विकल्पों के लिए मशीन लर्निंग संपीडित कोडेक की तुलना करना।

यह एक रात का अंतर है, और डेवलपर्स को इन उपकरणों पर दुनिया को संचार की गुणवत्ता में सुधार करने में एक महत्वपूर्ण ड्राइवर दिया जाएगा जहां बैंडविड्थ दुर्लभ है। यह उभरते बाजारों में नए एप्लिकेशन बनाने के लिए देख रहे डेवलपर्स के लिए एक उत्कृष्ट प्रेरक भी है, जो इस वर्ष Google को कवर करने के लिए निश्चित है

instagram viewer
मुफ्त आभासी Google I / O ऑनलाइन सम्मेलन.

बीटा स्रोत कोड वर्तमान में 64-बिट आर्म डिवाइसों को ध्यान में रखकर बनाया गया है, हालांकि उदाहरण 64-बिट x86 लिनक्स सिस्टम पर भी चलेंगे। स्रोत कोड पूरी तरह से प्रलेखित प्रदान किया गया है, हालांकि यह बीटा में है, और GitHub पृष्ठ इंस्टॉलेशन निर्देश और आर्म 64-बिट लक्ष्य के लिए लिनक्स पर लाइरा बनाने का तरीका प्रदान करता है।

Lyra बीटा स्रोत कोड प्राप्त करने के लिए, पर जाएँ लाइरा गिटहब पेज.

लाइरा कैसे काम करती है?

जबकि वास्तविक प्रक्रिया लाइरा का उपयोग मशीन लर्निंग मॉडल का एक अविश्वसनीय रूप से जटिल संयोजन है जिसे प्रशिक्षित किया गया है हजारों घंटे के भाषण डेटा और मौजूदा ऑडियो कोडेक प्रौद्योगिकी के अनुकूलन, सिद्धांत काफी है सरल।

प्रत्येक 40ms, सुविधाओं को भाषण से लिया जाता है और 3kbps तक संकुचित किया जाता है। ये विशेषताएं मानव श्रवण भाषण प्रतिक्रिया के निकटतम आवृत्ति स्पेक्ट्रम में भाषण ऊर्जा बिंदुओं का प्रतिनिधित्व करती हैं - जब हम किसी को बोलते हैं तो हमें पहचानने और समझने की आवश्यकता होती है।

ल्यारा को क्या खास बनाता है इसका प्रमुख हिस्सा यह है कि यह इस जानकारी का उपयोग कैसे करता है:

हालांकि पारंपरिक पैरामीट्रिक कोडेक्स, जो केवल भाषण महत्वपूर्ण मापदंडों से निकालते हैं जो तब हो सकते हैं प्राप्त छोर पर सिग्नल को फिर से बनाने, कम बिटरेट प्राप्त करने के लिए उपयोग किया जाता है, लेकिन अक्सर ध्वनि रोबोट और अप्राकृतिक लगता है। इन कमियों ने उच्च गुणवत्ता वाले ऑडियो जनरेटिव मॉडल की एक नई पीढ़ी का विकास किया है न केवल संकेतों के बीच अंतर करने में सक्षम होने से क्षेत्र में क्रांति हुई, बल्कि पूरी तरह से नया भी उत्पन्न हुआ लोग।

ट्रांसमिशन के बाद, लायरा ने इस प्रक्रिया का उपयोग करके जो कुछ भी याद नहीं है, उसे भरने के द्वारा तरंग का पुनर्निर्माण किया, जबकि किसी भी तरह से कम्प्यूटेशनल रूप से जटिल नहीं है।

एक ओर, यह एक तकनीकी चमत्कार है जो लगभग कहीं भी चलेगा। दूसरी ओर, मैं अभी भी 100% आश्वस्त नहीं हूं कि यह जादू टोना नहीं है।

ईमेल
10 Google डुओ के फीचर्स आपको सच में उपयोग करने चाहिए

Google डुओ सबसे अच्छा वीडियो कॉलिंग ऐप में से एक है। इसमें बहुत सारी विशेषताएं हैं, और यहां वे हैं जो हमें लगता है कि आपको वास्तव में उपयोग करना चाहिए।

आगे पढ़िए

संबंधित विषय
  • तकनीक सम्बन्धी समाचार
  • गूगल
  • एंड्रॉयड
  • यंत्र अधिगम
लेखक के बारे में
इयान बकले (209 लेख प्रकाशित)

इयान बकले बर्लिन, जर्मनी में रहने वाले एक स्वतंत्र पत्रकार, संगीतकार, कलाकार और वीडियो निर्माता हैं। जब वह लेखन या मंच पर नहीं है, तो वह पागल वैज्ञानिक बनने की उम्मीद में DIY इलेक्ट्रॉनिक्स या कोड के साथ छेड़छाड़ कर रहा है।

इयान बकले से अधिक

हमारे न्युजलेटर की सदस्यता प्राप्त करें

टेक टिप्स, रिव्यू, फ्री ईबुक और एक्सक्लूसिव डील्स के लिए हमारे न्यूज़लेटर से जुड़ें!

एक और क़दम…!

कृपया हमें आपके द्वारा भेजे गए ईमेल में अपने ईमेल पते की पुष्टि करें।

.