विज्ञापन
हाल ही में, मैं एक ऐसे व्यक्ति पर काम कर रहा था जिसमें एक व्यक्ति शामिल था जिसने फोन कॉल किया था, जिसे रिकॉर्ड किया गया था। बाद में उस व्यक्ति ने स्वीकार करने से इनकार कर दिया कि उन्होंने कभी भी फोन नहीं किया है।
फोन कॉल से रिकॉर्ड की गई आवाज और आरोपों से इनकार करने वाले व्यक्ति की एक क्लिप के साथ, मैंने यह साबित करने के लिए काम करने की कोशिश की कि आवाजें एक जैसी थीं।
मैं स्वीकार करता हूं कि मैं आवाज तकनीकों के प्रति थोड़ा जुनूनी हूं। यही कारण है कि मैं इंतजार कर रहा था Google वॉइस फोन पर ब्लॉग के लिए Google Voice का उपयोग कैसे करें अधिक पढ़ें अपनी आवाज पहचान तकनीक के साथ और अधिक उन्नत बनने के लिए, और मुझे पीसी वॉयस कंट्रोल ऐप्स से प्यार है तज़्ती की तरह विंडोज में स्पीच रिकॉग्निशन सेट करके स्पीच-टू-टेक्स्ट और वॉयस कंट्रोल को सक्षम करेंभाषण मान्यता कॉर्टाना की तुलना में अधिक शक्तिशाली है। यह भाषण को पाठ और ध्वनि नियंत्रण पर ले जाता है। यह लेख आपको दिखाएगा कि भाषण मान्यता क्या कर सकती है, इसे कैसे सेट करें, इसे प्रशिक्षित करें, और इसका उपयोग करें। अधिक पढ़ें . हालांकि, जब यह डिजिटल रूप से आवाज की तुलना करने की बात आती है, तो मैं नुकसान में था। आपने शायद उन जासूसी फ़िल्मों को देखा होगा जहाँ कंप्यूटर स्वचालित रूप से किसी ज्ञात अपराधी की आवाज़ को अकेले वॉइस प्रिंट से पहचान सकता है।
सच कहूं, एक बार जब मैंने सोनोग्राम विजिबल स्पीच की खोज की, तो मुझे महसूस हुआ कि वास्तव में स्पेक्ट्रोग्राम आवाज तकनीक है है वर्तमान में अकेले उनकी आवाज से किसी व्यक्ति को पहचानने का एक व्यवहार्य तरीका है।
स्पेक्ट्रोग्राम समझना
यदि आप रासायनिक आइसोटोप के बारे में जानते हैं, तो आप जानते हैं कि आइसोटोप के साथ, केमिस्ट के रासायनिक श्रृंगार की पहचान कर सकते हैं बुनियादी तत्वों को अलग करके और किसी भी व्यक्ति के व्यक्तिगत घटकों की पहचान करने के लिए ब्रेकडाउन का उपयोग करके यौगिक मिश्रण। उसी तरह, एक ऑडियो स्पेक्ट्रोग्राम ऑडियो ध्वनि को मूल आवृत्तियों में तोड़ देता है। मानव आवाज के बारे में दिलचस्प बात यह है कि कोई भी एक आवृत्ति में नहीं बोलता है। आपका मुंह, नाक मार्ग और आपके आवाज बॉक्स का ढाँचा उन आवृत्तियों के मिश्रण को निर्धारित करता है जो आपकी कुछ विशिष्ट आवाज को बनाते हैं।
सोनोग्राम विजिबल स्पीच एक मुफ्त स्पेक्ट्रोग्राम सॉफ्टवेयर एप्लीकेशन है जो वीडियो या ऑडियो फाइलों को ले जाएगा और तोड़ देगा पूरे स्पेक्ट्रम में ऑडियो ट्रैक नीचे - पूरे समय सीमा के दौरान इसकी सभी आवृत्तियों धावन पथ। एक पूर्ण वर्णक्रम नीचे की छवि जैसा दिखता है।

जैसा कि आप देख सकते हैं, नीचे ट्रैक मूल ध्वनि तरंग जैसा दिखता है जिसे आप किसी प्रोग्राम में नहीं देखते हैं धृष्टता 3 अपने रिकॉर्ड किए गए साक्षात्कार को बढ़ाने के लिए ऑडेसिटी टिप्सस्पष्ट ऑडियो किसी भी पॉडकास्ट या रिकॉर्डिंग के लिए महत्वपूर्ण है जिसे आप प्रकाशित करना चाहते हैं। तीन आसान चरणों में ऑडेसिटी के साथ अपनी ऑडियो गुणवत्ता को बढ़ावा दें। अधिक पढ़ें हालाँकि, केंद्र फलक ध्वनि फ़ाइल के प्रत्येक खंड को अपनी संपूर्ण आवृत्ति लेआउट में प्रदर्शित करता है। इस सॉफ्टवेयर के बारे में आश्चर्यजनक बात यह है कि कई अन्य तरंग हैं जो आप अपनी ध्वनि फ़ाइल की जांच करने के लिए उपयोग कर सकते हैं। ये विशेष रूप से उन्नत उपयोगकर्ताओं के लिए हैं।

आप कॉन्फ़िगर कर सकते हैं कि "विकल्प" मेनू में जाकर और "जनरल" का चयन करके उन तरंगों में से प्रत्येक कैसे प्रदर्शित करता है समायोजन। " यहां आप यह परिभाषित कर सकते हैं कि लघुगणकीय रेखांकन आउटपुट की गणना कैसे करते हैं और सभी उपलब्ध सामान्य प्रदर्शन सेटअप चार्ट।

यदि ध्वनि काफी शांत है, या आप जिस आवाज़ का विश्लेषण कर रहे हैं वह एक कानाफूसी है, तो आप लॉगरिदमिक फ़्रीक्वेंसी डिस्प्ले का उपयोग करने पर विचार कर सकते हैं। आप इसे "विकल्प" मेनू से सक्षम करते हैं और "लॉगरिदमिक फ़्रिक्वेंसी" का चयन करते हैं। यह कुछ हद तक स्पेक्ट्रोग्राम में आवृत्ति के महत्वपूर्ण क्षेत्रों को "बढ़ाना" करेगा।

यह वास्तव में स्पष्ट आवृत्ति पैटर्न की पहचान करने में मदद कर सकता है जो किसी को उनकी आवाज़ की आवाज़ से पहचानते हैं। यदि आप पूरी तरह से खो चुके हैं, और आप नहीं जानते हैं कि कहां से शुरू करना है, तो "सहायता" पर क्लिक करें और "ऑनलाइन सहायता" पर जाएं, बहुत अच्छी तरह से लिखा गया सोनोग्राम ऑनलाइन सहायता मैनुअल खुल जाएगा। यदि आप स्पेक्ट्रोग्राम ऑडियो विश्लेषण के लिए नए हैं, तो यह शुरू करने के लिए एक शानदार जगह है।

भूत शिकार का उपयोग करते हुए स्पेक्ट्रोग्राम के साथ एक प्रयोग
इस सॉफ्टवेयर की सुंदरता यह है कि यह कई अलग-अलग उपयोगों के लिए अच्छा है। भूत शिकार में अक्सर आने वाली कलाकृतियों में से एक, मेरी निजी रुचि है "इलेक्ट्रॉनिक वॉयस घटना" - जहां एक स्पष्ट या भूत की आवाज कथित रूप से ऑडियो पर दिखाई देती है रिकॉर्डिंग। ये रिकॉर्डिंग पूरे वेब पर बिखरी हुई हैं, इसलिए मैंने भूत शिकारी वेबसाइटों में से कुछ को खींचने और एक स्पेक्ट्रोग्राम विश्लेषण करने का फैसला किया।

स्पेक्ट्रोग्राम से पता चलता है कि आवाज़ की आवृत्तियों आम तौर पर कम हैं, लेकिन रिकॉर्डिंग में आवाज़ों की बेहतर तस्वीर प्राप्त करने के लिए, आपको अतिरिक्त तरंगों को खोलने की आवश्यकता है। आप जिस माउस को मँडराते हैं उस समय के फ्रेम में "पिच" की गणना "पिच" करता है।

"घोस्ट" की औसत पिच आवृत्ति लगभग 129.0 हर्ट्ज है। रिकॉर्डिंग के अंत में स्क्रॉल करना जहां आप अन्वेषक की आवाज़ सुनते हैं, गणना की गई पिच आवृत्ति लगभग 208.0 हर्ट्ज है (जो समझ में आता है क्योंकि यह एक महिला आवाज है और भूत रिकॉर्डिंग लगता है नर।)

फास्ट फूरियर प्रदर्शन को खोलने से आवाज़ों के बारे में और भी अधिक पता चलता है। यह चार्ट प्राथमिक आवृत्तियों को जल्दी से तोड़ता है और उन्हें एक रंग कोड में प्रदर्शित करता है।

इस मामले में, आवृत्तियों का टूटना कुछ उच्च के साथ फैला हुआ है, लेकिन साथ ही मिश्रण में कम आवृत्तियों की एक अच्छी संख्या है। हालांकि, कमरे में अन्वेषक स्पष्ट रूप से एक आवाज में बोल रहा है, जो कि आवृत्ति में क्लस्टर के उच्च अंत की ओर अधिक है, जैसा कि यहां दिखाया गया है।

इस त्वरित विश्लेषण ने साबित कर दिया कि दो आवाजें काफी अलग हैं, लेकिन यह इस शक्तिशाली सॉफ्टवेयर की क्षमताओं का केवल एक मूल उदाहरण है। असल में, किसी भी स्थिति में जहां एक ध्वनि तरंग की आवृत्तियों का टूटना मदद कर सकता है - यह आपके लिए सॉफ्टवेयर है। यह सीखना आसान है, सेट अप और कॉन्फ़िगर करने के लिए त्वरित है, और यह बाजार पर किसी भी भुगतान किए गए स्पेक्ट्रोग्राम सॉफ़्टवेयर की तुलना में बेहतर या बेहतर प्रदर्शन करता है।
क्या आपके पास कोई प्रोजेक्ट है जो एक स्पेक्ट्रोग्राम का उपयोग कर सकता है? क्या आपने कभी सोनोग्राम विजिबल स्पीच की कोशिश की है? नीचे टिप्पणी अनुभाग में अपनी अंतर्दृष्टि साझा करें।
रयान के पास इलेक्ट्रिकल इंजीनियरिंग में बीएससी की डिग्री है। उन्होंने ऑटोमेशन इंजीनियरिंग में 13 साल, आईटी में 5 साल काम किया है, और अब एक एप्स इंजीनियर हैं। MakeUseOf के पूर्व प्रबंध संपादक, उन्होंने डेटा विज़ुअलाइज़ेशन पर राष्ट्रीय सम्मेलनों में बात की है और इसे राष्ट्रीय टीवी और रेडियो पर चित्रित किया गया है।