विज्ञापन
की तलाश में है श्रेष्ठ नि: शुल्क विंडोज सॉफ्टवेयर पाठ के लिए भाषण के लिए? सबसे दोहराया गया भुगतान किया है सिफारिश है ड्रैगन स्वाभाविक रूप से बोलते हुए (DNS)। लेकिन कुछ सॉफ्टवेयर के लिए पैसे देने में चूक कर सकते हैं। सौभाग्य से, Google डॉक्स वॉयस टंकण (GDVT) और विंडोज भाषण मान्यता (WSR) जैसे कई बेहतरीन मुफ्त कार्यक्रम हैं।
ड्रैगन स्वाभाविक रूप से मूल बातें 13 (बंद)ड्रैगन स्वाभाविक रूप से मूल बातें 13 (बंद) अमेज़न पर अब खरीदें $79.73
आपको आश्चर्य हो सकता है कि ये दोनों उत्पाद DNS के खिलाफ कैसे तुलना करते हैं - और क्या DNS आपकी आवश्यकताओं को पूरा करता है या नहीं। इस लेख के लिए, मैंने तीन प्रकार के उपयोगकर्ताओं की पहचान की है: जिन्हें टेक्स्ट ट्रांसक्रिप्शन के लिए भाषण की आवश्यकता होती है उपन्यास लिखना, जिनकी जरूरत है अकादमिक प्रतिलेखन, और जो लिखते हैं व्यावसायिक दस्तावेज़, मेमो की तरह। इसके लिए, मैंने तीन भाषण प्रतिलेखन कार्यक्रम (DNS, GDVT, और WSR) का परीक्षण किया।
भाषण प्रतिलेखन सेटअप
इससे पहले कि हम परीक्षण करें, पहले अनुशंसित हार्डवेयर और सॉफ़्टवेयर सेटअप को देखें।
हार्डवेयर और सॉफ्टवेयर आवश्यकताएँ
Google डॉक्स वॉयस टाइपिंग Chrome ब्राउज़र और माइक्रोफ़ोन की आवश्यकता है। और इसके लिए एक सतत इंटरनेट कनेक्शन (जो आवश्यकताओं में उल्लिखित नहीं है) भी चाहिए। अन्यथा, भाषण भाषण के साथ आरंभ करने के लिए यह संभवतः सबसे आसान तरीका है।
DNS के लिए 2001 या उसके बाद बने प्रोसेसर, विंडोज 7 या उसके बाद के संस्करण और लगभग 4 जीबी मुफ्त स्टोरेज की आवश्यकता होती है। इसकी सबसे सख्त आवश्यकता 2GB RAM है। यहाँ पूरी सूची है DNS की हार्डवेयर आवश्यकताएं.
विंडोज भाषण मान्यता विंडोज में स्पीच रिकॉग्निशन सेट करके स्पीच-टू-टेक्स्ट और वॉयस कंट्रोल को सक्षम करेंभाषण मान्यता कॉर्टाना की तुलना में अधिक शक्तिशाली है। यह भाषण को पाठ और ध्वनि नियंत्रण पर ले जाता है। यह लेख आपको दिखाएगा कि भाषण मान्यता क्या कर सकती है, इसे कैसे सेट करें, इसे प्रशिक्षित करें, और इसका उपयोग करें। अधिक पढ़ें , जिसे स्पीच प्लेटफॉर्म रनटाइम के नाम से भी जाना जाता है (डब्लूएसआर डाउनलोड करें), लागत कुछ भी नहीं है और केवल एक विंडोज 7 या बाद में ऑपरेटिंग सिस्टम की आवश्यकता है।
माइक्रोफोन विचार
मैं एक गतिशील माइक्रोफोन का उपयोग करता हूं (पॉडकास्टिंग के लिए सबसे अच्छा माइक्रोफोन पॉडकास्टिंग के लिए बेस्ट माइकएक नया पॉडकास्ट शुरू? आपको एक अच्छे माइक्रोफोन की आवश्यकता है! पॉडकास्टिंग के लिए सबसे अच्छे माइक के लिए यहां आपके विकल्प हैं। अधिक पढ़ें ) और अपेक्षाकृत तेज़ इंटेल कोर i7 प्रोसेसर है। जबकि एक उच्च गुणवत्ता वाला माइक्रोफ़ोन वांछित है, इसकी आवश्यकता नहीं है। फिर भी, बेहतर ध्वनि गुणवत्ता और कम पृष्ठभूमि शोर के साथ आपके परिणाम बेहतर होंगे।
सबसे कम कीमत वाला माइक्रोफोन जिसे मैं उच्च-गुणवत्ता की रिकॉर्डिंग के लिए सुझाऊंगा, वह है ऑडियो-टेक्निका ATR-2100. हालांकि, $ 5 माइक्रोफोन और $ 200 डिवाइस के बीच सटीकता अंतर बहुत कम है।
ऑडियो-टेक्निका ATR2100-USB कार्डियोइड डायनामिक USB / XLR माइक्रोफोनऑडियो-टेक्निका ATR2100-USB कार्डियोइड डायनामिक USB / XLR माइक्रोफोन अमेज़न पर अब खरीदें
दूसरी ओर, Microsoft भाषण के लिए न्यूनतम आवश्यकताएं बहुत अधिक हैं दूर से आधुनिक कंप्यूटर (पिछले दस वर्षों में बनाए गए अधिकांश कंप्यूटर) और एक माइक्रोफोन। यदि आप पिछले पांच वर्षों में लैपटॉप या टैबलेट के मालिक हैं, तो आपके पास डिफ़ॉल्ट रूप से इसकी आवश्यकता होनी चाहिए।
भाषण ट्रांसक्रिप्शन प्रोग्राम को कॉन्फ़िगर करना
Google Voice टाइपिंग का उपयोग कैसे करें:
यहां विंडोज भाषण मान्यता के साथ शुरुआत करने का तरीका बताया गया है:
और, अंत में, यहां ड्रैगन नेचुरली स्पीकिंग के साथ शुरुआत करने का तरीका बताया गया है:
परीक्षण पद्धति
मैं सबसे अच्छा खोजना चाहता हूं नि: शुल्क पाठ अनुप्रयोग के लिए विंडोज-आधारित भाषण। क्योंकि विभिन्न उपभोक्ताओं को एक अलग उत्पाद की आवश्यकता हो सकती है, इसलिए मैंने एक साधारण परीक्षण तैयार किया है। मैंने कॉपीराइट के बिना ग्रंथों के तीन अलग-अलग अंश पढ़े: एक चार्ल्स डार्विन का प्ररूपों की प्रजाति की प्रवृत्ति पर. एक से एच.पी. Lovecraft के Cthulu की कॉल. जेरी ब्राउन के 2017 स्टेट ऑफ़ द यूनियन भाषण से अंतिम जय हो। मेरी कार्यप्रणाली किसी भी तरह से सही नहीं है, लेकिन यह प्रत्येक ध्वनि मान्यता सूट की सटीकता का आभास देती है।
फिक्शन राइटिंग सैंपल (एच.पी. लवक्राफ्ट से) Cthulu की कॉल)
“मुझे लगता है कि दुनिया की सबसे दयालु चीज़, मानव मन की असमर्थता है कि वह अपनी सभी सामग्रियों को सह सके। हम अनन्तता के काले समुद्रों के बीच अज्ञानता के एक शांत द्वीप पर रहते हैं, और इसका मतलब यह नहीं था कि हमें दूर की यात्रा करनी चाहिए। विज्ञान, अपनी दिशा में प्रत्येक तनाव, ने हमें बहुत कम नुकसान पहुंचाया है; लेकिन किसी दिन अलग-थलग ज्ञान का एक साथ पेकिंग करने से वास्तविकता के ऐसे भयानक दायरे खुल जाएंगे, और हमारे सुखद इस स्थिति में, कि हम या तो रहस्योद्घाटन से पागल हो जाएँगे या एक नए की शांति और सुरक्षा में घातक प्रकाश से पलायन करेंगे अंधकार युग।"
व्यवसाय लेखन नमूना (जेरी ब्राउन 2017 स्टेट ऑफ द यूनियन भाषण)
“यह इस तरह के अवसर पर प्रथागत है जैसे कि आने वाले वर्ष के लिए एक विशिष्ट एजेंडा रखना। इस रुस्तम से छह बार पहले, मैंने ऐसा किया है, और कुछ विस्तार से। और, जैसा कि मैंने पिछले राज्य के भाषणों में उन प्रस्तावों को फिर से लिखा है, मैं यह देखकर चकित था कि हमने एक साथ कितना पूरा किया है। ”
शैक्षणिक लेखन नमूना (चार्ल्स डार्विन) प्रजाति की प्रवृत्ति पर प्रपत्र विविधताएँ)
“अब जब इस तरह के एक जानवर की संख्या होती है, तो किसी भी अंग या भावना में शक्ति या क्षमता बढ़ जाती है, जैसे वृद्धि पूरी तरह से बेकार है, कभी भी कार्रवाई में नहीं बुलाया जाता है, और यहां तक कि जानवर के बिना कभी भी मौजूद नहीं हो सकता है इसका। जंगली जानवर में, इसके विपरीत, इसके सभी संकायों और शक्ति को अस्तित्व की आवश्यकताओं के लिए पूर्ण कार्रवाई में लाया जा रहा है, किसी भी वृद्धि तुरंत उपलब्ध हो जाता है, व्यायाम द्वारा मजबूत किया जाता है, और भोजन, आदतों और पूरी अर्थव्यवस्था को थोड़ा संशोधित करना चाहिए दौड़। "
3 वॉयस ट्रांसक्रिप्शन सूट का परीक्षण किया गया
यह आश्चर्य की बात है कि कैसे मुक्त आवाज मान्यता वॉयस कमांड के लिए बेस्ट लिस्ट-मेकिंग ऐप्सकई मुफ्त उत्पादकता उपकरण सूचियों के लिए पाठ को आवाज का समर्थन करते हैं। हम आपको वॉइस रिकग्निशन के साथ सर्वश्रेष्ठ सूची बनाने वाले ऐप्स दिखाएंगे और आपको जो भी प्रयास करने होंगे, उन्हें आदेश देंगे। अधिक पढ़ें भुगतान किए गए सॉफ़्टवेयर के विरुद्ध परीक्षण किए गए। लेकिन दिन के अंत में, सबसे सटीक ऐप ड्रैगन नेचुरली स्पीकिंग है। हालाँकि, Google Voice Typing और Windows Speech Recognition दोनों की लागत कुछ भी नहीं है और 90 प्रतिशत से अधिक सटीकता प्रदान करते हैं। लेकिन प्रत्येक की अपनी ताकत और कमजोरियां हैं और आप एक दूसरे को पसंद कर सकते हैं।
एच.पी. लवक्राफ्ट (फिक्शन राइटिंग टेस्ट)
लवक्राफ्ट को लंबे, अटूट, पैतृक रूप से घने गद्य में लिखना पसंद था। जबकि तीनों सुइट्स लवक्राफ्ट के मुखर टेक्स्ट को सही तरीके से ट्रांसक्रिप्ट करने का एक बड़ा काम करते हैं, DNS अपने प्रतिस्पर्धियों से आगे निकलता है. इसमें पूंजीकरण और विराम चिह्न (जो पूरी तरह से पागल है) दोनों शामिल हैं।
डीएनएस: डीएनएस ने केवल एक शब्द को पाठ से हटा दिया। कुल मिलाकर, इसने 108 शब्दों में से 107 सही बनाए। इसने कई लंबे, गैर-रोक वाक्यों को भी रद्द कर दिया।
WSR: विंडोज ने बहुत अच्छा काम किया - लेकिन अद्भुत नहीं - लवक्राफ्ट को ट्रांसक्रिप्ट करने के लिए। इसे लगभग 97 में से लगभग 108 शब्द सही मिले। जबकि यह जीडीवीटी और डीएनएस दोनों से कम पड़ता है, फिर भी यह मुफ्त प्रोग्राम के लिए अच्छा है जो टेक्स्ट प्रोग्राम के लिए ऑनलाइन एक्सेस की आवश्यकता नहीं है।
GDVT: मुझे यकीन नहीं है कि क्या हुआ क्योंकि Google ने अन्य अंशों के लिए प्रतिलेखन को रद्द कर दिया। जीडीवीटी ने केवल 108 में से 103 को प्राप्त किया, दो शब्दों को छोड़ दिया और तीन को गलत लिखा। यहां तक कि एक बार सही विराम चिह्न डालने के बजाय "अर्धविराम" का उच्चारण कर दिया। इसने कुछ शब्दों को भी कैपिटलाइज़ किया है, उन्हें उचित संज्ञा में बदल दिया है (लेकिन मैं इसे सटीकता के बाद से दंडित नहीं करता और न कि कैपिटलाइज़ेशन मायने रखता है)।
मुझे पूरा यकीन है कि अगर मैं दूसरी बार दस्तावेज़ को फिर से लिखता हूँ, तो इसमें कोई त्रुटि नहीं होगी।
चार्ल्स डार्विन (वैज्ञानिक या अकादमिक लेखन परीक्षण)
डार्विन में लिखते हैं, लवक्राफ्ट की तरह, लंबे समय तक माता-पिता की जानकारी से भरे वाक्य। हालाँकि, उनकी भाषा का उपयोग बहुत स्पष्ट है और वे लगभग कोई शब्दजाल का उपयोग नहीं करते हैं, जो आज लगभग असंगत विज्ञान लेखन से अलग है।
डीएनएस: डार्विन का पाठ ड्रैगन नेचुरली स्पीकिंग में एकदम सही है। DNS ने केवल एक शब्द ("में") गलत लिखा और अन्यथा 88 में से 87 शब्दों के साथ परीक्षण को पूरी तरह से रद्द कर दिया।
WSR: माइक्रोसॉफ्ट ने शानदार काम किया, जिसमें 88 शब्दों में से 82 का मिलान किया गया। इसने कुछ अपेक्षाकृत विचित्र त्रुटियां कीं, हालांकि "सेंट" के रूप में "अर्थ" की वर्तनी।
GDVT: Google ने डार्विन के उद्धरण पर बहुत अच्छा किया। GDVT ने 88 में से केवल दो शब्दों को फाउल किया। कुल मिलाकर, एक नि: शुल्क आवेदन के लिए, आपको अधिक सटीक विकल्प नहीं मिल सकता है।
जेरी ब्राउन राज्य का पता 2016 (बिजनेस राइटिंग टेस्ट)
ब्राउन का भाषण बहुत जटिल वाक्यों या शब्दावली का उपयोग नहीं करता है (शब्द "शब्द" से अलग)। कुल मिलाकर, अधिकांश प्रतिलेखन सेवाओं ने आश्चर्यजनक प्रदर्शन किया। कम या ज्यादा, अगर आपको एक ऐसी सेवा की आवश्यकता है जो सरल वाक्य और सीमित शब्दावली को संभालती है, तो इनमें से कोई भी महान काम करता है।
डीएनएस: डीएनएस ने ब्राउन का नाम लिया राज्य का पता. जबकि यह एक अवधि गिरा, अन्यथा, यह पूरी तरह से हर शब्द मिला। ध्यान दें, हालांकि, अक्सर राजनीतिक भाषणों में उस तरह की जटिल भाषा का अभाव होता है, जिसे आप कल्पना या शिक्षा में देख सकते हैं। एक ज्ञापन या भाषण प्रत्यक्ष और बिंदु तक होता है। यह एक भाषण मान्यता ग्राहक है किसी भी समस्या से निपटने में नहीं होना चाहिए।
WSR: ब्राउन के भाषण को ट्रांसक्रिप्ट करने पर - विंडोज स्पीच रिकॉग्निशन ने बहुत अच्छा काम किया - हालाँकि डीएनएस या गूगल जैसा महान नहीं। इसने 58 में से 55 शब्द बनाए। यहां तक कि यह शब्द "rostrum" को भी पहचानता है, जो मुझे नहीं पता था कि यह एक शब्द था, और न ही मुझे पता था कि इसे कैसे उच्चारण किया जाए। जाहिर है, या तो मुझे यह सही लगा या भाषण मान्यता प्रौद्योगिकी भी गलतफहमी पकड़ सकती है।
GDVT: Google के ट्रांसक्रिप्शन सॉफ्टवेयर ने 100 प्रतिशत सटीकता के साथ ट्रांसक्रिप्शन को पूरी तरह से बंद कर दिया। यह भी उपयोगकर्ता इनपुट की आवश्यकता के बिना, "राज्य की स्थिति" को सही ढंग से भुनाने में कामयाब रहा। इसने शब्द "छः" के लिए वर्तनी की बजाय संख्या का अजीब तरह से उपयोग किया। जिसके परिणामस्वरूप एक शैलीगत त्रुटि हुई।
क्या नि: शुल्क ट्रांसक्रिप्शन सेवाओं का उपयोग कर रहे हैं?
ड्रैगन नेचुरली स्पीकिंग, गूगल वॉयस टाइपिंग और माइक्रोसॉफ्ट के विंडोज स्पीच रिकॉग्निशन में अंतर है। ड्रैगन अपने प्रतिद्वंद्वियों की तुलना में अधिक सटीक है। हालाँकि, सटीकता के मामले में सबसे अच्छा मुफ्त कार्यक्रम है - एक संकीर्ण मार्जिन द्वारा - Google की आवाज टाइपिंग। जबकि Microsoft और Google दोनों की प्रतिलेखन सेवाएं DNS के मुकाबले कम-से-कम अनुकूल रूप से तुलना करती हैं, लेकिन उनकी लागत $ 30 नहीं होती है।
एक दूसरे के खिलाफ दो मुफ्त सेवाओं के विपरीत, Google बेहतर आवाज पहचान सटीकता, विराम चिह्न और मामले प्रदान करता है, इसके लिए इंटरनेट कनेक्शन की आवश्यकता होती है। Google बहुत कुछ कैप्चर करता है जिसे आप विराम चिह्न और कैपिटलाइज़ेशन की तरह नहीं चाहते हैं।
हालाँकि, यदि आप एक मुफ्त प्रतिलेखन कार्यक्रम चाहते हैं जिसका उपयोग करने के लिए आपको इंटरनेट कनेक्शन की आवश्यकता नहीं है, विंडोज भाषण मान्यता बिल फिट बैठता है. यह किसी भी तरह से खराब नहीं है और ड्रैगन नेचुरली बोलने के लिए 90 प्रतिशत प्रदान करता है। यदि आप पहले से ही ऐसा नहीं कर रहे हैं तो इसे एक शॉट दें।
अधिक के लिए, एक नज़र डालें आपके कंप्यूटर को आपके लिए दस्तावेज़ पढ़ने के तरीके 5 तरीके आपके कंप्यूटर को बनाने के लिए आप दस्तावेज़ पढ़ेंक्या आप अपने कंप्यूटर को जोर से पढ़ सकते हैं? बेशक! अपने पीसी पर इन टेक्स्ट-टू-स्पीच विधियों और उपकरणों का प्रयास करें। अधिक पढ़ें . और अपने एंड्रॉइड फोन की मदद के लिए देखें सबसे अच्छा भाषण करने वाली पाठ Android ऐप्स आसान भाषण-से-पाठ के लिए 7 सर्वश्रेष्ठ एंड्रॉइड डिक्टेशन ऐपएंड्रॉइड के लिए सबसे अच्छा भाषण-टू-टेक्स्ट ऐप खोज रहे हैं? ये एंड्रॉइड डिक्टेशन ऐप आपको नोट्स और बहुत कुछ लेने देते हैं। अधिक पढ़ें .
आपकी पसंदीदा ट्रांसक्रिप्शन सेवा क्या है? कृपया हमें टिप्पणियों में बताएं!
कन्नन आर्थिक विकास और अंतर्राष्ट्रीय व्यापार पर जोर देने के साथ अंतर्राष्ट्रीय मामलों (एमए) में एक पृष्ठभूमि के साथ एक टेक पत्रकार (बीए) है। उनके जुनून चीन के स्रोत वाले गैजेट, सूचना प्रौद्योगिकी (जैसे आरएसएस), और उत्पादकता युक्तियां और चालें हैं।