विज्ञापन
यदि आप किसी मुद्रित पाठ को डिजिटल पाठ में बदलना चाहते हैं जिसे आप कॉपी, पेस्ट, संपादित और खोज कर सकते हैं, तो आपको ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) स्कैनर का उपयोग करने की आवश्यकता होगी।
जब आप किसी दस्तावेज़ की तस्वीर को स्कैन करना या लेना चुनते हैं, तो यह JPEG या PDF जैसे प्रारूप में सहेजा जाएगा। ओसीआर सॉफ्टवेयर फिर इन दस्तावेजों के भीतर अक्षरों और संख्याओं को पहचान सकते हैं, और उन्हें एक में परिवर्तित कर सकते हैं खोजा पीडीएफ फ्री में पीडीएफ फाइल बनाने और संपादित करने के 4 तरीकेहमारे कंप्यूटिंग दुनिया में पाए जाने वाले सभी सामान्य फ़ाइल प्रकारों में से, पीडीएफ संभवतः सबसे अधिक प्रतिबंधात्मक लोगों में से एक है, जबकि एक ही समय में सभी के लिए उपलब्ध है (मुख्य रूप से पढ़ने के लिए) ... अधिक पढ़ें , या एक फ़ाइल में जिसे आप Microsoft Word जैसे कार्यक्रमों में संपादित कर सकते हैं।
समस्या यह है कि कुछ ओसीआर स्कैनर दूसरों की तुलना में बहुत बेहतर काम करते हैं, सबसे अच्छा वॉलेट पर बहुत भारी है।
उदाहरण के लिए, Omnipage18 की लागत $ 150 है, लेकिन विभिन्न भाषाओं को पहचानने में विशेष रूप से अच्छा है।
एडोब एक्रोबैट प्रो डीसी एक आँख पानी $ 400 लागत लेकिन अविश्वसनीय सटीकता है। एबीबीवाई फाइनरडर $ 150 का खर्च आता है, लेकिन पत्रिकाओं और ब्रोशर जैसे दस्तावेजों को खोज योग्य पाठ में परिवर्तित करने में शानदार है। हम इस लेख में बाद में एबीबीवाई की ऑनलाइन पेशकश का परीक्षण करेंगे।हालाँकि, यदि आप मुफ्त विकल्प के बाद हैं जो आप कर सकते हैं डाउनलोड और विंडोज या ओएस एक्स पर उपयोग करें, आपको चाहिए इन OCR टूल्स को आज़माएं छवियों से पाठ निकालने के लिए 5 सर्वश्रेष्ठ ओसीआर उपकरणजब आप कागज के बारे में पढ़ते हैं, तो आप कैसे उस सभी मुद्रित पाठ को किसी ऐसी चीज़ में परिवर्तित कर देते हैं जिसे एक डिजिटल प्रोग्राम पहचान और अनुक्रमणित कर सकेगा? एक अच्छा OCR सॉफ्टवेयर बंद करके रखें। अधिक पढ़ें . लेकिन अगर आप एक मुफ्त का उपयोग करते हैं, ऑनलाइन OCR उपकरण, पढ़ते रहें, क्योंकि हमने नीचे के परिणामों के साथ शीर्ष कुछ को आज़माया है।
कसौटी
लगता है ज्यादातर लोग अब उनका उपयोग करते हैं उनके लिए स्कैनिंग करने के लिए स्मार्टफोन स्कैन और अपनी रसीद, अंतरिक्ष, कागज और समय की व्यवस्था करेंपेपर रसीदें आसानी से खो जाती हैं और जब आपको उनकी सबसे अधिक आवश्यकता होती है, तो उसे ढूंढना मुश्किल होता है। शुक्र है, डिजिटल जा रहा है इन दोनों समस्याओं का हल। अधिक पढ़ें , मैंने उपयोग करने का फैसला किया एवरनोट का स्कैनेबल ऐप (आईओएस और एंड्रॉइड पर मुफ्त)। मैंने रिचर्ड डॉकिन के पहले पृष्ठ को स्कैन किया पर्वतारोहण माउंट बेहतर, यह देखने के लिए कि बहुत ही मूल स्वरूपण के साथ हम क्या परिणाम प्राप्त कर सकते हैं। मैंने टिम फेरिस के एक पृष्ठ को भी स्कैन किया ' 4-घंटा बावर्ची कुछ और अधिक जटिल स्वरूपण के साथ स्कैनर को आज़माने के लिए। मैंने इनमें से प्रत्येक फाइल को एक पीडीएफ के रूप में सहेजा है।
इन दस्तावेजों को कथित तौर पर सबसे अच्छे ऑनलाइन ओसीआर टूल के माध्यम से चलाया गया था ताकि यह देखा जा सके कि उन्होंने कितना अच्छा प्रदर्शन किया है।
नि: शुल्क ऑनलाइन ओसीआर [अब उपलब्ध नहीं]
खुशी से, नि: शुल्क ऑनलाइन ओसीआर का उपयोग करने के लिए कोई पंजीकरण आवश्यक नहीं है। और मैं दोगुना प्रभावित हुआ जब मैंने अपने दस्तावेज़ के प्रारूपण और लेआउट को बनाए रखने के लिए उनके दावे को देखा।
साइट इनपुट के रूप में पीडीएफ, जीआईएफ, बीएमपी, जेपीईजी, टीआईएफएफ, और पीएनजी का समर्थन करने में सक्षम होने का दावा करती है। आउटपुट या तो DOC हो सकते हैं, एक पीडीएफ टेक्स्ट डॉक्यूमेंट, RTF और TXT। दुर्भाग्य से, मुझे पता नहीं चल पाया कि उनके पास फ़ाइल आकार की सीमा है या नहीं।
मूल दस्तावेज़ पीडीएफ के लिए
पूरी तरह से परिवर्तित। कहने के लिए बहुत अधिक नहीं है! हम बंद हैं बहुत अच्छी शुरुआत।
DOC को मूल दस्तावेज
लगता है कि वास्तविक शब्द त्रुटिपूर्ण रूप से परिवर्तित हो गए हैं, इसके अलावा "माउंट रशमोर" से "ount" किसी तरह AWOL जा रहा है। स्वरूपण एक अलग कहानी है, हालांकि। कई कॉमा को अंडरस्कोर से बदल दिया गया था, और पूरे दस्तावेज़ में यादृच्छिक स्थान डाले गए थे। जब आप बाद में देखते हैं कि प्रीमियम सॉफ्टवेयर इस परीक्षण में कैसे आगे निकलता है, तो यह एक बुरा प्रयास नहीं है बिलकुल.
पीडीएफ के लिए जटिल दस्तावेज़
दस्तावेज़ को परिवर्तित करने में 120 सेकंड का समय लगा! एक बार पूरा होने के बाद, सभी पाठ लगभग 95% सटीकता के साथ परिवर्तित हो गए थे, हालांकि पृष्ठ के शीर्ष दाईं ओर अलग बॉक्स में पाठ अनुपलब्ध था। पीडीएफ भर में कुछ अन्य वर्ण भी गलत थे।
DOC को जटिल दस्तावेज़
इस बार, रूपांतरण में केवल 10 सेकंड लगे, पाठ लगभग 95% सटीकता के साथ फिर से परिवर्तित हो गया। कुछ अजीब स्पेसिंग मुद्दे थे, और सॉफ़्टवेयर को दस्तावेज़ के शीर्ष दाईं ओर फ़ॉन्ट को परिवर्तित करने में समस्या थी, और यहां और वहां कुछ वर्णों को याद किया।
निर्णय
यदि आप बस-स्वरूपित दस्तावेज़ों को पीडीएफ में बदलना चाहते हैं, तो यह एक शानदार उपकरण है। DOC में कनवर्ट करने के संदर्भ में घर के बारे में लिखने के लिए कुछ भी नहीं है।
i2OCR कुछ प्रभावशाली दावे करता है। उपकरण 60 से अधिक भाषाओं को पहचानता है, बहु-स्तंभ लेआउट (स्वरूपण को हटाकर) को संभाल सकता है, कोई फ़ाइल आकार सीमा नहीं है, अपलोड की गई फ़ाइलों को परिवर्तित कर सकता है तथा URL से। और आपको इस उपकरण का उपयोग करने के लिए पंजीकरण करने की आवश्यकता नहीं है।
यह सेवा आपकी छवि से केवल पाठ को निकालकर काम करती है, फिर बिना पाठ के आउटपुट देती है। पाठ को अन्य कार्यक्रमों में कॉपी करने से पहले, या DOC, PDF, या HTML के रूप में डाउनलोड करने से पहले, आप साइड-बाय-साइड दृश्य में किसी भी गलती को ठीक कर सकते हैं।
नोट: जब मैंने अपने पीडीएफ दस्तावेजों को अपलोड करने की कोशिश की, तो इन्हें i2OCR द्वारा अस्वीकार कर दिया गया, इसलिए मुझे इन्हें JPEG में बदलने की जरूरत थी (इनके स्क्रीनशॉट लेने के बाद, फिर फाइलें अपलोड करने की)।
बेसिक डॉक्युमेंट टू प्लेन टेक्स्ट
इस उपकरण के काम करने के तरीके के कारण, सभी स्वरूपण खो गए हैं, हालांकि छवि से पाठ में रूपांतरण लगभग सही था। पैराग्राफ रिक्ति जैसी कुछ छोटी त्रुटियां थीं, और कुछ कॉमा को पीरियड्स के साथ बदल दिया गया था, लेकिन ये छोटे निगल्स हैं।
सादा पाठ के लिए जटिल दस्तावेज़
शीर्ष पर दाईं ओर शीर्षक और नुस्खा के अलावा, बहुत सी गलतियों के बिना पाठ का अधिकांश भाग परिवर्तित किया गया था, जो इस उपकरण के लिए अपठनीय था। जिस तरह से कॉलम को सादे पाठ में परिवर्तित किया गया था वह आदर्श से बहुत दूर था। यदि आप इस रूपांतरण को कार्यशील बनाना चाहते हैं, तो लाइनों को सुसंगत वाक्यों में फिर से व्यवस्थित करने के लिए बहुत समय की आवश्यकता होगी।
निर्णय
बुनियादी दस्तावेजों के लिए, i2OCR महान काम करता है। डाउनलोड करने से पहले पाठ को संपादित करने की क्षमता भी एक बहुत अच्छा स्पर्श है। हालांकि अधिक जटिल दस्तावेजों के लिए, रूपांतरण अभी भी बहुत सटीक है, लेकिन जिस तरह से पाठ को आउटपुट किया जाता है वह आपके जीवन को बहुत आसान नहीं बना देगा।
ऑनलाइन ओसीआर वर्तमान में 46 विभिन्न भाषाओं का समर्थन करता है, और पीडीएफ, जेपीजी, बीएमपी, टीआईएफएफ और जीआईएफ को वर्ड, एक्सेल या प्लेन टेक्स्ट प्रारूप में परिवर्तित कर सकता है। साइट का दावा है "परिवर्तित दस्तावेज़ बिल्कुल मूल - तालिकाओं, स्तंभों और ग्राफिक्स की तरह दिखते हैं"।
बिना पंजीकरण के आप जिस संस्करण का उपयोग कर सकते हैं, वह आपको प्रति घंटे 15 छवियों (5mb सीमा) में परिवर्तित करने की अनुमति देता है। यदि आप किसी खाते के लिए साइन अप करते हैं, तो आप इस सीमा के शीर्ष पर अधिक पृष्ठ खरीद सकते हैं, जबकि बहु-पृष्ठ दस्तावेज़ और ज़िप अभिलेखागार में भी परिवर्तित करने में सक्षम हो सकते हैं।
DOC को मूल दस्तावेज
मूल दस्तावेज रोमन संख्या के अलावा निर्दोष रूप से परिवर्तित हो गया मैं उठाया नहीं जा रहा है। जैसा कि साइट ने वादा किया था, स्वरूपण बिल्कुल वैसा ही था जैसा कि किताब में है। इस उपकरण के लिए यश।
DOC को जटिल दस्तावेज़
जटिल दस्तावेज़ को परिवर्तित करने में पिछले OCR उपकरणों से निराश होने के बाद, मैं ऑनलाइन OCR से काफी प्रभावित हुआ। लेआउट एकदम सही था, जैसा कि आप ऊपर देख सकते हैं। हालांकि एक बार फिर, यह नुस्खा बहुत अच्छी तरह से नहीं उठाया गया था, लेकिन किसी भी अन्य छोटी गलतियों को नगण्य था।
निर्णय
ऑनलाइन ओसीआर से बिल्कुल शानदार परिणाम। केवल नकारात्मक पक्ष यह है कि परिवर्तित दस्तावेज़ों को PDF के रूप में डाउनलोड करने का कोई तरीका नहीं है क्योंकि जिन आउटपुट प्रारूपों का उल्लेख किया गया है उनमें DOCX, XLSX और TXT शामिल हैं।
जैसा कि पहले उल्लेख किया गया है, एबीबीवाई ओसीआर सॉफ्टवेयर में बाजार के नेताओं में से एक है, इसकी पूर्ण, डाउनलोड करने योग्य कार्यक्रम के लिए लगभग $ 150 की लागत है। वे एक प्रस्ताव देते हैं 10-पृष्ठ मुफ्त परीक्षण उनके ऑनलाइन टूल के लिए, हालांकि (पंजीकरण आवश्यक है)। $ 5 की सदस्यता के लिए, उनका ऑनलाइन टूल आपको हर महीने 200 पृष्ठों को बदलने की अनुमति देगा।
स्वीकृत फ़ाइलें इनमें से किसी भी प्रारूप में 100mb तक हो सकती हैं: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP, और PNG। एबीबीवाई लगभग 200 भाषाओं को भी मान्यता देता है। आउटपुट विशेष रूप से प्रभावशाली हैं, DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 और EPUB के बीच चयन।
तुम भी अपने परीक्षण के दौरान बीटा सुविधाओं के एक जोड़े की कोशिश कर सकते हैं। पहला आपके दस्तावेज़ को किसी अन्य भाषा में अनुवाद करने का विकल्प है। दूसरा आपके परिवर्तित दस्तावेज़ को आपके क्लाउड स्टोरेज खाते में निर्यात करना है, चाहे वह ड्रॉपबॉक्स हो, गूगल ड्राइव, एवरनोट, माइक्रोसॉफ्ट वनड्राइव या बॉक्स।
DOCX को मूल दस्तावेज
कुल मिलाकर परिणाम अच्छे थे, लेकिन इस पर विचार करना आश्चर्यजनक नहीं कि यह एक प्रीमियम उत्पाद है। कई कॉमा और अवधियों की अदला-बदली की गई, कई उल्टे कॉमा को एस्टरिक्स से बदल दिया गया, कुछ बड़े अक्षरों को गायब कर दिया गया, और एक शब्द (शाब्दिक) को गलत तरीके से लिखा गया।
DOCX के लिए जटिल दस्तावेज़
एक बार परिवर्तित होने के बाद दस्तावेज़ के भीतर पाठ में बहुत कम दोष थे (इसके अलावा ओसीआर उस नुस्खा के फ़ॉन्ट के साथ फिर से संघर्ष कर रहा था!), लेकिन स्वरूपण वांछित होने के लिए बहुत कुछ छोड़ दिया।
तीन स्तंभों ने किसी तरह केंद्रीय स्तंभ के साथ दो पृष्ठ उठाए केवल दूसरे पेज पर दिखाई दे रहा है। यदि आप वास्तव में करना चाहते थे कर इस परिवर्तित दस्तावेज़ के साथ कुछ भी, आप अपने बालों को बाहर खींच रहे हैं।
मूल दस्तावेज़ पीडीएफ के लिए
परिवर्तित पीडीएफ की समीक्षा करते समय, मुझे कोई गलती नहीं मिली। शायद हमने पाया है जहाँ ABBYY एक्सेल है। शानदार परिणाम।
पीडीएफ के लिए जटिल दस्तावेज़
फिर, मुझे इस परिवर्तित फ़ाइल में कोई त्रुटि नहीं मिली। एबीबीवाई स्पष्ट रूप से जानता है कि पीडीएफ को असाधारण रूप से अच्छी तरह से कैसे बदलना है।
निर्णय
यदि आप कुछ डॉलर का भुगतान करके खुश हैं, तो पीडीएफ में परिवर्तित करना इस सेवा के साथ, और होने के नाते अभूतपूर्व रूप से काम करता है यदि आप बड़ी मात्रा में स्कैनिंग कर रहे हैं तो आपके क्लाउड स्टोरेज में कनवर्ट की गई फ़ाइलों को सिंक करने में सक्षम है, विशेष रूप से उपयोगी है दस्तावेजों। हालांकि अन्य विकल्पों के साथ, अभी भी एबीबीवाई को यह पता नहीं चला है कि आसान संपादन के लिए दस्तावेजों को कैसे दोषमुक्त रूप से DOC में परिवर्तित किया जाए।
अंतिम परिणाम
यदि, अधिकांश लोगों की तरह, आप केवल कुछ पत्रिका लेख और कुछ घरेलू बिल स्कैन करना चाहते हैं, तो आपको इन दस्तावेजों को संपादित करने की आवश्यकता नहीं है। इसलिए, पीडीएफ को सीधे रूपांतरित करना आपके लिए उपयुक्त होगा, क्योंकि आप अभी भी उन दस्तावेजों को खोज सकेंगे। इसके लिए, नि: शुल्क ऑनलाइन ओसीआर निश्चित रूप से सबसे अच्छा मुफ्त उपकरण था जिसे हमने परीक्षण किया था। कहा जा रहा है, अगर आप प्रति माह पूर्णता के लिए $ 5 का भुगतान करने को तैयार हैं, एबीबीवाई का फाइनराइडर ऑनलाइन थोड़ा और सटीक था।
जब दस्तावेजों को डीओसी में परिवर्तित करने की बात आती है, तो हमने कोई भी समाधान खोजने के लिए प्रबंधन नहीं किया, जो सही था, लेकिन अब तक के सर्वोत्तम परिणाम ऑनलाइन ओसीआर. रूपांतरण सही नहीं था, लेकिन स्वरूपण की अखंडता को काफी हद तक बरकरार रखा गया था, और गलतियां नगण्य थीं। जब हम इन परिणामों की तुलना ABBYY से मिलने वाले "प्रीमियम" ऑफर से करते हैं, तो आप मदद नहीं कर सकते, लेकिन बड़े पैमाने पर प्रभावित हो सकते हैं।
हमने शामिल नहीं किया Google ड्राइव की OCR क्षमताएं इस पोस्ट में; Google की हर इच्छा के लिए थोड़ा सा, लेकिन इस तथ्य के लिए कि हम कुछ अन्य मुफ्त ऑनलाइन ओसीआर सेवाओं का परीक्षण करना चाहते थे।
आपके ऊपर: आप हमारे पाठकों के लिए कौन से अन्य ऑनलाइन ओसीआर उपकरण सुझाएंगे? और जो आपने कोशिश की है कि आप फिर कभी उपयोग नहीं करते हैं?
रॉब नाइटिंगेल के पास यॉर्क विश्वविद्यालय, यूके से दर्शनशास्त्र में डिग्री है। उन्होंने पांच वर्षों तक सोशल मीडिया मैनेजर और सलाहकार के रूप में काम किया है, जबकि कई देशों में कार्यशालाएं दी हैं। पिछले दो वर्षों के लिए, रोब एक प्रौद्योगिकी लेखक भी रहे हैं, और मेकयूसेफ के सोशल मीडिया मैनेजर और न्यूज़लेटर संपादक हैं। आप आमतौर पर उसे…