मुखपृष्ठ » मुफ्त सॉफ्टवेयर डाउनलोड » पीडीएफ और छवि फ़ाइलों से पाठ निकालें

    पीडीएफ और छवि फ़ाइलों से पाठ निकालें

    एक पीडीएफ दस्तावेज़ है जिसे आप सभी पाठ निकालना चाहते हैं? एक स्कैन किए गए दस्तावेज़ की छवि फ़ाइलों के बारे में क्या है जिसे आप संपादन योग्य पाठ में बदलना चाहते हैं? ये कुछ सबसे सामान्य समस्याएं हैं जो मैंने फाइलों के साथ काम करते समय कार्यस्थल पर देखी हैं.

    इस लेख में, मैं कई अलग-अलग तरीकों के बारे में बात करूँगा जो आप पीडीएफ से या एक छवि से पाठ निकालने की कोशिश कर सकते हैं। आपके निष्कर्षण परिणाम पीडीएफ या छवि में पाठ के प्रकार और गुणवत्ता के आधार पर भिन्न होंगे। इसके अलावा, आपके परिणाम आपके द्वारा उपयोग किए जाने वाले उपकरण के आधार पर अलग-अलग होंगे, इसलिए सर्वोत्तम परिणाम प्राप्त करने के लिए नीचे दिए गए विकल्पों में से अधिक से अधिक प्रयास करना सर्वोत्तम है।.

    छवि या पीडीएफ से पाठ निकालें

    शुरू करने का सबसे सरल और तेज तरीका एक ऑनलाइन पीडीएफ टेक्स्ट एक्सट्रैक्टर सेवा है। ये सामान्य रूप से स्वतंत्र हैं और आपके कंप्यूटर पर कुछ भी स्थापित किए बिना आपको वही दे सकते हैं जिसकी आपको तलाश है। यहाँ दो हैं जिनका मैंने उत्कृष्ट परिणामों के साथ बहुत अच्छे उपयोग किया है:

    ExtractPDF

    ExtractPDF एक फ्री टूल है जो इमेज, टेक्स्ट और फोंट को पीडीएफ फाइल से बाहर ले जाता है। केवल सीमा यह है कि पीडीएफ फाइल के लिए अधिकतम आकार 10 एमबी है। वह थोड़ा छोटा है; इसलिए यदि आपके पास एक बड़ी फ़ाइल है, तो नीचे दिए गए कुछ अन्य तरीकों को आज़माएँ। अपनी फ़ाइल चुनें और फिर क्लिक करें फाइल भेज बटन। परिणाम आम तौर पर बहुत तेज़ होते हैं और पाठ टैब पर क्लिक करने पर आपको पाठ का पूर्वावलोकन देखना चाहिए.

    यह भी एक अच्छा जोड़ा लाभ है कि यह पीडीएफ फाइल के बाहर भी छवियों को निकालता है, बस अगर आपको उन लोगों की आवश्यकता है! कुल मिलाकर, ऑनलाइन टूल बहुत अच्छा काम करता है, लेकिन मैंने पीडीएफ डॉक्स के एक जोड़े में भाग लिया है जो मुझे मज़ेदार आउटपुट देता है। पाठ केवल ठीक निकाला जाता है, लेकिन किसी कारण से प्रत्येक शब्द के बाद लाइन ब्रेक होगा! एक छोटी पीडीएफ फाइल के लिए बहुत बड़ी समस्या नहीं है, लेकिन निश्चित रूप से बहुत सारे पाठ वाली फाइलों के लिए एक मुद्दा है। यदि आपके साथ ऐसा होता है, तो अगले उपकरण का प्रयास करें.

    ऑनलाइन ओसीआर

    ऑनलाइन ओसीआर आमतौर पर उन दस्तावेजों के लिए काम करने के लिए जाता है जो एक्सट्रैक्टपीडीएफ के साथ ठीक से परिवर्तित नहीं हुए थे, इसलिए दोनों सेवाओं को देखने का प्रयास करना एक अच्छा विचार है जो आपको बेहतर आउटपुट देता है। ऑनलाइन OCR में कुछ अच्छे फीचर्स भी होते हैं जो किसी बड़ी पीडीएफ फाइल के साथ किसी के लिए भी उपयोगी साबित हो सकते हैं, जिसमें पूरे दस्तावेज के बजाय केवल कुछ पन्नों पर पाठ को बदलना होता है।.

    पहली चीज जो आप करना चाहते हैं, वह आगे जाकर एक मुफ्त खाता बनाना है। यह थोड़ा कष्टप्रद है, लेकिन यदि आप मुफ्त खाता नहीं बनाते हैं, तो यह केवल संपूर्ण दस्तावेज़ के बजाय आपके पीडीएफ को आंशिक रूप से बदल देगा। इसके अलावा, केवल 5 एमबी दस्तावेज़ को अपलोड करने में सक्षम होने के बजाय, आप 100 एमबी प्रति फ़ाइल एक खाते के साथ अपलोड कर सकते हैं.

    सबसे पहले, एक भाषा चुनें और फिर आउटपुट फ़ाइल के प्रकार को चुनें जिसे आप कनवर्ट की गई फ़ाइल के लिए चाहते हैं। आपके पास कुछ विकल्प हैं और आप चाहें तो एक से अधिक विकल्प चुन सकते हैं। के अंतर्गत दस्तावेज़ को गुणा करें, आप चुन सकते हैं पृष्ठ संख्या और फिर केवल उन पृष्ठों को चुनें जिन्हें आप कनवर्ट करना चाहते हैं। फिर आप फ़ाइल का चयन करें और क्लिक करें बदलना!

    रूपांतरण के बाद, आपको दस्तावेज़ अनुभाग में लाया जाएगा (यदि आप लॉग इन हैं) जहां आप देख सकते हैं कि आपके पास कितनी उपलब्ध मुफ्त पृष्ठ हैं और आपकी परिवर्तित फ़ाइलों को डाउनलोड करने के लिए लिंक हैं। ऐसा लगता है कि आपके पास एक दिन में केवल 25 पृष्ठ मुफ्त हैं, इसलिए यदि आपको इससे अधिक की आवश्यकता है, तो आपको या तो थोड़ा इंतजार करना होगा या अन्य पेज खरीदने होंगे।.

    ऑनलाइन OCR ने मेरे PDF को रूपांतरित करने का उत्कृष्ट कार्य किया क्योंकि यह पाठ के वास्तविक लेआउट को बनाए रखने में सक्षम था। अपने परीक्षण में, मैंने एक वर्ड डॉक लिया, जिसमें गोलियों, विभिन्न फ़ॉन्ट आकारों आदि का उपयोग किया और इसे एक पीडीएफ में परिवर्तित किया। तब मैंने ऑनलाइन OCR का उपयोग करके इसे वापस वर्ड फॉर्मेट में बदल दिया और यह लगभग 95% मूल के समान था। मेरे लिए यह बहुत प्रभावशाली है.

    इसके अलावा, यदि आप किसी छवि को टेक्स्ट में बदलना चाहते हैं, तो ऑनलाइन ओसीआर पीडीएफ फाइलों से टेक्स्ट निकालने के समान ही कर सकते हैं.

    मुफ्त ऑनलाइन ओसीआर

    चूँकि OCR पर पाठ के लिए छवि के बारे में बात कर रहे थे, इसलिए मैं एक और अच्छी वेबसाइट का उल्लेख करता हूँ जो चित्रों पर वास्तव में अच्छी तरह काम करती है। नि: शुल्क ऑनलाइन ओसीआर मेरे परीक्षण चित्रों से पाठ निकालने के दौरान बहुत अच्छा और बहुत सटीक था। मैंने अपने iPhone के पन्नों से पुस्तकों, पुस्तिकाओं, आदि से कुछ तस्वीरें लीं और मुझे आश्चर्य हुआ कि यह टेक्स्ट को कितनी अच्छी तरह से बदलने में सक्षम था.

    अपनी फ़ाइल चुनें और फिर अपलोड बटन पर क्लिक करें। अगली स्क्रीन पर, कुछ विकल्प और छवि का पूर्वावलोकन होता है। आप इसे काट सकते हैं यदि आप पूरी चीज को नहीं खरीदना चाहते हैं। फिर OCR बटन पर क्लिक करें और आपका परिवर्तित पाठ छवि पूर्वावलोकन के नीचे दिखाई देगा। इसकी भी कोई सीमा नहीं है, जो वास्तव में अच्छा है.

    ऑनलाइन सेवाओं के अलावा, दो फ्रीवेयर पीडीएफ कन्वर्टर्स हैं जिनका मैं उल्लेख करना चाहता हूं कि आपको रूपांतरण करने के लिए अपने कंप्यूटर पर स्थानीय रूप से सॉफ़्टवेयर चलाने की आवश्यकता है। ऑनलाइन सेवाओं के साथ, आपको हमेशा इंटरनेट कनेक्शन की आवश्यकता होगी और यह सभी के लिए संभव नहीं हो सकता है। हालांकि, मैंने देखा कि फ्रीवेयर कार्यक्रमों से रूपांतरण की गुणवत्ता वेबसाइटों की तुलना में काफी खराब थी.

    ए-पीडीएफ पाठ चिमटा

    ए-पीडीएफ टेक्स्ट एक्सट्रैक्टर फ्रीवेयर है जो पीडीएफ फाइलों से टेक्स्ट निकालने का काफी अच्छा काम करता है। एक बार जब आप इसे डाउनलोड करते हैं और इसे स्थापित करते हैं, तो अपनी पीडीएफ फाइल को चुनने के लिए ओपन बटन पर क्लिक करें। फिर प्रक्रिया शुरू करने के लिए एक्सट्रैक्ट टेक्स्ट पर क्लिक करें.

    यह आपको पाठ आउटपुट फ़ाइल को संग्रहीत करने के लिए एक स्थान पूछेगा और फिर यह निकालना शुरू कर देगा। आप पर भी क्लिक कर सकते हैं विकल्प बटन, जो आपको निकालने और निष्कर्षण प्रकार के लिए केवल कुछ पृष्ठ चुनने देता है। दूसरा विकल्प दिलचस्प है क्योंकि यह अलग-अलग लेआउट में पाठ को निकालता है और यह तीनों को देखने की कोशिश करने के लायक है जो आपको सबसे अच्छा आउटपुट देता है.

    PDF2Text पायलट

    PDF2Text पायलट टेक्स्ट को निकालने का एक अच्छा काम करता है। इसका कोई विकल्प नहीं है; आप बस फाइलें या फ़ोल्डर जोड़ते हैं, कन्वर्ट करते हैं और सर्वश्रेष्ठ के लिए आशा करते हैं। इसने कुछ पीडीएफ पर अच्छा काम किया, लेकिन उनमें से अधिकांश के लिए, कई मुद्दे थे.

    बस फ़ाइलें जोड़ें पर क्लिक करें और फिर क्लिक करें बदलना. रूपांतरण पूरा होने के बाद, फ़ाइल खोलने के लिए ब्राउज़ पर क्लिक करें। आप इस कार्यक्रम का उपयोग करके माइलेज अलग-अलग कर देंगे ताकि आपको ज्यादा उम्मीद न हो.

    इसके अलावा, यह ध्यान देने योग्य है कि यदि आप कॉर्पोरेट वातावरण में हैं या काम से एडोब एक्रोबैट की एक प्रति प्राप्त कर सकते हैं, तो आप वास्तव में बहुत बेहतर परिणाम प्राप्त कर सकते हैं। एक्रोबैट स्पष्ट रूप से मुक्त नहीं है, लेकिन इसमें पीडीएफ को वर्ड, एक्सेल और एचटीएमएल प्रारूप में बदलने के विकल्प हैं। यह मूल दस्तावेज़ की संरचना को बनाए रखने और जटिल पाठ को परिवर्तित करने का सबसे अच्छा काम भी करता है.