लिनक्स में कमांड लाइन का उपयोग करके एक पीडीएफ फाइल को एडिटेबल टेक्स्ट में कैसे बदलें
आप पीडीएफ फाइल को संपादन योग्य पाठ में बदलना चाहते हैं, इसके कई कारण हैं। हो सकता है कि आपको एक पुराने दस्तावेज़ को संशोधित करने की आवश्यकता हो और आपके पास इसका पीडीएफ संस्करण हो। विंडोज में पीडीएफ फाइलों को बदलना आसान है, लेकिन अगर आप लिनक्स का उपयोग कर रहे हैं तो क्या होगा?
कोई चिंता नहीं। हम आपको दिखाएंगे कि पीडीएफ़टेक्स्ट नामक कमांड लाइन टूल का उपयोग करके पीडीएफ फाइलों को संपादन योग्य टेक्स्ट में आसानी से कैसे बदला जा सकता है, जो कि "पॉपलर-बर्तन" पैकेज का एक हिस्सा है। यह उपकरण पहले से ही स्थापित हो सकता है। यह जाँचने के लिए कि क्या आपके सिस्टम पर pdftotext स्थापित है, टर्मिनल विंडो खोलने के लिए "Ctrl + Alt + T" दबाएँ। प्रॉम्प्ट पर निम्न कमांड टाइप करें और "एंटर" दबाएं.
dpkg -s poppler-utils
नोट: जब हम इस लेख में कुछ लिखने के लिए कहते हैं और पाठ के चारों ओर उद्धरण होते हैं, तो उद्धरण टाइप न करें, जब तक कि हम अन्यथा निर्दिष्ट न करें.
यदि pdftotext स्थापित नहीं है, तो प्रॉम्प्ट पर निम्न कमांड टाइप करें और "एंटर" दबाएं.
sudo apt-get install पॉपलर-बर्तन
संकेत मिलने पर अपना पासवर्ड टाइप करें और "एंटर" दबाएँ।.
पीडीएफ को अलग-अलग प्रारूपों में बदलने, पीडीएफ फाइलों में हेरफेर करने और फाइलों के लिए जानकारी निकालने के लिए पॉपलर-यूटिलिटी पैकेज में कई उपकरण उपलब्ध हैं।.
निम्नलिखित पीडीएफ फाइल को एक संपादन योग्य पाठ फ़ाइल में परिवर्तित करने के लिए मूल आदेश है। टर्मिनल विंडो खोलने के लिए "Ctrl + Alt + T" दबाएं, प्रॉम्प्ट पर कमांड टाइप करें, और "एंटर" दबाएं.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
अपनी मूल PDF फ़ाइल के स्थान और नाम के अनुरूप करने के लिए प्रत्येक फ़ाइल का पथ बदलें और जहाँ आप परिणामी टेक्स्ट फ़ाइल को सहेजना चाहते हैं। इसके अलावा, अपनी फ़ाइलों के नामों के अनुरूप फ़ाइल नाम बदलें.
पाठ फ़ाइल बनाई जाती है और इसे वैसे ही खोला जा सकता है जैसे आप लिनक्स में किसी अन्य पाठ फ़ाइल को खोलेंगे.
परिवर्तित पाठ में आपके इच्छित स्थानों पर पंक्ति विराम नहीं हो सकता है। पीडीएफ फाइल में हर पंक्ति के पाठ के बाद लाइन ब्रेक डाले जाते हैं.
आप अपने दस्तावेज़ के लेआउट (हेडर, फ़ुटर, पेजिंग, इत्यादि) को मूल-पीडीएफ फाइल से “टेक्स्ट -आउट” ध्वज का उपयोग करके परिवर्तित टेक्स्ट फ़ाइल में संरक्षित कर सकते हैं।.
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
यदि आप केवल पीडीएफ फाइल में पृष्ठों की एक श्रृंखला को परिवर्तित करना चाहते हैं, तो उस श्रेणी में पहले और अंतिम पृष्ठों को निर्दिष्ट करने के लिए "-f" और "-l" (एक लोअरकेस "L") झंडे का उपयोग करें।.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
मालिक की पासवर्ड से संरक्षित और एन्क्रिप्ट की गई पीडीएफ फाइल को बदलने के लिए, "-ओपीडब्ल्यू" ध्वज का उपयोग करें (ध्वज का पहला वर्ण एक निचला अक्षर "O" है, शून्य नहीं).
pdftotext -opw 'पासवर्ड' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
परिवर्तित की जा रही "पीडीएफ" मूल पीडीएफ फाइल को संरक्षित करने के लिए उपयोग किया जाता है। सुनिश्चित करें कि "पासवर्ड" के आसपास सिंगल कोट्स दोहरे नहीं हैं.
यदि पीडीएफ फाइल को यूजर पासवर्ड से सुरक्षित और एन्क्रिप्ट किया गया है, तो "-वॉट" फ्लैग के बजाय "-upw" फ्लैग का उपयोग करें। बाकी कमांड वही है.
आप अंत-पंक्ति के प्रकार को भी निर्दिष्ट कर सकते हैं जो परिवर्तित पाठ पर लागू होता है। यह विशेष रूप से उपयोगी है यदि आप विंडोज या मैक जैसे किसी अलग ऑपरेटिंग सिस्टम पर फ़ाइल तक पहुंचने की योजना बनाते हैं। ऐसा करने के लिए, "-ओल" ध्वज का उपयोग करें (ध्वज में मध्य वर्ण एक लोअरकेस अक्षर "O" है, शून्य नहीं है) इसके बाद एक स्थान और अंत-पंक्ति वर्ण का प्रकार जिसे आप उपयोग करना चाहते हैं (" यूनिक्स "," डॉस ", या" मैक ").
नोट: यदि आप पाठ फ़ाइल के लिए फ़ाइल नाम निर्दिष्ट नहीं करते हैं, तो pdftotext स्वचालित रूप से PDF फ़ाइल नाम के आधार का उपयोग करता है और ".txt" एक्सटेंशन जोड़ता है। उदाहरण के लिए, "file.pdf" को "file.txt" में बदल दिया जाएगा। यदि पाठ फ़ाइल को "-" के रूप में निर्दिष्ट किया जाता है, तो परिवर्तित पाठ को stdout में भेजा जाता है, जिसका अर्थ है कि पाठ टर्मिनल विंडो में प्रदर्शित किया गया है और फ़ाइल में सहेजा नहीं गया है.
टर्मिनल विंडो को बंद करने के लिए, ऊपरी-बाएँ कोने में "X" बटन पर क्लिक करें.
Pdftotext कमांड के बारे में अधिक जानकारी के लिए, टर्मिनल विंडो में प्रॉम्प्ट पर "मैन पेज pdftotext" टाइप करें.