Tesseract.js ब्राउजर में छवि ओसीआर अनुवाद लाता है

OCR अनुवाद अभी भी सही नहीं है, लेकिन पिछले कुछ वर्षों में इसमें नाटकीय रूप से सुधार हुआ है। रास्ते में अग्रणी Tesseract है अनुवाद इंजन वर्तमान में खुली हुई है सी++.

हालांकि यह एक अविश्वसनीय पुस्तकालय है, लेकिन यह सॉफ्टवेयर के लिए प्रतिबंधित है। शुक्र है कि किसी ने Tesseract का एक भाग जावास्क्रिप्ट में बनाया, जिसे Tesseract.js कहा जाता है। यह 60 भाषाओं तक का समर्थन करता है और जब यह निश्चित रूप से सही नहीं है, यह अच्छी तरह से काम करता है.

स्थापना और सेटअप एक हवा है जहाँ आप कर सकते हैं किसी भी छवि तत्व को लक्षित करें पृष्ठ पर और चलाएँ Tesseract.recognize () समारोह। यह किसी भी प्रकार की छवि ले सकता है और यह स्वचालित रूप से होगा सेक और अनुवाद ब्राउज़र में सही है.

आप बहुत अधिक जटिल हो सकते हैं लेकिन सुंदरता है आप OCR कोड की एक पंक्ति के साथ कैसे चला सकते हैं.

यदि आप एक लाइव डेमो देखना चाहते हैं तो Tesseract.js लैंडिंग पृष्ठ देखें। यह उस ब्राउज़र में सही काम करता है जहाँ आप कर सकते हैं स्वचालित ओसीआर अनुवाद प्राप्त करने के लिए पाठ की किसी भी स्कैन की गई छवि को खींचें और छोड़ें.

आप इस उदाहरण को GitHub पेज के माध्यम से स्थानीय रूप से डाउनलोड कर सकते हैं या आप CDN से सही Tesseract.js स्क्रिप्ट को शामिल करके अपना स्वयं का ऐप बना सकते हैं.

सबसे सरल कोड उदाहरण निम्न की तरह दिखता है जहां मेरी छवि HTML छवि तत्व का सीधा संदर्भ है:

 Tesseract.recognize (myImage) .then (फ़ंक्शन (परिणाम) कंसोल.लॉग (परिणाम));

किसी भी तरह से यह पुस्तकालय वेब पर ओसीआर के साथ आगे बढ़ने में मददगार है। यह बिल्कुल सही है, लेकिन यह भी है वेब डेवलपर्स के लिए सर्वोत्तम संसाधन जो डायनेमिक इन-पेज OCR कार्यक्षमता चाहते हैं.

अधिक जानने के लिए Tesseract.js GitHub पृष्ठ देखें जहाँ आप लाइव डेमो देख सकते हैं और ऑनलाइन दस्तावेज़ के माध्यम से ब्राउज़ कर सकते हैं.