ÎÏÏη OCR με Deep Learning Ïε Python
ΧÏηÏιμοÏοιήÏÏε Ïο docTR για ακÏιβή εξαγÏγή και αναγνÏÏιÏη κειμÎÎ½Î¿Ï Î±ÏÏ ÎµÎ¹ÎºÏνεÏ.
Τι είναι Ïο docTR API για Python;
Το docTR (Document Text Recognition) είναι μια βιβλιοθήκη OCR ανοιÏÏÎ¿Ï ÎºÏδικα βαÏιÏμÎνη Ïε Deep Learning για Ïην Python. ΠαÏÎÏει κοÏÏ Ïαία αναγνÏÏιÏη και ανίÏÎ½ÎµÏ Ïη κειμÎÎ½Î¿Ï Î³Î¹Î± ÏαÏÏμÎνα ÎγγÏαÏα, εικÏÎ½ÎµÏ ÎºÎ±Î¹ αÏÏεία PDF. ΧÏηÏιμοÏοιÏνÏÎ±Ï ÏÏοηγμÎÎ½ÎµÏ Î±ÏÏιÏεκÏονικÎÏ Deep Learning, Ïο docTR εξαÏÏαλίζει Ï Ïηλή ακÏίβεια και αÏοδοÏικÏÏηÏα ÏÏην εξαγÏγή κειμÎÎ½Î¿Ï , διαÏηÏÏνÏÎ±Ï ÏαÏάλληλα Ïη δομή ÏÎ¿Ï ÎµÎ³Î³ÏάÏÎ¿Ï .
Το docTR ÏÏηÏιμοÏοιείÏαι ÎµÏ ÏÎÏÏ Î³Î¹Î± ÏηÏιοÏοίηÏη εγγÏάÏÏν, Î±Ï ÏομαÏοÏοιημÎνη εξαγÏγή δεδομÎνÏν και εÏαÏμογÎÏ AI για αναγνÏÏιÏη κειμÎÎ½Î¿Ï . Î¥ÏοÏÏηÏίζει ÏολλÎÏ Î³Î»ÏÏÏεÏ, αναγνÏÏιÏη ÏειÏÏγÏαÏÎ¿Ï ÎºÎµÎ¹Î¼ÎÎ½Î¿Ï ÎºÎ±Î¹ εÏιÏάÏÏ Î½Ïη GPU για βελÏιÏμÎνη αÏÏδοÏη.
ÎαÏικÎÏ Î»ÎµÎ¹ÏÎ¿Ï ÏÎ³Î¯ÎµÏ ÏÎ¿Ï docTR API
- Î ÏοηγμÎνο OCR με Deep Learning: ΧÏηÏιμοÏοιεί Î½ÎµÏ ÏÏνικά δίκÏÏ Î± για ακÏιβή ανίÏÎ½ÎµÏ Ïη και αναγνÏÏιÏη κειμÎÎ½Î¿Ï .
- Î¥ÏοÏÏήÏιξη διαÏÏÏÏν μοÏÏÏν: ÎειÏÎ¿Ï Ïγεί άÏογα με εικÏνεÏ, αÏÏεία PDF και ÏαÏÏμÎνα ÎγγÏαÏα.
- ÎναγνÏÏιÏη ÏειÏÏγÏαÏÎ¿Ï ÎºÎµÎ¹Î¼ÎÎ½Î¿Ï : ÎναγνÏÏίζει και εξάγει ÏειÏÏγÏαÏο κείμενο με Ï Ïηλή ακÏίβεια.
- Î Î¿Î»Ï Î³Î»ÏÏÏική Ï ÏοÏÏήÏιξη: ÎναγνÏÏίζει κείμενο Ïε διάÏοÏÎµÏ Î³Î»ÏÏÏÎµÏ ÎºÎ±Î¹ γÏαμμαÏοÏειÏÎÏ.
- ÎελÏιÏÏοÏοιημÎνο για ÏαÏÏÏηÏα: ÎÏοÏελεÏμαÏική εξαγÏγή κειμÎÎ½Î¿Ï Î¼Îµ εÏιÏάÏÏ Î½Ïη GPU.
- ÎιαÏηÏεί Ïη δομή ÏÎ¿Ï ÎµÎ³Î³ÏάÏÎ¿Ï : ÎιαÏÏαλίζει ÏÏι η μοÏÏοÏοίηÏη ÏαÏαμÎνει ανÎÏαÏη καÏά Ïην αναγνÏÏιÏη κειμÎÎ½Î¿Ï .
- ÎÏεκÏάÏιμο και ανοιÏÏÎ¿Ï ÎºÏδικα: ÎιαÏίθεÏαι δÏÏεάν και Ï ÏοÏÏηÏίζεÏαι ενεÏγά.
ÎεκινÏνÏÎ±Ï Î¼Îµ Ïο docTR API
Îια να εγκαÏαÏÏήÏεÏε Ïο docTR, ÏÏηÏιμοÏοιήÏÏε Ïην ακÏÎ»Î¿Ï Î¸Î· ενÏολή Pip:
ÎγκαÏάÏÏαÏη ÏÎ¿Ï docTR
pip install python-doctr
Îν θÎλεÏε να ενεÏγοÏοιήÏεÏε Ïην εÏιÏάÏÏ Î½Ïη GPU για ÏαÏÏÏεÏη εÏεξεÏγαÏία, εγκαÏαÏÏήÏÏε ÏÏÏÏθεÏÎµÏ ÎµÎ¾Î±ÏÏήÏειÏ:
ÎγκαÏάÏÏαÏη εξαÏÏήÏεÏν για GPU
pip install tensorflow-gpu torch torchvision
ΠαÏαδείγμαÏα κÏδικα για εξαγÏγή κειμÎÎ½Î¿Ï Î¼Îµ Ïο docTR API
Τα ÏαÏακάÏÏ ÏαÏαδείγμαÏα δείÏÎ½Î¿Ï Î½ ÏÏÏ Î½Î± εξάγεÏε κείμενο αÏÏ ÎµÎ¹ÎºÏÎ½ÎµÏ ÎºÎ±Î¹ ÎγγÏαÏα με Ïο docTR.

ΠαÏάδειγμα 1: ÎξαγÏγή κειμÎÎ½Î¿Ï Î±ÏÏ ÎµÎ¹ÎºÏνα
ÎξαγÏγή κειμÎÎ½Î¿Ï Î±ÏÏ ÎµÎ¹ÎºÏνα
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
ΠαÏάδειγμα 2: ÎÏεξεÏγαÏία PDF ÏολλαÏλÏν ÏελίδÏν
ÎξαγÏγή κειμÎÎ½Î¿Ï Î±ÏÏ PDF
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
ΠαÏάδειγμα 3: ÎναγνÏÏιÏη ÏειÏÏγÏαÏÎ¿Ï ÎºÎµÎ¹Î¼ÎνοÏ
ÎξαγÏγή ÏειÏÏγÏαÏÎ¿Ï ÎºÎµÎ¹Î¼ÎνοÏ
from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents
doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Î£Ï Î¼ÏÎÏαÏμα
Το docTR API είναι μια ιÏÏÏ Ïή λÏÏη OCR ÏÎ¿Ï Î²Î±ÏίζεÏαι Ïε Deep Learning, αÏλοÏοιÏνÏÎ±Ï Ïην εξαγÏγή κειμÎÎ½Î¿Ï Î±ÏÏ ÎµÎ¹ÎºÏνεÏ, PDF και ÏειÏÏγÏαÏα ÎγγÏαÏα. ΠαÏÎÏει Ï Ïηλή ακÏίβεια διαÏηÏÏνÏÎ±Ï Ïη μοÏÏοÏοίηÏη ÏÎ¿Ï ÎµÎ³Î³ÏάÏÎ¿Ï ÎºÎ±Î¹ είναι Îνα ÏολÏÏιμο εÏγαλείο για AI-driven εÏεξεÏγαÏία εγγÏάÏÏν, Î±Ï ÏομαÏοÏοίηÏη και εξαγÏγή δεδομÎνÏν.