РеÑение за OCR, базиÑано на дÑлбоко обÑÑение в Python
ÐзползвайÑе docTR за ÑоÑно извлиÑане и Ñазпознаване на ÑекÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑажениÑ.
Ðакво пÑедÑÑавлÑва docTR API за Python?
docTR (Document Text Recognition) е оÑвоÑен код OCR библиоÑека, базиÑана на дÑлбоко обÑÑение в Python. Ð¢Ñ Ð¿ÑедоÑÑÐ°Ð²Ñ Ð¼Ð¾Ð´ÐµÑно Ñазпознаване на ÑекÑÑ Ð·Ð° ÑканиÑани докÑменÑи, изобÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð¸ PDF Ñайлове. ÐлагодаÑение на ÑÑвÑеменниÑе аÑÑ Ð¸ÑекÑÑÑи за дÑлбоко обÑÑение, docTR гаÑанÑиÑа виÑока ÑоÑноÑÑ Ð¸ еÑекÑивноÑÑ Ð¿Ñи извлиÑанеÑо на ÑекÑÑ, каÑо ÑÑÑевÑеменно запазва ÑÑÑÑкÑÑÑаÑа на докÑменÑа.
docTR Ñе използва ÑиÑоко за дигиÑализаÑÐ¸Ñ Ð½Ð° докÑменÑи, авÑомаÑизиÑано извлиÑане на данни и AI-базиÑано Ñазпознаване на ÑекÑÑ. ÐоддÑÑжа множеÑÑво езиÑи, Ñазпознаване на ÑÑкопиÑен ÑекÑÑ Ð¸ GPU ÑÑкоÑение за повиÑена пÑоизводиÑелноÑÑ.
ÐÑновни Ñ Ð°ÑакÑеÑиÑÑики на docTR API
- ÐодеÑно OCR Ñ Ð´Ñлбоко обÑÑение: Ðзползва невÑонни мÑежи за пÑеÑизно Ñазпознаване на ÑекÑÑ.
- ÐоддÑÑжка на ÑазлиÑни ÑоÑмаÑи: РабоÑи Ñ Ð¸Ð·Ð¾Ð±ÑажениÑ, PDF Ñайлове и ÑканиÑани докÑменÑи.
- Разпознаване на ÑÑкопиÑен ÑекÑÑ: ÐзвлиÑа ÑÑкопиÑен ÑекÑÑ Ñ Ð²Ð¸Ñока ÑоÑноÑÑ.
- ÐногоезиÑно Ñазпознаване: ÐоддÑÑжа ÑазлиÑни езиÑи и азбÑки.
- ÐпÑимизиÑан за ÑкоÑоÑÑ: ÐÑÑзо извлиÑане на ÑекÑÑ Ñ Ð¿Ð¾Ð¼Ð¾ÑÑа на GPU.
- Ðапазване на ÑÑÑÑкÑÑÑаÑа на докÑменÑа: СÑÑ ÑанÑва оÑоÑмлениеÑо пÑи Ñазпознаване на ÑекÑÑ.
- ÐÑвоÑен код и маÑабиÑÑемоÑÑ: ÐезплаÑен за използване и Ñедовно акÑÑализиÑан.
ÐÑÑви ÑÑÑпки Ñ docTR API
Ðа да инÑÑалиÑаÑе docTR, използвайÑе ÑледнаÑа команда Ñ pip:
ÐнÑÑалиÑане на docTR
pip install python-doctr
Ðко иÑкаÑе да акÑивиÑаÑе GPU ÑÑкоÑение за по-бÑÑза обÑабоÑка, инÑÑалиÑайÑе допÑлниÑелни завиÑимоÑÑи:
ÐнÑÑалиÑане на GPU завиÑимоÑÑи
pip install tensorflow-gpu torch torchvision
ÐÑимеÑи за извлиÑане на ÑекÑÑ Ñ docTR API
Ðо-Ð´Ð¾Ð»Ñ Ñа пÑедÑÑавени пÑимеÑи за извлиÑане на ÑекÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð¸ докÑменÑи Ñ docTR.
ÐÑÐ¸Ð¼ÐµÑ 1: ÐзвлиÑане на ÑекÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±Ñажение
Този пÑÐ¸Ð¼ÐµÑ Ð¿Ð¾ÐºÐ°Ð·Ð²Ð° как да заÑедиÑе изобÑажение, да пÑиложиÑе OCR Ñ docTR и да извлеÑеÑе ÑекÑÑа.

ÐзвлиÑане на ÑекÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±Ñажение
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
ÐÑÐ¸Ð¼ÐµÑ 2: ÐбÑабоÑка на PDF Ñ Ð½Ñколко ÑÑÑаниÑи
Този пÑÐ¸Ð¼ÐµÑ Ð¿Ð¾ÐºÐ°Ð·Ð²Ð° как да извлеÑеÑе ÑекÑÑ Ð¾Ñ PDF докÑÐ¼ÐµÐ½Ñ Ñ Ð½Ñколко ÑÑÑаниÑи.
ÐзвлиÑане на ÑекÑÑ Ð¾Ñ PDF
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Ðодобни ÐÑодÑкÑи
- EasyOCR API â ÐзÑеÑпаÑелно опÑиÑно Ñазпознаване на знаÑи (OCR) на Python
- PaddleOCR API â ÐиÑокопÑоизводиÑелно опÑиÑно Ñазпознаване на Ñимволи
- pdfminer.six Python библиоÑека | ÐзвлиÑане на ÑекÑÑ Ð¾Ñ PDF Ñайлове
- PyMuPDF Python API | РазÑиÑено анализиÑане и извлиÑане на PDF