Ð§ÑÐ¾ ÑÐ°ÐºÐ¾Ðµ API docTR Ð´Ð»Ñ Python?

ÐÐ»ÑÑÐµÐ²ÑÐµ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑÐ¸ API docTR

ÐÑÐ¾Ð´Ð²Ð¸Ð½ÑÑÑÐ¹ OCR Ð½Ð° Ð³Ð»ÑÐ±Ð¾ÐºÐ¾Ð¼ Ð¾Ð±ÑÑÐµÐ½Ð¸Ð¸: ÐÑÐ¿Ð¾Ð»ÑÐ·ÑÐµÑ Ð½ÐµÐ¹ÑÐ¾Ð½Ð½ÑÐµ ÑÐµÑÐ¸ Ð´Ð»Ñ ÑÐ¾ÑÐ½Ð¾Ð³Ð¾ Ð¾Ð±Ð½Ð°ÑÑÐ¶ÐµÐ½Ð¸Ñ Ð¸ ÑÐ°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ñ ÑÐµÐºÑÑÐ°
ÐÐ¾Ð´Ð´ÐµÑÐ¶ÐºÐ° Ð½ÐµÑÐºÐ¾Ð»ÑÐºÐ¸Ñ ÑÐ¾ÑÐ¼Ð°ÑÐ¾Ð²: Ð Ð°Ð±Ð¾ÑÐ°ÐµÑ Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸ÑÐ¼Ð¸, PDF Ð¸ ÑÐºÐ°Ð½Ð¸ÑÐ¾Ð²Ð°Ð½Ð½ÑÐ¼Ð¸ Ð´Ð¾ÐºÑÐ¼ÐµÐ½ÑÐ°Ð¼Ð¸
Ð Ð°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ðµ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½Ð¾Ð³Ð¾ ÑÐµÐºÑÑÐ°: ÐÐ±Ð½Ð°ÑÑÐ¶Ð¸Ð²Ð°ÐµÑ Ð¸ Ð¸Ð·Ð²Ð»ÐµÐºÐ°ÐµÑ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½ÑÐ¹ ÑÐµÐºÑÑ Ñ Ð²ÑÑÐ¾ÐºÐ¾Ð¹ ÑÐ¾ÑÐ½Ð¾ÑÑÑÑ
ÐÐ½Ð¾Ð³Ð¾ÑÐ·ÑÑÐ½Ð¾Ðµ ÑÐ°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ðµ: ÐÐ¾Ð´Ð´ÐµÑÐ¶Ð¸Ð²Ð°ÐµÑ ÑÐ°Ð·Ð»Ð¸ÑÐ½ÑÐµ ÑÐ·ÑÐºÐ¸ Ð¸ ÑÐ¸ÑÑÐµÐ¼Ñ Ð¿Ð¸ÑÑÐ¼Ð°
ÐÐ¿ÑÐ¸Ð¼Ð¸Ð·Ð¸ÑÐ¾Ð²Ð°Ð½ Ð´Ð»Ñ ÑÐºÐ¾ÑÐ¾ÑÑÐ¸: ÐÑÑÐµÐºÑÐ¸Ð²Ð½Ð¾Ðµ Ð¸Ð·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ñ ÑÑÐºÐ¾ÑÐµÐ½Ð¸ÐµÐ¼ GPU
Ð¡Ð¾ÑÑÐ°Ð½ÐµÐ½Ð¸Ðµ ÑÑÑÑÐºÑÑÑÑ Ð´Ð¾ÐºÑÐ¼ÐµÐ½ÑÐ°: Ð¡Ð¾ÑÑÐ°Ð½ÑÐµÑ Ð¼Ð°ÐºÐµÑ Ð¿ÑÐ¸ ÑÐ°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ð¸ ÑÐµÐºÑÑÐ°
ÐÐ°ÑÑÑÐ°Ð±Ð¸ÑÑÐµÐ¼Ð¾ÑÑÑ Ð¸ Ð¾ÑÐºÑÑÑÑÐ¹ ÐºÐ¾Ð´: ÐÐµÑÐ¿Ð»Ð°ÑÐµÐ½ Ð² Ð¸ÑÐ¿Ð¾Ð»ÑÐ·Ð¾Ð²Ð°Ð½Ð¸Ð¸ Ð¸ Ð¿Ð¾ÑÑÐ¾ÑÐ½Ð½Ð¾ ÑÐ¾Ð²ÐµÑÑÐµÐ½ÑÑÐ²ÑÐµÑÑÑ

ÐÐ°ÑÐ°Ð»Ð¾ ÑÐ°Ð±Ð¾ÑÑ Ñ API docTR

Ð£ÑÑÐ°Ð½Ð¾Ð²ÐºÐ° docTR


pip install python-doctr

Ð£ÑÑÐ°Ð½Ð¾Ð²ÐºÐ° Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑÐµÐ¹ GPU


pip install tensorflow-gpu torch torchvision

API docTR Ð´Ð»Ñ OCR


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· PDF


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½Ð¾Ð³Ð¾ ÑÐµÐºÑÑÐ°


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ÐÐ°ÐºÐ»ÑÑÐµÐ½Ð¸Ðµ

OCR-ÑÐµÑÐµÐ½Ð¸Ðµ Ð½Ð° Ð¾ÑÐ½Ð¾Ð²Ðµ Ð³Ð»ÑÐ±Ð¾ÐºÐ¾Ð³Ð¾ Ð¾Ð±ÑÑÐµÐ½Ð¸Ñ Ð´Ð»Ñ Python

ÐÑÐ¿Ð¾Ð»ÑÐ·ÑÐ¹ÑÐµ docTR Ð´Ð»Ñ ÑÐ¾ÑÐ½Ð¾Ð³Ð¾ Ð¸Ð·Ð²Ð»ÐµÑÐµÐ½Ð¸Ñ Ð¸ ÑÐ°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ñ ÑÐµÐºÑÑÐ° Ð¸Ð· Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ð¹.

Ð§ÑÐ¾ ÑÐ°ÐºÐ¾Ðµ API docTR Ð´Ð»Ñ Python?

ÐÐ»ÑÑÐµÐ²ÑÐµ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑÐ¸ API docTR

ÐÐ°ÑÐ°Ð»Ð¾ ÑÐ°Ð±Ð¾ÑÑ Ñ API docTR

Ð£ÑÑÐ°Ð½Ð¾Ð²ÐºÐ° docTR

Ð£ÑÑÐ°Ð½Ð¾Ð²ÐºÐ° Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑÐµÐ¹ GPU

ÐÑÐ¸Ð¼ÐµÑÑ ÐºÐ¾Ð´Ð° Ð´Ð»Ñ Ð¸Ð·Ð²Ð»ÐµÑÐµÐ½Ð¸Ñ ÑÐµÐºÑÑÐ° Ñ Ð¸ÑÐ¿Ð¾Ð»ÑÐ·Ð¾Ð²Ð°Ð½Ð¸ÐµÐ¼ API docTR

ÐÑÐ¸Ð¼ÐµÑ 1: ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ

ÐÑÐ¸Ð¼ÐµÑ 2: ÐÐ±ÑÐ°Ð±Ð¾ÑÐºÐ° Ð¼Ð½Ð¾Ð³Ð¾ÑÑÑÐ°Ð½Ð¸ÑÐ½Ð¾Ð³Ð¾ PDF-Ð´Ð¾ÐºÑÐ¼ÐµÐ½ÑÐ°

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· PDF

ÐÑÐ¸Ð¼ÐµÑ 3: Ð Ð°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ðµ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½Ð¾Ð³Ð¾ ÑÐµÐºÑÑÐ°

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½Ð¾Ð³Ð¾ ÑÐµÐºÑÑÐ°

ÐÐ°ÐºÐ»ÑÑÐµÐ½Ð¸Ðµ

ÐÐ¾Ñ Ð¾Ð¶Ð¸Ðµ ÐÑÐ¾Ð´ÑÐºÑÑ

OCR-ÑÐµÑÐµÐ½Ð¸Ðµ Ð½Ð° Ð¾ÑÐ½Ð¾Ð²Ðµ Ð³Ð»ÑÐ±Ð¾ÐºÐ¾Ð³Ð¾ Ð¾Ð±ÑÑÐµÐ½Ð¸Ñ Ð´Ð»Ñ Python

ÐÑÐ¿Ð¾Ð»ÑÐ·ÑÐ¹ÑÐµ docTR Ð´Ð»Ñ ÑÐ¾ÑÐ½Ð¾Ð³Ð¾ Ð¸Ð·Ð²Ð»ÐµÑÐµÐ½Ð¸Ñ Ð¸ ÑÐ°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ñ ÑÐµÐºÑÑÐ° Ð¸Ð· Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ð¹.

Ð§ÑÐ¾ ÑÐ°ÐºÐ¾Ðµ API docTR Ð´Ð»Ñ Python?

ÐÐ»ÑÑÐµÐ²ÑÐµ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑÐ¸ API docTR

ÐÐ°ÑÐ°Ð»Ð¾ ÑÐ°Ð±Ð¾ÑÑ Ñ API docTR

Ð£ÑÑÐ°Ð½Ð¾Ð²ÐºÐ° docTR

Ð£ÑÑÐ°Ð½Ð¾Ð²ÐºÐ° Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑÐµÐ¹ GPU

ÐÑÐ¸Ð¼ÐµÑÑ ÐºÐ¾Ð´Ð° Ð´Ð»Ñ Ð¸Ð·Ð²Ð»ÐµÑÐµÐ½Ð¸Ñ ÑÐµÐºÑÑÐ° Ñ Ð¸ÑÐ¿Ð¾Ð»ÑÐ·Ð¾Ð²Ð°Ð½Ð¸ÐµÐ¼ API docTR

ÐÑÐ¸Ð¼ÐµÑ 1: ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ

ÐÑÐ¸Ð¼ÐµÑ 2: ÐÐ±ÑÐ°Ð±Ð¾ÑÐºÐ° Ð¼Ð½Ð¾Ð³Ð¾ÑÑÑÐ°Ð½Ð¸ÑÐ½Ð¾Ð³Ð¾ PDF-Ð´Ð¾ÐºÑÐ¼ÐµÐ½ÑÐ°

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÐµÐºÑÑÐ° Ð¸Ð· PDF

ÐÑÐ¸Ð¼ÐµÑ 3: Ð Ð°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ðµ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½Ð¾Ð³Ð¾ ÑÐµÐºÑÑÐ°

ÐÐ·Ð²Ð»ÐµÑÐµÐ½Ð¸Ðµ ÑÑÐºÐ¾Ð¿Ð¸ÑÐ½Ð¾Ð³Ð¾ ÑÐµÐºÑÑÐ°

ÐÐ°ÐºÐ»ÑÑÐµÐ½Ð¸Ðµ

ÐÐ¾ÑÐ¾Ð¶Ð¸Ðµ ÐÑÐ¾Ð´ÑÐºÑÑ