ÐÐ¾Ð´ÐµÑÐ½Ð¾ OCR Ñ Ð´ÑÐ»Ð±Ð¾ÐºÐ¾ Ð¾Ð±ÑÑÐµÐ½Ð¸Ðµ: ÐÐ·Ð¿Ð¾Ð»Ð·Ð²Ð° Ð½ÐµÐ²ÑÐ¾Ð½Ð½Ð¸ Ð¼ÑÐµÐ¶Ð¸ Ð·Ð° Ð¿ÑÐµÑÐ¸Ð·Ð½Ð¾ ÑÐ°Ð·Ð¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ.
ÐÐ¾Ð´Ð´ÑÑÐ¶ÐºÐ° Ð½Ð° ÑÐ°Ð·Ð»Ð¸ÑÐ½Ð¸ ÑÐ¾ÑÐ¼Ð°ÑÐ¸: Ð Ð°Ð±Ð¾ÑÐ¸ Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ, PDF ÑÐ°Ð¹Ð»Ð¾Ð²Ðµ Ð¸ ÑÐºÐ°Ð½Ð¸ÑÐ°Ð½Ð¸ Ð´Ð¾ÐºÑÐ¼ÐµÐ½ÑÐ¸.
Ð Ð°Ð·Ð¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ðµ Ð½Ð° ÑÑÐºÐ¾Ð¿Ð¸ÑÐµÐ½ ÑÐµÐºÑÑ: ÐÐ·Ð²Ð»Ð¸ÑÐ° ÑÑÐºÐ¾Ð¿Ð¸ÑÐµÐ½ ÑÐµÐºÑÑ Ñ Ð²Ð¸ÑÐ¾ÐºÐ° ÑÐ¾ÑÐ½Ð¾ÑÑ.
ÐÐ½Ð¾Ð³Ð¾ÐµÐ·Ð¸ÑÐ½Ð¾ ÑÐ°Ð·Ð¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ðµ: ÐÐ¾Ð´Ð´ÑÑÐ¶Ð° ÑÐ°Ð·Ð»Ð¸ÑÐ½Ð¸ ÐµÐ·Ð¸ÑÐ¸ Ð¸ Ð°Ð·Ð±ÑÐºÐ¸.
ÐÐ¿ÑÐ¸Ð¼Ð¸Ð·Ð¸ÑÐ°Ð½ Ð·Ð° ÑÐºÐ¾ÑÐ¾ÑÑ: ÐÑÑÐ·Ð¾ Ð¸Ð·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÐ° Ð½Ð° GPU.
ÐÐ°Ð¿Ð°Ð·Ð²Ð°Ð½Ðµ Ð½Ð° ÑÑÑÑÐºÑÑÑÐ°ÑÐ° Ð½Ð° Ð´Ð¾ÐºÑÐ¼ÐµÐ½ÑÐ°: Ð¡ÑÑÑÐ°Ð½ÑÐ²Ð° Ð¾ÑÐ¾ÑÐ¼Ð»ÐµÐ½Ð¸ÐµÑÐ¾ Ð¿ÑÐ¸ ÑÐ°Ð·Ð¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ.
ÐÑÐ²Ð¾ÑÐµÐ½ ÐºÐ¾Ð´ Ð¸ Ð¼Ð°ÑÐ°Ð±Ð¸ÑÑÐµÐ¼Ð¾ÑÑ: ÐÐµÐ·Ð¿Ð»Ð°ÑÐµÐ½ Ð·Ð° Ð¸Ð·Ð¿Ð¾Ð»Ð·Ð²Ð°Ð½Ðµ Ð¸ ÑÐµÐ´Ð¾Ð²Ð½Ð¾ Ð°ÐºÑÑÐ°Ð»Ð¸Ð·Ð¸ÑÐ°Ð½.

ÐÑÑÐ²Ð¸ ÑÑÑÐ¿ÐºÐ¸ Ñ docTR API

ÐÐ½ÑÑÐ°Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° docTR


pip install python-doctr

ÐÐ½ÑÑÐ°Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° GPU Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑÐ¸


pip install tensorflow-gpu torch torchvision

docTR API for OCR


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ PDF


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Ð ÐµÑÐµÐ½Ð¸Ðµ Ð·Ð° OCR, Ð±Ð°Ð·Ð¸ÑÐ°Ð½Ð¾ Ð½Ð° Ð´ÑÐ»Ð±Ð¾ÐºÐ¾ Ð¾Ð±ÑÑÐµÐ½Ð¸Ðµ Ð² Python

ÐÐ·Ð¿Ð¾Ð»Ð·Ð²Ð°Ð¹ÑÐµ docTR Ð·Ð° ÑÐ¾ÑÐ½Ð¾ Ð¸Ð·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð¸ ÑÐ°Ð·Ð¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ.

ÐÐ°ÐºÐ²Ð¾ Ð¿ÑÐµÐ´ÑÑÐ°Ð²Ð»ÑÐ²Ð° docTR API Ð·Ð° Python?

ÐÑÐ½Ð¾Ð²Ð½Ð¸ Ñ Ð°ÑÐ°ÐºÑÐµÑÐ¸ÑÑÐ¸ÐºÐ¸ Ð½Ð° docTR API

ÐÑÑÐ²Ð¸ ÑÑÑÐ¿ÐºÐ¸ Ñ docTR API

ÐÐ½ÑÑÐ°Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° docTR

ÐÐ½ÑÑÐ°Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° GPU Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑÐ¸

ÐÑÐ¸Ð¼ÐµÑÐ¸ Ð·Ð° Ð¸Ð·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ñ docTR API

ÐÑÐ¸Ð¼ÐµÑ 1: ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ðµ

ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ðµ

ÐÑÐ¸Ð¼ÐµÑ 2: ÐÐ±ÑÐ°Ð±Ð¾ÑÐºÐ° Ð½Ð° PDF Ñ Ð½ÑÐºÐ¾Ð»ÐºÐ¾ ÑÑÑÐ°Ð½Ð¸ÑÐ¸

ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ PDF

ÐÐ¾Ð´Ð¾Ð±Ð½Ð¸ ÐÑÐ¾Ð´ÑÐºÑÐ¸

Ð ÐµÑÐµÐ½Ð¸Ðµ Ð·Ð° OCR, Ð±Ð°Ð·Ð¸ÑÐ°Ð½Ð¾ Ð½Ð° Ð´ÑÐ»Ð±Ð¾ÐºÐ¾ Ð¾Ð±ÑÑÐµÐ½Ð¸Ðµ Ð² Python

ÐÐ·Ð¿Ð¾Ð»Ð·Ð²Ð°Ð¹ÑÐµ docTR Ð·Ð° ÑÐ¾ÑÐ½Ð¾ Ð¸Ð·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð¸ ÑÐ°Ð·Ð¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ñ.

ÐÐ°ÐºÐ²Ð¾ Ð¿ÑÐµÐ´ÑÑÐ°Ð²Ð»ÑÐ²Ð° docTR API Ð·Ð° Python?

ÐÑÐ½Ð¾Ð²Ð½Ð¸ ÑÐ°ÑÐ°ÐºÑÐµÑÐ¸ÑÑÐ¸ÐºÐ¸ Ð½Ð° docTR API

ÐÑÑÐ²Ð¸ ÑÑÑÐ¿ÐºÐ¸ Ñ docTR API

ÐÐ½ÑÑÐ°Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° docTR

ÐÐ½ÑÑÐ°Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° GPU Ð·Ð°Ð²Ð¸ÑÐ¸Ð¼Ð¾ÑÑÐ¸

ÐÑÐ¸Ð¼ÐµÑÐ¸ Ð·Ð° Ð¸Ð·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ñ docTR API

ÐÑÐ¸Ð¼ÐµÑ 1: ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ðµ

ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ Ð¸Ð·Ð¾Ð±ÑÐ°Ð¶ÐµÐ½Ð¸Ðµ

ÐÑÐ¸Ð¼ÐµÑ 2: ÐÐ±ÑÐ°Ð±Ð¾ÑÐºÐ° Ð½Ð° PDF Ñ Ð½ÑÐºÐ¾Ð»ÐºÐ¾ ÑÑÑÐ°Ð½Ð¸ÑÐ¸

ÐÐ·Ð²Ð»Ð¸ÑÐ°Ð½Ðµ Ð½Ð° ÑÐµÐºÑÑ Ð¾Ñ PDF

ÐÐ¾Ð´Ð¾Ð±Ð½Ð¸ ÐÑÐ¾Ð´ÑÐºÑÐ¸