RozwiÄzanie OCR oparte na uczeniu gÅÄbokim w Pythonie

Wykorzystaj docTR do precyzyjnego wydobywania i rozpoznawania tekstu z obrazÃ³w.

Czym jest interfejs API docTR dla Pythona?

docTR (Document Text Recognition) to otwartoÅºrÃ³dÅowa biblioteka optycznego rozpoznawania znakÃ³w (OCR) oparta na uczeniu gÅÄbokim dla Pythona. Zapewnia zaawansowane wykrywanie i rozpoznawanie tekstu w zeskanowanych dokumentach, obrazach i plikach PDF. WykorzystujÄc nowoczesne architektury uczenia gÅÄbokiego, docTR zapewnia wysokÄ dokÅadnoÅÄ i wydajnoÅÄ w wydobywaniu tekstu przy zachowaniu struktury dokumentu.

docTR jest szeroko stosowany w digitalizacji dokumentÃ³w, automatycznym wydobywaniu danych oraz aplikacjach rozpoznawania tekstu opartych na sztucznej inteligencji. ObsÅuguje wiele jÄzykÃ³w, rozpoznawanie pisma odrÄcznego oraz przyspieszenie GPU dla lepszej wydajnoÅci.

Kluczowe funkcje interfejsu API docTR

Zaawansowane OCR oparte na uczeniu gÅÄbokim: Wykorzystuje sieci neuronowe do precyzyjnego wykrywania i rozpoznawania tekstu
ObsÅuga wielu formatÃ³w: DziaÅa bezproblemowo z obrazami, PDF-ami i zeskanowanymi dokumentami
Rozpoznawanie pisma odrÄcznego: Wykrywa i wydobywa tekst odrÄczny z niezwykÅÄ dokÅadnoÅciÄ
Rozpoznawanie wielojÄzyczne: ObsÅuguje rÃ³Å¼ne jÄzyki i systemy pisma
Zoptymalizowany pod kÄtem szybkoÅci: Wydajne wydobywanie tekstu z wykorzystaniem przyspieszenia GPU
Zachowuje ukÅad dokumentu: Utrzymuje strukturÄ podczas rozpoznawania tekstu
Skalowalny i otwartoÅºrÃ³dÅowy: Darmowy w uÅ¼yciu i stale rozwijany

RozpoczÄcie pracy z interfejsem API docTR

Aby zainstalowaÄ docTR, uÅ¼yj nastÄpujÄcej komendy pip:

Zainstaluj docTR


pip install python-doctr

JeÅli chcesz wÅÄczyÄ przyspieszenie GPU dla szybszego przetwarzania, zainstaluj dodatkowe zaleÅ¼noÅci:

Zainstaluj zaleÅ¼noÅci GPU


pip install tensorflow-gpu torch torchvision

PrzykÅady kodu do wydobywania tekstu za pomocÄ interfejsu API docTR

PoniÅ¼ej znajduje siÄ kilka przykÅadÃ³w demonstrujÄcych wydobywanie tekstu z obrazÃ³w i dokumentÃ³w przy uÅ¼yciu docTR.

Interfejs API docTR dla OCR

PrzykÅad 1: Wydobywanie tekstu z obrazu

Ten przykÅad pokazuje, jak zaÅadowaÄ obraz, zastosowaÄ OCR za pomocÄ docTR i wydobyÄ tekst. Wydobyty tekst zawiera swoje poÅoÅ¼enie na obrazie, co jest przydatne w strukturalnym przetwarzaniu dokumentÃ³w.

WydobÄdÅº tekst z obrazu


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

PrzykÅad 2: Przetwarzanie wielostronicowego dokumentu PDF

JeÅli potrzebujesz wydobyÄ tekst z pliku PDF zawierajÄcego wiele stron, docTR upraszcza ten proces. PoniÅ¼szy przykÅad pokazuje, jak wydajnie wydobyÄ tekst z kaÅ¼dej strony.

WydobÄdÅº tekst z PDF


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

PrzykÅad 3: Rozpoznawanie tekstu odrÄcznego

docTR moÅ¼e rÃ³wnieÅ¼ rozpoznawaÄ tekst odrÄczny, co czyni go idealnym do digitalizacji odrÄcznych notatek, formularzy lub historycznych dokumentÃ³w. Ten przykÅad demonstruje wydobywanie tekstu z syntetycznego dokumentu odrÄcznego.

WydobÄdÅº tekst odrÄczny


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Podsumowanie

Interfejs API docTR to potÄÅ¼ne rozwiÄzanie OCR oparte na uczeniu gÅÄbokim, ktÃ³re upraszcza wydobywanie tekstu z obrazÃ³w, PDF-Ã³w i dokumentÃ³w odrÄcznych. Zapewnia wysokÄ dokÅadnoÅÄ przy zachowaniu struktury dokumentu, co czyni go cennym narzÄdziem do przetwarzania dokumentÃ³w opartego na sztucznej inteligencji, automatyzacji i wydobywania danych.

NiezaleÅ¼nie od tego, czy pracujesz nad digitalizacjÄ dokumentÃ³w, automatycznym wprowadzaniem danych, czy rozpoznawaniem tekstu opartym na sztucznej inteligencji, docTR oferuje elastyczne i wydajne rozwiÄzanie dostosowane do Twoich potrzeb.

RozwiÄ zanie OCR oparte na uczeniu gÅÄbokim w Pythonie

Wykorzystaj docTR do precyzyjnego wydobywania i rozpoznawania tekstu z obrazÃ³w.

Czym jest interfejs API docTR dla Pythona?

Kluczowe funkcje interfejsu API docTR

RozpoczÄcie pracy z interfejsem API docTR

Zainstaluj docTR

Zainstaluj zaleÅ¼noÅci GPU

PrzykÅady kodu do wydobywania tekstu za pomocÄ interfejsu API docTR

PrzykÅad 1: Wydobywanie tekstu z obrazu

WydobÄ dÅº tekst z obrazu

PrzykÅad 2: Przetwarzanie wielostronicowego dokumentu PDF

WydobÄ dÅº tekst z PDF

PrzykÅad 3: Rozpoznawanie tekstu odrÄcznego

WydobÄ dÅº tekst odrÄczny