Giáº£i phÃ¡p OCR dá»±a trÃªn há»c sÃ¢u trong Python

Sá» dá»¥ng docTR Äá» trÃch xuáº¥t vÃ nháºn dáº¡ng vÄn báº£n chÃnh xÃ¡c tá»« hÃ¬nh áº£nh

API docTR cho Python lÃ gÃ¬?

docTR (Document Text Recognition) lÃ thÆ° viá»n mÃ£ nguá»n má» Nháºn dáº¡ng KÃ½ tá»± Quang há»c (OCR) dá»±a trÃªn há»c sÃ¢u cho Python. NÃ³ cung cáº¥p kháº£ nÄng phÃ¡t hiá»n vÃ nháºn dáº¡ng vÄn báº£n tiÃªn tiáº¿n cho tÃ i liá»u scan, hÃ¬nh áº£nh vÃ file PDF. Báº±ng cÃ¡ch sá» dá»¥ng cÃ¡c kiáº¿n trÃºc há»c sÃ¢u hiá»n Äáº¡i, docTR Äáº£m báº£o Äá» chÃnh xÃ¡c vÃ hiá»u quáº£ cao trong viá»c trÃch xuáº¥t vÄn báº£n trong khi váº«n giá»¯ nguyÃªn cáº¥u trÃºc tÃ i liá»u.

docTR ÄÆ°á»£c sá» dá»¥ng rá»ng rÃ£i cho sá» hÃ³a tÃ i liá»u, trÃch xuáº¥t dá»¯ liá»u tá»± Äá»ng vÃ cÃ¡c á»©ng dá»¥ng nháºn dáº¡ng vÄn báº£n AI. Há» trá»£ Äa ngÃ´n ngá»¯, nháºn dáº¡ng chá»¯ viáº¿t tay vÃ tÄng tá»c GPU Äá» cáº£i thiá»n hiá»u suáº¥t.

TÃnh nÄng chÃnh cá»§a API docTR

OCR há»c sÃ¢u nÃ¢ng cao: Sá» dá»¥ng máº¡ng nÆ¡-ron Äá» phÃ¡t hiá»n vÃ nháºn dáº¡ng vÄn báº£n chÃnh xÃ¡c
Há» trá»£ Äa Äá»nh dáº¡ng: LÃ m viá»c liá»n máº¡ch vá»i hÃ¬nh áº£nh, PDF vÃ tÃ i liá»u scan
Nháºn dáº¡ng chá»¯ viáº¿t tay: PhÃ¡t hiá»n vÃ trÃch xuáº¥t vÄn báº£n viáº¿t tay vá»i Äá» chÃnh xÃ¡c cao
Nháºn dáº¡ng Äa ngÃ´n ngá»¯: Há» trá»£ nhiá»u ngÃ´n ngá»¯ vÃ há» thá»ng chá»¯ viáº¿t
Tá»i Æ°u hÃ³a tá»c Äá»: TrÃch xuáº¥t vÄn báº£n hiá»u quáº£ vá»i tÄng tá»c GPU
Báº£o toÃ n bá» cá»¥c tÃ i liá»u: Giá»¯ nguyÃªn cáº¥u trÃºc trong quÃ¡ trÃ¬nh nháºn dáº¡ng vÄn báº£n
Má» rá»ng vÃ mÃ£ nguá»n má»: Miá»n phÃ sá» dá»¥ng vÃ liÃªn tá»¥c ÄÆ°á»£c cáº£i tiáº¿n

Báº¯t Äáº§u vá»i API docTR

Äá» cÃ i Äáº·t docTR, sá» dá»¥ng lá»nh pip sau:

CÃ i Äáº·t docTR


pip install python-doctr

Náº¿u muá»n báºt tÄng tá»c GPU Äá» xá» lÃ½ nhanh hÆ¡n, cÃ i Äáº·t cÃ¡c phá»¥ thuá»c bá» sung:

CÃ i Äáº·t phá»¥ thuá»c GPU


pip install tensorflow-gpu torch torchvision

VÃ dá»¥ mÃ£ trÃch xuáº¥t vÄn báº£n báº±ng API docTR

DÆ°á»i ÄÃ¢y lÃ má»t sá» vÃ dá»¥ minh há»a viá»c trÃch xuáº¥t vÄn báº£n tá»« hÃ¬nh áº£nh vÃ tÃ i liá»u báº±ng docTR.

API docTR cho OCR

VÃ dá»¥ 1: TrÃch xuáº¥t vÄn báº£n tá»« hÃ¬nh áº£nh

VÃ dá»¥ nÃ y minh há»a cÃ¡ch táº£i hÃ¬nh áº£nh, Ã¡p dá»¥ng OCR vá»i docTR vÃ trÃch xuáº¥t vÄn báº£n. VÄn báº£n trÃch xuáº¥t bao gá»m vá» trÃ cá»§a nÃ³ trong hÃ¬nh áº£nh, há»¯u Ãch cho xá» lÃ½ tÃ i liá»u cÃ³ cáº¥u trÃºc.

TrÃch xuáº¥t vÄn báº£n tá»« hÃ¬nh áº£nh


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

VÃ dá»¥ 2: Xá» lÃ½ tÃ i liá»u PDF nhiá»u trang

Náº¿u báº¡n cáº§n trÃch xuáº¥t vÄn báº£n tá»« file PDF chá»©a nhiá»u trang, docTR ÄÆ¡n giáº£n hÃ³a quÃ¡ trÃ¬nh nÃ y. VÃ dá»¥ sau minh há»a cÃ¡ch trÃch xuáº¥t vÄn báº£n tá»« má»i trang má»t cÃ¡ch hiá»u quáº£.

TrÃch xuáº¥t vÄn báº£n tá»« PDF


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

VÃ dá»¥ 3: Nháºn dáº¡ng chá»¯ viáº¿t tay

docTR cÅ©ng cÃ³ thá» nháºn dáº¡ng chá»¯ viáº¿t tay, lÃ½ tÆ°á»ng Äá» sá» hÃ³a ghi chÃº viáº¿t tay, biá»u máº«u hoáº·c tÃ i liá»u lá»ch sá». VÃ dá»¥ nÃ y minh há»a viá»c trÃch xuáº¥t vÄn báº£n tá»« tÃ i liá»u viáº¿t tay tá»ng há»£p.

TrÃch xuáº¥t chá»¯ viáº¿t tay


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Káº¿t luáºn

API docTR lÃ má»t giáº£i phÃ¡p OCR máº¡nh máº½ dá»±a trÃªn há»c sÃ¢u giÃºp ÄÆ¡n giáº£n hÃ³a viá»c trÃch xuáº¥t vÄn báº£n tá»« hÃ¬nh áº£nh, PDF vÃ tÃ i liá»u viáº¿t tay. NÃ³ Äáº£m báº£o Äá» chÃnh xÃ¡c cao trong khi váº«n giá»¯ nguyÃªn cáº¥u trÃºc tÃ i liá»u, trá» thÃ nh cÃ´ng cá»¥ giÃ¡ trá» cho xá» lÃ½ tÃ i liá»u AI, tá»± Äá»ng hÃ³a vÃ trÃch xuáº¥t dá»¯ liá»u.

DÃ¹ báº¡n Äang lÃ m viá»c vá»i sá» hÃ³a tÃ i liá»u, nháºp liá»u tá»± Äá»ng hay nháºn dáº¡ng vÄn báº£n AI, docTR cung cáº¥p giáº£i phÃ¡p linh hoáº¡t vÃ hiá»u quáº£ phÃ¹ há»£p vá»i nhu cáº§u cá»§a báº¡n.

Giáº£i phÃ¡p OCR dá»±a trÃªn há»c sÃ¢u trong Python

Sá»­ dá»¥ng docTR Äá» trÃ­ch xuáº¥t vÃ nháº­n dáº¡ng vÄn báº£n chÃ­nh xÃ¡c tá»« hÃ¬nh áº£nh

API docTR cho Python lÃ gÃ¬?

TÃ­nh nÄng chÃ­nh cá»§a API docTR

Báº¯t Äáº§u vá»i API docTR

CÃ i Äáº·t docTR

CÃ i Äáº·t phá»¥ thuá»c GPU

VÃ­ dá»¥ mÃ£ trÃ­ch xuáº¥t vÄn báº£n báº±ng API docTR

VÃ­ dá»¥ 1: TrÃ­ch xuáº¥t vÄn báº£n tá»« hÃ¬nh áº£nh

TrÃ­ch xuáº¥t vÄn báº£n tá»« hÃ¬nh áº£nh

VÃ­ dá»¥ 2: Xá»­ lÃ½ tÃ i liá»u PDF nhiá»u trang

TrÃ­ch xuáº¥t vÄn báº£n tá»« PDF

VÃ­ dá»¥ 3: Nháº­n dáº¡ng chá»¯ viáº¿t tay

TrÃ­ch xuáº¥t chá»¯ viáº¿t tay

Káº¿t luáº­n

Sáº£n Pháº©m TÆ°Æ¡ng Tá»±