Python'da Derin ÃÄrenme TabanlÄ± OCR ÃÃ¶zÃ¼mÃ¼

GÃ¶rsellerden hassas metin Ã§Ä±karma ve tanÄ±ma iÃ§in docTR'yi kullanÄ±n

Python iÃ§in docTR API nedir?

docTR (Document Text Recognition), Python iÃ§in derin Ã¶Ärenme tabanlÄ± aÃ§Ä±k kaynak bir Optik Karakter TanÄ±ma (OCR) kÃ¼tÃ¼phanesidir. TaranmÄ±Å belgeler, gÃ¶rseller ve PDF'ler iÃ§in geliÅmiÅ metin algÄ±lama ve tanÄ±ma Ã¶zellikleri sunar. Modern derin Ã¶Ärenme mimarilerini kullanarak docTR, belge yapÄ±sÄ±nÄ± korurken yÃ¼ksek doÄruluk ve verimlilik saÄlar.

docTR, belge dijitalleÅtirme, otomatik veri Ã§Ä±karma ve AI tabanlÄ± metin tanÄ±ma uygulamalarÄ±nda yaygÄ±n olarak kullanÄ±lÄ±r. Ãoklu dil desteÄi, el yazÄ±sÄ± tanÄ±ma ve daha iyi performans iÃ§in GPU hÄ±zlandÄ±rma Ã¶zelliklerini destekler.

docTR API Temel Ãzellikleri

GeliÅmiÅ derin Ã¶Ärenme OCR: Hassas metin algÄ±lama ve tanÄ±ma iÃ§in sinir aÄlarÄ± kullanÄ±r
Ãoklu format desteÄi: GÃ¶rseller, PDF'ler ve taranmÄ±Å belgelerle sorunsuz Ã§alÄ±ÅÄ±r
El yazÄ±sÄ± tanÄ±ma: YÃ¼ksek doÄrulukla el yazÄ±sÄ± metinleri algÄ±lar ve Ã§Ä±karÄ±r
Ãok dilli tanÄ±ma: ÃeÅitli dilleri ve yazÄ± sistemlerini destekler
HÄ±z iÃ§in optimize edilmiÅ: GPU hÄ±zlandÄ±rma ile verimli metin Ã§Ä±karma
Belge dÃ¼zenini korur: Metin tanÄ±ma sÄ±rasÄ±nda yapÄ±yÄ± muhafaza eder
ÃlÃ§eklenebilir ve aÃ§Ä±k kaynak: Ãcretsiz kullanÄ±m ve sÃ¼rekli geliÅtirme

docTR API'ye BaÅlarken

docTR'yi kurmak iÃ§in aÅaÄÄ±daki pip komutunu kullanÄ±n:

docTR'yi kurun


pip install python-doctr

Daha hÄ±zlÄ± iÅlem iÃ§in GPU hÄ±zlandÄ±rmayÄ± etkinleÅtirmek isterseniz, ek baÄÄ±mlÄ±lÄ±klarÄ± kurun:

GPU baÄÄ±mlÄ±lÄ±klarÄ±nÄ± kurun


pip install tensorflow-gpu torch torchvision

docTR API ile Metin ÃÄ±karma Kod Ãrnekleri

AÅaÄÄ±da docTR kullanarak gÃ¶rsellerden ve belgelerden metin Ã§Ä±karmayÄ± gÃ¶steren Ã§eÅitli Ã¶rnekler bulunmaktadÄ±r.

OCR iÃ§in docTR API

Ãrnek 1: GÃ¶rselden Metin ÃÄ±karma

Bu Ã¶rnek, bir gÃ¶rsel yÃ¼kleme, docTR ile OCR uygulama ve metin Ã§Ä±karma iÅlemini gÃ¶sterir. ÃÄ±karÄ±lan metin, gÃ¶rsel iÃ§indeki konumunu iÃ§erir ve yapÄ±landÄ±rÄ±lmÄ±Å belge iÅleme iÃ§in kullanÄ±ÅlÄ±dÄ±r.

GÃ¶rselden metin Ã§Ä±kar


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Ãrnek 2: Ãok SayfalÄ± PDF Belgesi Ä°Åleme

Ãok sayfalÄ± bir PDF dosyasÄ±ndan metin Ã§Ä±karmanÄ±z gerekiyorsa, docTR bu sÃ¼reci basitleÅtirir. AÅaÄÄ±daki Ã¶rnek, her sayfadan verimli bir Åekilde metin Ã§Ä±karmayÄ± gÃ¶sterir.

PDF'den metin Ã§Ä±kar


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Ãrnek 3: El YazÄ±sÄ± Metin TanÄ±ma

docTR ayrÄ±ca el yazÄ±sÄ± metinleri tanÄ±yabilir, bu da el yazÄ±sÄ± notlarÄ±n, formlarÄ±n veya tarihi belgelerin dijitalleÅtirilmesi iÃ§in idealdir. Bu Ã¶rnek, sentetik bir el yazÄ±sÄ± belgeden metin Ã§Ä±karmayÄ± gÃ¶sterir.

El yazÄ±sÄ± metin Ã§Ä±kar


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

SonuÃ§

docTR API, gÃ¶rsellerden, PDF'lerden ve el yazÄ±sÄ± belgelerden metin Ã§Ä±karmayÄ± kolaylaÅtÄ±ran gÃ¼Ã§lÃ¼ bir derin Ã¶Ärenme tabanlÄ± OCR Ã§Ã¶zÃ¼mÃ¼dÃ¼r. Belge yapÄ±sÄ±nÄ± korurken yÃ¼ksek doÄruluk saÄlar ve AI tabanlÄ± belge iÅleme, otomasyon ve veri Ã§Ä±karma iÃ§in deÄerli bir araÃ§tÄ±r.

Ä°ster belge dijitalleÅtirme, ister otomatik veri giriÅi veya AI tabanlÄ± metin tanÄ±ma Ã¼zerinde Ã§alÄ±ÅÄ±yor olun, docTR ihtiyaÃ§larÄ±nÄ±za uygun esnek ve verimli bir Ã§Ã¶zÃ¼m sunar.

Python'da Derin ÃÄrenme TabanlÄ± OCR ÃÃ¶zÃ¼mÃ¼

GÃ¶rsellerden hassas metin Ã§Ä±karma ve tanÄ±ma iÃ§in docTR'yi kullanÄ±n

Python iÃ§in docTR API nedir?

docTR API Temel Ãzellikleri

docTR API'ye BaÅlarken

docTR'yi kurun

GPU baÄÄ±mlÄ±lÄ±klarÄ±nÄ± kurun

docTR API ile Metin ÃÄ±karma Kod Ãrnekleri

Ãrnek 1: GÃ¶rselden Metin ÃÄ±karma