Python'da Derin ÃÄrenme Tabanlı OCR Ãözümü
Görsellerden hassas metin çıkarma ve tanıma için docTR'yi kullanın
Python için docTR API nedir?
docTR (Document Text Recognition), Python için derin öÄrenme tabanlı açık kaynak bir Optik Karakter Tanıma (OCR) kütüphanesidir. TaranmıŠbelgeler, görseller ve PDF'ler için geliÅmiÅ metin algılama ve tanıma özellikleri sunar. Modern derin öÄrenme mimarilerini kullanarak docTR, belge yapısını korurken yüksek doÄruluk ve verimlilik saÄlar.
docTR, belge dijitalleÅtirme, otomatik veri çıkarma ve AI tabanlı metin tanıma uygulamalarında yaygın olarak kullanılır. Ãoklu dil desteÄi, el yazısı tanıma ve daha iyi performans için GPU hızlandırma özelliklerini destekler.
docTR API Temel Ãzellikleri
- GeliÅmiÅ derin öÄrenme OCR: Hassas metin algılama ve tanıma için sinir aÄları kullanır
- Ãoklu format desteÄi: Görseller, PDF'ler ve taranmıŠbelgelerle sorunsuz çalıÅır
- El yazısı tanıma: Yüksek doÄrulukla el yazısı metinleri algılar ve çıkarır
- Ãok dilli tanıma: ÃeÅitli dilleri ve yazı sistemlerini destekler
- Hız için optimize edilmiÅ: GPU hızlandırma ile verimli metin çıkarma
- Belge düzenini korur: Metin tanıma sırasında yapıyı muhafaza eder
- Ãlçeklenebilir ve açık kaynak: Ãcretsiz kullanım ve sürekli geliÅtirme
docTR API'ye BaÅlarken
docTR'yi kurmak için aÅaÄıdaki pip komutunu kullanın:
docTR'yi kurun
pip install python-doctr
Daha hızlı iÅlem için GPU hızlandırmayı etkinleÅtirmek isterseniz, ek baÄımlılıkları kurun:
GPU baÄımlılıklarını kurun
pip install tensorflow-gpu torch torchvision
docTR API ile Metin Ãıkarma Kod Ãrnekleri
AÅaÄıda docTR kullanarak görsellerden ve belgelerden metin çıkarmayı gösteren çeÅitli örnekler bulunmaktadır.

Ãrnek 1: Görselden Metin Ãıkarma
Bu örnek, bir görsel yükleme, docTR ile OCR uygulama ve metin çıkarma iÅlemini gösterir. Ãıkarılan metin, görsel içindeki konumunu içerir ve yapılandırılmıŠbelge iÅleme için kullanıÅlıdır.
Görselden metin çıkar
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Ãrnek 2: Ãok Sayfalı PDF Belgesi İÅleme
Ãok sayfalı bir PDF dosyasından metin çıkarmanız gerekiyorsa, docTR bu süreci basitleÅtirir. AÅaÄıdaki örnek, her sayfadan verimli bir Åekilde metin çıkarmayı gösterir.
PDF'den metin çıkar
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Ãrnek 3: El Yazısı Metin Tanıma
docTR ayrıca el yazısı metinleri tanıyabilir, bu da el yazısı notların, formların veya tarihi belgelerin dijitalleÅtirilmesi için idealdir. Bu örnek, sentetik bir el yazısı belgeden metin çıkarmayı gösterir.
El yazısı metin çıkar
from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents
doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Sonuç
docTR API, görsellerden, PDF'lerden ve el yazısı belgelerden metin çıkarmayı kolaylaÅtıran güçlü bir derin öÄrenme tabanlı OCR çözümüdür. Belge yapısını korurken yüksek doÄruluk saÄlar ve AI tabanlı belge iÅleme, otomasyon ve veri çıkarma için deÄerli bir araçtır.
İster belge dijitalleÅtirme, ister otomatik veri giriÅi veya AI tabanlı metin tanıma üzerinde çalıÅıyor olun, docTR ihtiyaçlarınıza uygun esnek ve verimli bir çözüm sunar.