Pythonåãæ·±å±¤å¦ç¿ãã¼ã¹ã®OCRã½ãªã¥ã¼ã·ã§ã³

docTRãä½¿ç¨ãã¦ç»åããé«ç²¾åº¦ãªããã¹ãæ½åºã»èªèãå®ç¾

PythonåãdocTR APIã¨ã¯ï¼

docTR APIã®ä¸»ãªæ©è½

é«åº¦ãªæ·±å±¤å¦ç¿OCR: ãã¥ã¼ã©ã«ãããã¯ã¼ã¯ãä½¿ç¨ããç²¾å¯ãªããã¹ãæ¤åºã»èªè
ãã«ããã©ã¼ãããå¯¾å¿: ç»åãPDFãã¹ãã£ã³ææ¸ã¨ã·ã¼ã ã¬ã¹ã«é£æº
ææ¸ãæåèªè: é©ç°çãªç²¾åº¦ã§ææ¸ãããã¹ããæ¤åºã»æ½åº
å¤è¨èªèªè: æ§ããªè¨èªã¨æåä½ç³»ããµãã¼ã
éåº¦æé©å: GPUã¢ã¯ã»ã©ã¬ã¼ã·ã§ã³ã«ããå¹ççãªããã¹ãæ½åº
ææ¸ã¬ã¤ã¢ã¦ãä¿æ: ããã¹ãèªèæã«ææ¸æ§é ãç¶æ
ã¹ã±ã¼ã©ãã«ã§ãªã¼ãã³ã½ã¼ã¹: ç¡æã§å©ç¨å¯è½ãç¶ç¶çã«æ¹å

docTR APIã®å§ãæ¹

docTRã®ã¤ã³ã¹ãã¼ã«


pip install python-doctr

GPUä¾åé¢ä¿ã®ã¤ã³ã¹ãã¼ã«


pip install tensorflow-gpu torch torchvision

docTR APIãä½¿ç¨ããããã¹ãæ½åºã³ã¼ãä¾

OCRç¨docTR API

ä¾1: ç»åããã®ããã¹ãæ½åº

ç»åããã®ããã¹ãæ½åº


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ä¾2: è¤æ°ãã¼ã¸PDFææ¸ã®å¦ç

PDFããã®ããã¹ãæ½åº


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ä¾3: ææ¸ãæåã®èªè

ææ¸ãããã¹ãã®æ½åº


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

ã¾ã¨ã

Pythonåãæ·±å±¤å­¦ç¿ãã¼ã¹ã®OCRã½ãªã¥ã¼ã·ã§ã³

docTRãä½¿ç¨ãã¦ç»åããé«ç²¾åº¦ãªãã­ã¹ãæ½åºã»èªè­ãå®ç¾

PythonåãdocTR APIã¨ã¯ï¼

docTR APIã®ä¸»ãªæ©è½

docTR APIã®å§ãæ¹

docTRã®ã¤ã³ã¹ãã¼ã«

GPUä¾å­é¢ä¿ã®ã¤ã³ã¹ãã¼ã«

docTR APIãä½¿ç¨ãããã­ã¹ãæ½åºã³ã¼ãä¾

ä¾1: ç»åããã®ãã­ã¹ãæ½åº

ç»åããã®ãã­ã¹ãæ½åº

ä¾2: è¤æ°ãã¼ã¸PDFææ¸ã®å¦ç

PDFããã®ãã­ã¹ãæ½åº

ä¾3: ææ¸ãæå­ã®èªè­

ææ¸ããã­ã¹ãã®æ½åº

ã¾ã¨ã

é¡ä¼¼è£½å

Pythonåãæ·±å±¤å¦ç¿ãã¼ã¹ã®OCRã½ãªã¥ã¼ã·ã§ã³

docTRãä½¿ç¨ãã¦ç»åããé«ç²¾åº¦ãªããã¹ãæ½åºã»èªèãå®ç¾

PythonåãdocTR APIã¨ã¯ï¼

docTR APIã®ä¸»ãªæ©è½

docTR APIã®å§ãæ¹

docTRã®ã¤ã³ã¹ãã¼ã«

GPUä¾åé¢ä¿ã®ã¤ã³ã¹ãã¼ã«

docTR APIãä½¿ç¨ããããã¹ãæ½åºã³ã¼ãä¾

ä¾1: ç»åããã®ããã¹ãæ½åº

ç»åããã®ããã¹ãæ½åº

ä¾2: è¤æ°ãã¼ã¸PDFææ¸ã®å¦ç

PDFããã®ããã¹ãæ½åº

ä¾3: ææ¸ãæåã®èªè

ææ¸ãããã¹ãã®æ½åº

ã¾ã¨ã

é¡ä¼¼è£½å