DokumentÅ³ analizatorius API, skirtos Python

Atvirojo kodo Python API, skirtos dokumentÅ³ analizei

Atraskite atvirojo kodo Python bibliotekas, pritaikytas analizuoti ir iÅ¡gauti tekstÄ, vaizdus ir kitÄ informacijÄ iÅ¡ Ä¯vairiÅ³ dokumentÅ³ formatÅ³ â PDF, DOC/DOCX, XLS/XLSX ir HTML ir kt.

âPython Includeâ dokumentÅ³ analizavimo API

docTR æ·±å±¤å¦ç¿ã«ããããã¹ãæ¤åºã»èªèã®ããã®ãªã¼ãã³ã½ã¼ã¹Python API

EasyOCR Ä®monÄms skirtas OCR su palaikymu 80+ kalbÅ³ ir iÅ¡ anksto apmokytais modeliais tikslaus teksto iÅ¡gavimo

PaddleOCR Patikimas OCR Ä¯rankis, palaikantis 100+ kalbÅ³ su iÅ¡ anksto apmokytais modeliais

pdfminer.six Python biblioteka, skirta analizuoti, skaityti ir iÅ¡traukti tekstÄ su formatavimo informacija iÅ¡ PDF dokumentÅ³.

PyMuPDF Python PDF analizavimo biblioteka, skirta skaityti, analizuoti ir iÅ¡gauti tekstÄ, vaizdus, lenteles ir kt. iÅ¡ PDF dokumentÅ³.

pypdf Python PDF analizavimo biblioteka, skirta skaityti PDF failus ir iÅ¡ PDF dokumentÅ³ iÅ¡gauti tekstÄ, vaizdus ir priedus.

PyTesseract Atvirojo kodo Python API teksto iÅ¡gavimui iÅ¡ vaizdÅ³ naudojant Tesseract OCR.

spaCy Greita ir efektyvi NLP biblioteka su iÅ¡ anksto apmokytais modeliais 20+ kalbÅ³.

Keras-OCR API Python leggera per il riconoscimento ottico dei caratteri (OCR) utilizzando Keras e TensorFlow.

trOCR Transformeriais pagrÄ¯stas OCR modelis daugiakalbiÅ³ ir rankraÅ¡Äio teksto atpaÅ¾inimui su nenugalima tikslumu