DokumentumelemzÅ API-k Pythonhoz

NyÃlt forrÃ¡skÃ³dÃº Python API-k a dokumentumok elemzÃ©sÃ©hez

Fedezze fel a nyÃlt forrÃ¡skÃ³dÃº Python-kÃ¶nyvtÃ¡rakat, amelyek szÃ¶vegek, kÃ©pek Ã©s egyÃ©b informÃ¡ciÃ³k elemzÃ©sÃ©re Ã©s kinyerÃ©sÃ©re szolgÃ¡lnak szÃ¡mos dokumentumformÃ¡tumbÃ³l â PDF, DOC/DOCX, XLS/XLSX Ã©s HTML stb.

A Python Include dokumentumelemzÅ API-jai

docTR NyÃlt forrÃ¡skÃ³dÃº Python API szÃ¶vegfelismerÃ©shez Ã©s -detekciÃ³hoz mÃ©lytanulÃ¡ssal.

EasyOCR VÃ¡llalati szintÅ± OCR tÃ¶bb mint 80 nyelv tÃ¡mogatÃ¡sÃ¡val Ã©s elÅre betanÃtott modellekkel pontos szÃ¶vegkinyerÃ©shez

PaddleOCR Robusztus OCR eszkÃ¶zkÃ©szlet, amely 100+ nyelvet tÃ¡mogat elÅre betanÃtott modellekkel.

pdfminer.six Python kÃ¶nyvtÃ¡r szÃ¶vegek elemzÃ©sÃ©hez, olvasÃ¡sÃ¡hoz Ã©s formÃ¡zÃ¡si informÃ¡ciÃ³inak kivonÃ¡sÃ¡hoz PDF-dokumentumokbÃ³l.

PyMuPDF PDF-elemzÅ kÃ¶nyvtÃ¡r Pythonban szÃ¶vegek, kÃ©pek, tÃ¡blÃ¡zatok stb. olvasÃ¡sÃ¡hoz, elemzÃ©sÃ©hez Ã©s kivonÃ¡sÃ¡hoz PDF-dokumentumokbÃ³l.

pypdf Python PDF-elemzÅ kÃ¶nyvtÃ¡r PDF-fÃ¡jlok olvasÃ¡sÃ¡hoz, valamint szÃ¶vegek, kÃ©pek Ã©s mellÃ©kletek kinyerÃ©sÃ©hez PDF-dokumentumokbÃ³l.

PyTesseract NyÃlt forrÃ¡skÃ³dÃº Python API szÃ¶vegkinyerÃ©shez kÃ©pekbÅl a Tesseract OCR hasznÃ¡latÃ¡val.

spaCy Gyors Ã©s hatÃ©kony NLP kÃ¶nyvtÃ¡r elÅre betanÃtott modellekkel 20+ nyelvhez

Keras-OCR KÃ¶nnyÅ± Python API optikai karakterfelismerÃ©shez (OCR) Keras Ã©s TensorFlow hasznÃ¡latÃ¡val.

trOCR TranszformÃ¡tor-alapÃº OCR modell tÃ¶bbnyelvÅ± Ã©s kÃ©zÃrÃ¡sos szÃ¶vegfelismerÃ©shez pÃ¡ratlan pontossÃ¡ggal