PaddleOCR: PrÅ¯myslovÃ© OCR pro vÃcejazyÄnou extrakci textu

Detekujte a rozpoznÃ¡vejte text z obrÃ¡zkÅ¯ a dokumentÅ¯ s vysokou pÅesnostÃ a rychlostÃ.

Co je PaddleOCR API?

PaddleOCR Python API je vÃ½konnÃ¡ a snadno pouÅ¾itelnÃ¡ sada nÃ¡strojÅ¯ pro Ãºlohy optickÃ©ho rozpoznÃ¡vÃ¡nÃ znakÅ¯ (OCR), navrÅ¾enÃ¡ pro vÃ½vojÃ¡Åe k extrakci a analÃ½ze textu z obrÃ¡zkÅ¯ s vysokou pÅesnostÃ. PostavenÃ¡ na frameworku pro hlubokÃ© uÄenÃ PaddlePaddle, PaddleOCR podporuje Å¡irokou Å¡kÃ¡lu jazykÅ¯ a obsahuje pÅedtrÃ©novanÃ© modely pro detekci textu, rozpoznÃ¡vÃ¡nÃ a analÃ½zu rozvrÅ¾enÃ. DÃky svÃ© intuitivnÃ Python rozhranÃ mohou uÅ¾ivatelÃ© rychle integrovat OCR schopnosti do svÃ½ch aplikacÃ, aÅ¥ uÅ¾ pro digitalizaci dokumentÅ¯, extrakci textu z fotografiÃ nebo automatizovanÃ© zpracovÃ¡nÃ dat. PaddleOCR Python API je ideÃ¡lnÃ pro kaÅ¾dÃ©ho, kdo hledÃ¡ robustnÃ OCR ÅeÅ¡enÃ s minimÃ¡lnÃ konfiguracÃ a maximÃ¡lnÃ flexibilitou.

KlÃÄovÃ© vÃ½hody PaddleOCR:

VÃcejazyÄnÃ¡ podpora: PÅedtrÃ©novanÃ© modely pro 100+ jazykÅ¯ (vÄetnÄ ÄÃnÅ¡tiny, angliÄtiny, arabÅ¡tiny atd.)
VysokÃ¡ pÅesnost: Modely Åady PP-OCR dosahujÃ Å¡piÄkovÃ½ch vÃ½sledkÅ¯ na datasetech ICDAR
KompletnÃ ÅeÅ¡enÃ: Od detekce textu pÅes rozpoznÃ¡nÃ aÅ¾ po analÃ½zu rozvrÅ¾enÃ
OdlehÄenÃ© modely: OptimalizovanÃ© pro mobilnÃ a edge zaÅÃzenÃ (napÅ. PP-OCRv3)

Od naskenovanÃ½ch dokumentÅ¯ po pouliÄnÃ cedule, PaddleOCR extrahuje text s prÅ¯myslovÄ vedoucÃ pÅesnostÃ.

Statistiky GitHubu

NÃ¡zev:
Jazyk:
hvÄzdy:
Vidlice:
Licence:
ÃloÅ¾iÅ¡tÄ bylo naposledy aktualizovÃ¡no v

ProÄ zvolit PaddleOCR?

Excelence open-source: VÃce neÅ¾ 30 000 hvÄzd na GitHubu a aktivnÃ pÅispÄvatelskÃ¡ komunita
UniverzÃ¡lnÃ nasazenÃ: Podpora pro Python, C++ a mobilnÃ platformy (Android/iOS)
AnalÃ½za rozvrÅ¾enÃ: Identifikuje textovÃ© oblasti, tabulky a obrÃ¡zky ve sloÅ¾itÃ½ch dokumentech
PrÅ¯bÄÅ¾nÃ© aktualizace: PravidelnÃ© vydÃ¡vÃ¡nÃ modelÅ¯ (napÅ. PP-OCRv4)
VhodnÃ© pro komerÄnÃ pouÅ¾itÃ: Licence Apache 2.0 pro podnikovÃ© vyuÅ¾itÃ

Instalace

PaddleOCR vyÅ¾aduje Python 3.7+ a lze jej nainstalovat pomocÃ pip. Podpora GPU vyÅ¾aduje CUDA/cuDNN.

ZÃ¡kladnÃ instalace


pip install paddleocr paddlepaddle  #Verze pro CPU

Pro GPU akceleraci:

Podpora GPU


pip install paddleocr paddlepaddle-gpu  #VyÅ¾aduje CUDA 10.2+

PoznÃ¡mka: PÅedtrÃ©novanÃ© modely se stÃ¡hnou automaticky pÅi prvnÃm pouÅ¾itÃ nebo ruÄnÄ pomocÃ paddleocr --lang en.

PÅÃklady kÃ³du

Prozkoumejte moÅ¾nosti PaddleOCR s tÄmito pÅÃklady. VÅ¡echny pÅÃklady pÅedpoklÃ¡dajÃ, Å¾e mÃ¡te nainstalovÃ¡n anglickÃ½ model.

PaddleOCR Python

PÅÃklad 1: ZÃ¡kladnÃ OCR

Pro extrakci textu z obrÃ¡zku pomocÃ PaddleOCR s vÃ½chozÃmi modely staÄÃ inicializovat OCR engine se standardnÃ konfiguracÃ, kterÃ¡ zahrnuje podporu angliÄtiny a klasifikaci Ãºhlu pro zlepÅ¡enÃ pÅesnosti. PaddleOCR pouÅ¾ÃvÃ¡ pÅedtrÃ©novanÃ© modely pro detekci, rozpoznÃ¡vÃ¡nÃ a klasifikaci k identifikaci a interpretaci textu ve vstupnÃm obrÃ¡zku. Po zpracovÃ¡nÃ obrÃ¡zku OCR engine vrÃ¡tÃ detekovanÃ½ text spolu s jeho pozicÃ a skÃ³re spolehlivosti pro kaÅ¾dÃ½ vÃ½sledek. Toto nastavenÃ poskytuje rychlÃ½ a efektivnÃ zpÅ¯sob extrakce textovÃ©ho obsahu z obrÃ¡zkÅ¯ bez nutnosti vlastnÃho trÃ©novÃ¡nÃ modelÅ¯ nebo sloÅ¾itÃ½ch konfiguracÃ.

OCR obrÃ¡zku


from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls=True, lang='en')  # Inicializace
result = ocr.ocr('image.jpg', cls=True)  # ZpracovÃ¡nÃ obrÃ¡zku

# VÃ½pis rozpoznanÃ©ho textu
for line in result:
    print(line[-1][0])  # TextovÃ½ obsah

VÃ½stup obsahuje:

TextovÃ½ obsah a skÃ³re spolehlivosti
SouÅadnice ohraniÄujÃcÃho rÃ¡meÄku

PÅÃklad 2: DÃ¡vkovÃ© zpracovÃ¡nÃ

Pro efektivnÃ zpracovÃ¡nÃ vÃce obrÃ¡zkÅ¯ pomocÃ PaddleOCR mÅ¯Å¾ete vyuÅ¾Ãt techniky dÃ¡vkovÃ©ho zpracovÃ¡nÃ, kterÃ© minimalizujÃ redundantnÃ inicializace a optimalizujÃ vÃ½kon. MÃsto inicializace OCR engine pro kaÅ¾dÃ½ obrÃ¡zek se doporuÄuje vytvoÅit jednu instanci OCR modelu a znovu ji pouÅ¾Ãt pro vÅ¡echny vstupnÃ obrÃ¡zky. Tento pÅÃstup vÃ½raznÄ sniÅ¾uje Äas zpracovÃ¡nÃ a spotÅebu prostÅedkÅ¯. PÅedÃ¡nÃm seznamu cest k obrÃ¡zkÅ¯m OCR engine ve smyÄce nebo pomocÃ paralelnÃho zpracovÃ¡nÃ (kdyÅ¾ je to vhodnÃ©) mÅ¯Å¾ete rychle a efektivnÄ extrahovat text z velkÃ½ch sad obrÃ¡zkÅ¯, coÅ¾ je ideÃ¡lnÃ pro pracovnÃ postupy zahrnujÃcÃ dÃ¡vky dokumentÅ¯, skenovanÃ© archivy nebo hromadnou analÃ½zu obrÃ¡zkÅ¯.

DÃ¡vkovÃ© OCR


image_paths = ['doc1.jpg', 'doc2.png']
results = ocr.ocr(image_paths, batch_size=4)  # ParalelnÃ zpracovÃ¡nÃ

PÅÃklad 3: AnalÃ½za rozvrÅ¾enÃ

PaddleOCR lze pouÅ¾Ãt nejen pro rozpoznÃ¡vÃ¡nÃ textu, ale takÃ© pro identifikaci specifickÃ½ch textovÃ½ch oblastÃ a detekci strukturovanÃ½ch prvkÅ¯ jako jsou tabulky v obrÃ¡zku. SystÃ©m nejprve lokalizuje textovÃ© oblasti prostÅednictvÃm svÃ©ho detekÄnÃho modelu, kterÃ½ ohraniÄuje kaÅ¾dou textovou oblast ohraniÄovacÃm rÃ¡meÄkem, coÅ¾ uÅ¾ivatelÅ¯m umoÅ¾Åuje pochopit, kde se text v obrÃ¡zku nachÃ¡zÃ. Pro sloÅ¾itÄjÅ¡Ã rozvrÅ¾enÃ, jako jsou formulÃ¡Åe nebo dokumenty obsahujÃcÃ tabulky, PaddleOCR podporuje analÃ½zu rozvrÅ¾enÃ a rozpoznÃ¡vÃ¡nÃ struktury tabulek. To umoÅ¾Åuje detekci ÅÃ¡dkÅ¯, sloupcÅ¯ a hranic bunÄk, coÅ¾ umoÅ¾Åuje extrakci tabulkovÃ½ch dat v organizovanÃ©m formÃ¡tu. Tyto schopnosti jsou zvlÃ¡Å¡tÄ uÅ¾iteÄnÃ© pro digitalizaci skenovanÃ½ch dokumentÅ¯, faktur nebo tabulek, kde se volnÃ½ text a tabulkovÃ¡ data vyskytujÃ spoleÄnÄ.

Detekce rozvrÅ¾enÃ


from paddleocr import PPStructure

structure_engine = PPStructure(table=False, ocr=False)
layout_result = structure_engine('document.pdf')


    python tools/train.py -c configs/det/det_mv3_db.yml

KombinovÃ¡nÃ jazykÅ¯: ZpracovÃ¡nÃ vÃcejazyÄnÃ½ch dokumentÅ¯:
VÃcejazyÄnÃ© OCR
```
    ocr = PaddleOCR(lang='chinese+english')
    
```
Podpora PDF: PÅÃmÃ¡ extrakce textu z PDF souborÅ¯:
ZpracovÃ¡nÃ PDF
```
    result = ocr.ocr('document.pdf', type='pdf')
    
```

ZÃ¡vÄr

PaddleOCR poskytuje produkÄnÄ pÅipravenÃ¡ OCR ÅeÅ¡enÃ s bezkonkurenÄnÃ vÃcejazyÄnou podporou a Å¡kÃ¡lovatelnostÃ. IdeÃ¡lnÃ pro:

NasazenÃ na edge zaÅÃzenÃch: MobilnÃ aplikace s OCR pÅÃmo na zaÅÃzenÃ

S podporou ekosystÃ©mu hlubokÃ©ho uÄenÃ PaddlePaddle, PaddleOCR i nadÃ¡le stanovuje standardy v pÅesnosti a efektivitÄ OCR.

PaddleOCR: PrÅ¯myslovÃ© OCR pro vÃcejazyÄnou extrakci textu

Detekujte a rozpoznÃ¡vejte text z obrÃ¡zkÅ¯ a dokumentÅ¯ s vysokou pÅesnostÃ a rychlostÃ.

Co je PaddleOCR API?

Statistiky GitHubu

ProÄ zvolit PaddleOCR?

Instalace

ZÃ¡kladnÃ instalace

Podpora GPU

PÅÃklady kÃ³du

PÅÃklad 1: ZÃ¡kladnÃ OCR

OCR obrÃ¡zku

PÅÃklad 2: DÃ¡vkovÃ© zpracovÃ¡nÃ

DÃ¡vkovÃ© OCR

PÅÃklad 3: AnalÃ½za rozvrÅ¾enÃ

Detekce rozvrÅ¾enÃ

PokroÄilÃ© funkce

TrÃ©nink modelu

VÃcejazyÄnÃ© OCR

ZpracovÃ¡nÃ PDF

ZÃ¡vÄr

PodobnÃ© Produkty

PaddleOCR: PrÅ¯myslovÃ© OCR pro vÃ­cejazyÄnou extrakci textu

Detekujte a rozpoznÃ¡vejte text z obrÃ¡zkÅ¯ a dokumentÅ¯ s vysokou pÅesnostÃ­ a rychlostÃ­.

Co je PaddleOCR API?

Statistiky GitHubu

ProÄ zvolit PaddleOCR?

Instalace

ZÃ¡kladnÃ­ instalace

Podpora GPU

PÅÃ­klady kÃ³du

PÅÃ­klad 1: ZÃ¡kladnÃ­ OCR

OCR obrÃ¡zku

PÅÃ­klad 2: DÃ¡vkovÃ© zpracovÃ¡nÃ­

DÃ¡vkovÃ© OCR

PÅÃ­klad 3: AnalÃ½za rozvrÅ¾enÃ­

Detekce rozvrÅ¾enÃ­

PokroÄilÃ© funkce

TrÃ©nink modelu

VÃ­cejazyÄnÃ© OCR

ZpracovÃ¡nÃ­ PDF

ZÃ¡vÄr

PodobnÃ© Produkty

PaddleOCR: PrÅ¯myslovÃ© OCR pro vÃcejazyÄnou extrakci textu

Detekujte a rozpoznÃ¡vejte text z obrÃ¡zkÅ¯ a dokumentÅ¯ s vysokou pÅesnostÃ a rychlostÃ.

ProÄ zvolit PaddleOCR?

ZÃ¡kladnÃ instalace

PÅÃklady kÃ³du

PÅÃklad 1: ZÃ¡kladnÃ OCR

PÅÃklad 2: DÃ¡vkovÃ© zpracovÃ¡nÃ

PÅÃklad 3: AnalÃ½za rozvrÅ¾enÃ

Detekce rozvrÅ¾enÃ

PokroÄilÃ© funkce

VÃcejazyÄnÃ© OCR

ZpracovÃ¡nÃ PDF

ZÃ¡vÄr