[تجزÛÙ Ú©ÙÙØ¯Ù Ø§Ø³ÙØ§Ø¯ API Ø¨Ø±Ø§Û Ù¾Ø§ÛØªÙÙ APIÙØ§Û Ù ÙØ¨Ø¹ باز Ù¾Ø§ÛØªÙÙ Ø¨Ø±Ø§Û ØªØ¬Ø²ÛÙ Ø§Ø³ÙØ§Ø¯ کتابخاÙÙâÙØ§Û Ù ÙØ¨Ø¹ باز Python را Ú©Ù Ø¨Ø±Ø§Û ØªØ¬Ø²Û٠٠استخراج Ù ØªÙØ تصاÙÛØ± Ù Ø³Ø§ÛØ± Ø§Ø·ÙØ§Ø¹Ø§Øª از Ø·ÛÙ ÙØ³ÛØ¹Û Ø§Ø² ÙØ§ÙبâÙØ§Û Ø³ÙØ¯ - PDFØ DOC/DOCXØ XLS/XLSX Ù HTML طراØÛ شدÙâØ§ÙØ¯Ø طراØÛ Ú©ÙÛØ¯. APIÙØ§Û تجزÛÙ Ú©ÙÙØ¯Ù Ø§Ø³ÙØ§Ø¯ Ø¨Ø±Ø§Û Ù¾Ø§ÛØªÙ٠شا٠٠docTR API ٠تÙâØ¨Ø§Ø² Ù¾Ø§ÛØªÙÙ Ø¨Ø±Ø§Û Ø´ÙØ§Ø³Ø§ÛÛ Ù ØªØ´Ø®ÛØµ ٠ت٠با Ø§Ø³ØªÙØ§Ø¯Ù از ÛØ§Ø¯Ú¯ÛØ±Û Ø¹Ù ÛÙ. EasyOCR OCR ساز٠اÙÛ Ø¨Ø§ Ù¾Ø´ØªÛØ¨Ø§ÙÛ Ø§Ø² 80+ زبا٠٠٠دÙâÙØ§Û از Ù¾ÛØ´ Ø¢Ù ÙØ²Ø´ Ø¯ÛØ¯Ù Ø¨Ø±Ø§Û Ø§Ø³ØªØ®Ø±Ø§Ø¬ دÙÛ٠٠ت٠PaddleOCR ابزارک ÙØ¯Ø±ØªÙ ÙØ¯ OCR با Ù¾Ø´ØªÛØ¨Ø§ÙÛ Ø§Ø² Û±Û°Û°+ زبا٠٠٠دÙâÙØ§Û از Ù¾ÛØ´ Ø¢Ù ÙØ²Ø´ Ø¯ÛØ¯Ù Ø§Ø³Ù¾Ø§Ø³Û Ú©ØªØ§Ø¨Ø®Ø§ÙÙ NLP Ø³Ø±ÛØ¹ ٠کارآ٠د با ٠دÙâÙØ§Û از Ù¾ÛØ´ Ø¢Ù ÙØ²Ø´ Ø¯ÛØ¯Ù Ø¨Ø±Ø§Û 20+ زبا٠pdfminer.six کتابخاÙÙ Ù¾Ø§ÛØªÙÙ Ø¨Ø±Ø§Û ØªØ¬Ø²ÛÙØ Ø®ÙØ§Ùد٠٠استخراج ٠ت٠با Ø§Ø·ÙØ§Ø¹Ø§Øª ÙØ§ÙØ¨âØ¨ÙØ¯Û از Ø§Ø³ÙØ§Ø¯ PDF. PyMuPDF کتابخاÙ٠تجزÛÙ Ú©ÙÙØ¯Ù PDF در Ù¾Ø§ÛØªÙÙ Ø¨Ø±Ø§Û Ø®ÙØ§ÙØ¯ÙØ تجزÛ٠٠استخراج Ù ØªÙØ تصاÙÛØ± ٠جداÙÙ Ù ØºÛØ±Ù از Ø§Ø³ÙØ§Ø¯ PDF. pypdf کتابخاÙ٠تجزÛÙâÚ©ÙÙØ¯Ù PDF Ù¾Ø§ÛØªÙÙ Ø¨Ø±Ø§Û Ø®ÙØ§Ùد٠PDF ٠استخراج Ù ØªÙØ تصاÙÛØ± Ù Ù¾ÛÙØ³ØªâÙØ§ از Ø§Ø³ÙØ§Ø¯ PDF. PyTesseract ÛÚ© API ٠تÙâØ¨Ø§Ø² Ù¾Ø§ÛØªÙÙ Ø¨Ø±Ø§Û Ø§Ø³ØªØ®Ø±Ø§Ø¬ ٠ت٠از تصاÙÛØ± با Ø§Ø³ØªÙØ§Ø¯Ù از Tesseract OCR. Keras-OCR ÛÚ© API Ù¾Ø§ÛØªÙ٠سبکâÙØ²Ù Ø¨Ø±Ø§Û ØªØ´Ø®ÛØµ ÙÙØ±Û Ú©Ø§Ø±Ø§Ú©ØªØ±ÙØ§ (OCR) با Ø§Ø³ØªÙØ§Ø¯Ù از Keras Ù TensorFlow. trOCR ٠د٠OCR ٠بتÙÛ Ø¨Ø± ØªØ±ÙØ³ÙÙØ±Ù ر Ø¨Ø±Ø§Û ØªØ´Ø®ÛØµ ٠ت٠ÚÙØ¯Ø²Ø¨Ø§Ù٠٠دستÙÙÛØ³ با Ø¯ÙØª بÛâÙØ¸Ûر]