Skip to content
View ericmartinezr's full-sized avatar
👿
I am the danger!
👿
I am the danger!

Block or report ericmartinezr

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
ericmartinezr/README.md

Ingeniería de Datos y Pipelines (ETL / ELT)

Google Cloud Platform (GCP)

Proyecto Resumen Stack Tecnológico
Recomendador de Libros Sistema simple de recomendación con dashboards interactivos. Dataform, BigQuery, Vertex AI, Looker Studio
ETL Censo Chile 2024 Procesamiento a escala de datos del Censo de Chile del año 2024. Apache Beam (Dataflow), BigQuery, Looker Studio
ETL Indicadores Económicos Extracción y carga automatizada, tanto diaria como histórica. Airflow (Composer), BigQuery, Looker Studio

Microsoft Azure

Proyecto Resumen Stack Tecnológico
ETL Datos NASA Pipeline end-to-end extrayendo directamente desde la API oficial de la NASA. Azure Synapse Analytics
ETL Censo 2024 - Databricks Alternativa de cálculo y procesamiento distribuido sobre Databricks. Azure Databricks, PySpark
ETL Censo 2024 - Data Factory Orquestación de flujos de datos para la carga del volumen censal. Azure Data Factory

Otras Plataformas y Herramientas Locales

Proyecto Resumen Stack Tecnológico
ETL con Snowflake & dbt Limpieza, modelado moderno y carga de datos orientada a analítica. dbt, Snowflake
Airflow Web Scraper Scraping automatizado de transacciones públicas y sitios de noticias. Airflow Standalone, Python
Airflow en Kubernetes Despliegue de Airflow vía Helm, incluyendo integración con servidor MLFlow. Kubernetes, Helm, MLFlow
Apache Beam E-commerce Técnicas de enmascaramiento, filtrado y normalización sobre datos ficticios. Apache Beam

Inteligencia Artificial y Machine Learning

Entorno / Proyecto Resumen Stack Tecnológico
GCP: Document AI (Chat con PDF) Arquitectura full-stack que permite consultar documentos PDF mediante un modelo de lenguaje (RAG). Vertex AI (Gemini), LangChain, FastAPI, Cloud SQL, Angular
Azure: Databricks Lakeflow Pipeline analítico de entrenamiento de un modelo predictivo sobre el clásico dataset Iris. Databricks Jobs, MLFlow, Python

Otros proyectos

Proyecto Resumen / Propósito
LangChain RUT Middleware Middleware para resguardar la privacidad de la información, permitiendo detectar, enmascarar y redirigir identificadores chilenos (RUT) generados en las respuestas de los modelos en LangChain.

Nota: Cada proyecto cuenta con su propia documentación detallada (README).

Pinned Loading

  1. document_ai document_ai Public

    Small agentic AI app to extract information from documents, save it to files and send them through email

    Python

  2. document_ai_gcp document_ai_gcp Public

    Document AI on GCP

    Python

  3. etl_indicadores_gcp etl_indicadores_gcp Public

    ETL de indicadores en GCP

    Python

  4. etl_censo_gcp etl_censo_gcp Public

    ETL con datos del censo de Chile

    Python

  5. etl_censo_databricks etl_censo_databricks Public

    ETL del Censo 2024 con Databricks

    Jupyter Notebook

  6. etl_books_ml etl_books_ml Public

    ETL de libros con ML en GCP

    JavaScript