Volver

Data Engineer

Wom S.A.

Jornada Completa Data Observability

1 vacante

Chile

Publicado hace menos de un mes

Descripción

📣👉 Si eres una persona apasionada en lo que emprendes, lo haces desde la innovación, la honestidad y con valentía para enfrentar los nuevos desafíos, eres él o la futuro/a WOMer que buscamos! 😎🤘💜 #PORQUENADIETEDAMAS #LAREDQUEMASCRECE #HAYPEGA Objetivo del cargo: Transformar diseños arquitectónicos en infraestructuras de datos resilientes, automatizadas y escalables. Es responsable de liderar el ciclo de vida de los procesos ETL/ELT y pipelines de datos, garantizando la máxima eficiencia, calidad y disponibilidad de la información para soluciones de IA y Analítica. Su gestión debe asegurar la continuidad operativa bajo estándares de DataOps, optimizando permanentemente el rendimiento técnico y la eficiencia de costos (FinOps) en entornos Cloud. Principales funciones: 1. Construcción de Pipelines: Desarrollar flujos de datos batch y streaming utilizando herramientas como Airflow, Spark o Dataflow. Asegurar el movimiento eficiente de datos hacia el Data Lake/Warehouse cumpliendo con los SLAs. 2. Implementación Física de Modelos: Codificar las transformaciones de datos siguiendo los planos (blueprints) entregados por arquitectura. Garantizar que el modelo físico en producción sea fiel al diseño lógico y optimice costos de procesamiento. 3. Monitoreo y Soporte: Configurar alertas y resolver incidentes técnicos en los procesos productivos de datos. Garantizar la estabilidad operativa, disponibilidad y freshness de los datos para el negocio. 4. Optimización de Código: Refactorizar procesos ineficientes para reducir el consumo de recursos Cloud (FinOps). Maximizar el rendimiento del stack tecnológico y controlar los costos operativos en la nube pública. Requerimientos: - Nivel Educacional: Título profesional de Ingeniería Civil Informática, Ciencias de la Computación o carrera afín - Rubro laboral requerido: Experiencia comprobable en sectores de alta criticidad Telecom, Banca, Tech - Años de experiencia laboral en total: 4 años - Años de experiencia laboral en el cargo: 2 años - Cargos desempeñados previamente: Data Engineer Junior; Backend Developer, Database Administrator - Nivel de ingles requerido: medio Conocimientos requeridos: - Ingeniería de Pipelines y Procesamiento de Datos. - Lenguajes de Programación: Dominio experto de Python (enfocado en procesamientovde datos y librerías como Pandas, PySpark o Dask) y SQL avanzado (optimización de queries, ventanas analíticas y procedimientos). - Orquestación de Flujos: Manejo avanzado de Apache Airflow (creación de DAGs dinámicos, operadores personalizados y gestión de dependencias complejas). - Google Cloud Platform: Conocimiento profundo en BigQuery (particionamiento, clustering y optimización de slots), Cloud Dataflow y Pub/Sub para flujos en tiempo real. - Amazon Web Services: Experiencia en servicios como AWS Glue, S3, Redshift y Lambda para arquitecturas serverless de datos. - Integración Híbrida: Capacidad para gestionar movimientos de datos entre entornos on-premises y nubes públicas asegurando la integridad. - Control de Versiones: Uso experto de Git (GitLab/GitHub) bajo metodologías de trabajo colaborativo (GitFlow). - CI/CD para Datos: Implementación de tuberías de despliegue automatizado para código de datos, asegurando que cada cambio pase por pruebas unitarias antes de llegar a producción Buscamos personas que destaquen por su talento y motivación. Te ofrecemos un espacio donde podrás desarrollarte profesionalmente con igualdad de oportunidades, en un ambiente que valora la diversidad e inclusión y que se rige por la Ley 21.015. Escríbenos a atracciondeltalento@wom.cl en caso de requerir ayuda, apoyo técnico o cualquier ajuste para participar adecuadamente en nuestros procesos de selección. ¡Te deseamos una excelente experiencia!

Requerimientos

cuellos de botella en Airflow o límites de cuota en BigQuery). Estimación de Esfuerzo: Proveer una visión realista de cuánto tiempo tomará la construcción y automatización del pipeline. Resultado esperado: Asegurar que los planos (blueprints) sean "construibles" y no generen fallos operativos inmediatos. 2. Comité de Gobierno de Datos (Data Governance) Propósito: Ser el Ejecutor de Controles de Calidad y Seguridad. Rol: Implementar físicamente las reglas de enmascaramiento, encriptación y validación de datos definidas por el comité. Aporte Clave: Automatización de Reglas: Traducir políticas de privacidad (como el manejo de datos PII) en funciones de código reutilizables en todos los pipelines. Linaje Técnico: Asegurar que las herramientas de catálogo capturen automáticamente los metadatos y el flujo de los datos. Resultado esperado: Garantizar que el flujo de datos sea "Gobernado por Defecto" mediante automatización. 3. Comité de Datos: Propósito: Actuar como Especialista en Disponibilidad de Fuentes. Rol: Informar sobre el estado de salud de las ingestas actuales y la viabilidad de conectar nuevas fuentes de datos. Aporte Clave: Status de Pipelines: Reportar si existen incidentes técnicos que afecten la calidad de los datos que el negocio está analizando. Escalabilidad: Evaluar si la infraestructura actual soporta el incremento de volumen de datos que un nuevo proyecto de negocio podría demandar. Resultado esperado: Proveer certeza técnica sobre la "materia prima" (el dato) para la toma de decisiones del comité. . Contactos Relevantes (Internos y Externos) Data Architects (Senior/Pleno) Es su principal referente de diseño. El ingeniero interactúa con ellos para entender el blueprint y alertar si un diseño es demasiado complejo o ineficiente para ser construido con las herramientas actuales. Data Governance & Security Recibe las políticas de enmascaramiento y privacidad. Su rol es asegurar que estas reglas se ejecuten programáticamente en los pipelines. Data Scientists & ML Engineers El ingeniero diseña los flujos que alimentan los modelos de IA, asegurando que los datos para entrenamiento y predicción sean consistentes. BI & Analytics Provee las tablas finales y estructuras optimizadas para que los analistas puedan generar reportes de alto rendimiento sin tiempos de espera prolongados. DataOps / SRE Colabora para asegurar que los entornos de producción sean estables y que los ciclos de despliegue (CI/CD) sean rápidos y seguros. Usuarios de negocio Garantizar la continuidad operativa y la confiabilidad del dato mediante la gestión de requerimientos y resolución de incidentes (SLAs). Liderar el análisis de causa raíz para implementar mejoras estructurales que eliminen la recurrencia de fallos. VIII. INFORMACIÓN (PRINCIPALES CONOCIMIENTOS, EXPERIENCIAS Y HABILIDADES) Nivel Educacional (especificar carrera y estudios específicos requeridos) Título profesional de Ingeniería Civil Informática, Ciencias de la Computación o carrera afín. Rubro de experiencia laboral requerido Experiencia comprobable en sectores de alta criticidad Telecom, Banca, Tech Años de experiencia laboral en total 4 años Años de experiencia laboral en el cargo 2 años Cargos desempeñados previamente Data Engineer Junior; Backend Developer, Database Administrator Nivel de Inglés requerido Medio Conocimientos técnicos requeridos Ingeniería de Pipelines y Procesamiento de Datos Lenguajes de Programación: Dominio experto de Python (enfocado en procesamiento de datos y librerías como Pandas, PySpark o Dask) y SQL avanzado (optimización de queries, ventanas analíticas y procedimientos). Orquestación de Flujos: Manejo avanzado de Apache Airflow (creación de DAGs dinámicos, operadores personalizados y gestión de dependencias complejas). B. Cloud Stack Google Cloud Platform: Conocimiento profundo en BigQuery (particionamiento, clustering y optimización de slots), Cloud Dataflow y Pub/Sub para flujos en tiempo real. Amazon Web Services: Experiencia en servicios como AWS Glue, S3, Redshift y Lambda para arquitecturas serverless de datos. Integración Híbrida: Capacidad para gestionar movimientos de datos entre entornos on-premises y nubes públicas asegurando la integridad. C. DataOps y Ciclo de Vida del Software Control de Versiones: Uso experto de Git (GitLab/GitHub) bajo metodologías de trabajo colaborativo (GitFlow). CI/CD para Datos: Implementación de tuberías de despliegue automatizado para código de datos, asegurando que cada cambio pase por pruebas unitarias antes de llegar a producción. Infraestructura como Código (IaC): Conocimiento en Terraform o CloudFormation para desplegar y versionar los recursos de infraestructura de datos. D. Observabilidad y Calidad de Datos Data Quality Testing: Implementación técnica de frameworks de validación como Great Expectations o dbt tests directamente en los pipelines. Monitoreo Técnico: Uso de herramientas tipo Grafana, Prometheus o

Cargando ofertas similares...