¡Sé parte de Stefanini! En Stefanini somos más de 30.000 genios, conectados desde 41 países, haciendo lo que les apasiona y co‑creando un futuro mejor. Un ingeniero de datos es responsable de diseñar, desarrollar y mantener canales de datos y procesos ETL para garantizar el flujo eficiente y confiable de datos desde diversas fuentes a nuestro almacén de datos. Diseñar, desarrollar y mantener canales de datos y procesos ETL para garantizar el flujo eficiente y confiable de datos desde diversas fuentes a nuestro almacén de datos. Colaborar con científicos de datos, analistas y otras partes interesadas para comprender los requisitos de datos y traducirlos en soluciones técnicas. Realizar modelado de datos y diseño de bases de datos para optimizar el almacenamiento y la recuperación de datos. Implementar procesos de validación y calidad de los datos para garantizar la precisión e integridad de los datos. Supervisar y solucionar problemas de sistemas y canalizaciones de datos para identificar y resolver cualquier problema o cuello de botella. Desarrollar y mantener documentación para procesos, sistemas y mejores prácticas de ingeniería de datos. Mantenerse actualizado con las últimas tendencias y tecnologías en ingeniería de datos y recomendar mejoras para mejorar la infraestructura y los sistemas de datos. Calificaciones Experiencia comprobada como ingeniero de datos o puesto similar. Fuerte dominio de SQL y experiencia con bases de datos relacionales (por ejemplo, MySQL, PostgreSQL). Dominio de al menos un lenguaje de programación (p. ej., Python, Java, Scala). Experiencia con modelado de datos y principios de diseño de bases de datos. Familiaridad con herramientas y procesos ETL. Conocimiento de plataformas de datos basadas en la nube (por ejemplo, AWS, Azure, Google Cloud). Comprensión de los conceptos y tecnologías de almacenamiento de datos. Excelentes habilidades analíticas y de resolución de problemas. Fuertes habilidades de comunicación y colaboración. Capacidad para trabajar de forma independiente y en un entorno orientado al equipo. Atención al detalle y compromiso de realizar un trabajo de alta calidad. Programación: Python, SQL avanzado, PySpark, Scala (deseable), Java (deseable); debe dominar ETL/ELT, manipulación de datos, optimización de procesos, manejo de errores y programación orientada a objetos. Bases de datos: relacionales (PostgreSQL, Oracle, SQL Server, MySQL) y NoSQL (MongoDB, Cassandra, DynamoDB, Redis); conocimientos esperados en optimización de consultas, índices, particionamiento, replicación y modelado de datos. Big Data: Apache Spark, Hadoop, Hive, HDFS, Databricks; evaluar experiencia en procesamiento distribuido, Spark SQL, Spark Streaming y optimización de jobs. ETL/ELT: herramientas comunes como Informatica PowerCenter, Talend, Pentaho, SSIS, DataStage, Azure Data Factory, AWS Glue y Apache NiFi; debe dominar extracción, transformación, carga, validación y calidad de datos. Orquestación: Apache Airflow, Control‑M, Luigi, Prefect y Azure Data Factory Pipelines. #J-18808-Ljbffr
Ingeniero De Datos
STEFANINI LATAM
distrito federal, distrito federal
Publicado hace 7 días
Denunciar empleo