Sobre el puesto
• Administración y monitoreo de ecosistema big data (Indispensable cloudera, azure o gcp).
• Conocimiento de almacenamiento y procesamiento distribuido
• Procesamiento de grandes volúmenes de información.
• Diseño e implementación de flujos de datos sobre datos estructurados y no estructurados.
• Ingesta, limpieza, homogeneización e integración de diferentes fuentes de datos.
• Diseño y desarrollo de modelos de datos para el manejo de la información.
• Interacción en el diseño de arquitecturas Big Data.
• Generar mecanismos de control y validación del flujo de datos.
• Implementación de scripts con python, pyspark, t-sql, shell scripting.
• Interacción e implementación en la creación de estandares de modelado y control de flujo de datos
• Automatización de flujos de datos.
• Análisis del comportamiento de flujos de datos.
• Implementación de Soluciones de BidData para la gestión de datos, Hbase, Hive, Spark, SQL 2 años como mínimo
• Python o Scala mínimo 3 años
• Diseño de Pipelines y streaming: flume, sqoop, kafka, spark-streaming
Requerimientos
Titulado
Conocimiento de gestores de motores de bases de datos estructurados y no estructurados.
Diseño de servicios publisher subscriber mínimo 2 años
Transformación de datos en ecosistemas bigdata: python, spark o manejo de datos tradicionales (ETLS, Ingestas o modelado) minimo 4 años.
Manejo de datos no structurados
Sobre nuestro cliente
Importante empresa con presencia internacional integradora de tecnologías, telecomunicaciones y sistemas para la seguridad con 26 años de experiencia.