Socotec
48.7116896,2.2542225
Au sein du Data & IA Hub SOCOTEC, vous rejoignez une équipe pluridisciplinaire chargée de concevoir, déployer et maintenir l'architecture Data du groupe à l'échelle internationale.
Vous contribuerez à la modernisation du Lakehouse SOCOTEC, coeur de la plateforme analytique mondiale, et participerez à des projets concrets de valorisation des données, de la conception à la data visualisation.
Vous travaillerez sur troismissions principales :
- Développer des pipelines de données de bout en bout (ingestion, transformation, modélisation, exposition) et contribuer à la mise en place de visualisations dans Power BI ou Databricks SQL.
- Améliorer en continu le Lakehouse SOCOTEC, notamment sur les volets gouvernance, qualité, et pseudonymisation des données.
- Expérimenter des solutions d'IA générative appliquées à la data, comme GenIE de Databricks, pour transformer des requêtes textuelles en insights exploitables.
Le stack technique utilisée :
- Amazon Web Services (AWS)
-...
|
- Master en Big Data, Informatique, ou Ingénierie logicielle avec une forte spécialisation ou appétence pour la data et les architectures distribuées.
- Solide maîtrise des bases de données SQL et NoSQL (modélisation, requêtes optimisées, intégrité et performance).
- Bonne compréhension des architectures Big Data et des outils de traitement distribués (Spark, Hadoop, Airflow, Kafka, Delta Lake).
- Expérience avec les environnements de développement collaboratif : Git, GitLab, Jupyter Notebooks, VS Code.
- Connaissances appréciées des services cloud AWS (S3, Lambda, EMR, Glue, Redshift).
- Familiarité avec les principes d'ETL/ELT, de Data Lakehouse et de DataOps (CI/CD, monitoring, qualité de données).
- Intérêt pour les technologies émergentes, notamment l'IA Générative et son intégration dans les plateformes Data.
- Esprit d'équipe, rigueur et sens de la collaboration dans un environnement agile.
- Curiosité technique et capacité à apprendre rapidement de nouveaux outils et...
|