C
Data Engineer
Confidential
CDISenior (5-10 ans)📍 casablanca
🏢
A propos de l'entreprise
Entreprise :
Dans le cadre de notre développement, nous cherchons un Chargé des Ressources Humaines pour notre filiale basée sur Meknès qui opère dans le secteur BTP .
Dans le cadre de notre développement, nous cherchons un Chargé des Ressources Humaines pour notre filiale basée sur Meknès qui opère dans le secteur BTP .
🎯
Vos missions
Rejoignez notre équipe dynamique dans le secteur des Autres services en tant que Data Engineer. Basé(e) à Casablanca, vous jouerez un rôle clé dans la transformation et l'optimisation de nos flux de données.
En tant que profil senior, vos missions seront :
- Concevoir, développer et optimiser des pipelines de données scalables sur Databricks
- Définir et mettre en œuvre les bonnes pratiques Data Engineering et DataOps
- Gérer des tables Delta Lake avancées (ACID transactions, optimisation, time-travel)
- Orchestrer des workflows complexes via Databricks Jobs ou Delta Live Tables
- Structurer et documenter l’architecture Data (Lakehouse, ingestion, transformation, exposition)
- Collaborer étroitement avec les équipes Data Science, BI, Sécurité et Architecture
- Garantir la qualité, la sécurité et la fiabilité des données
- Mentorer les Data Engineers juniors et intermédiaires
- Participer aux décisions d’architecture cloud (Azure/AWS)
- Optimiser les coûts et les performances des clusters Spark
- Automatiser les flux via CI/CD (Git, Azure DevOps, GitHub Actions)
Profil recherché
Profil recherché
- Bac+5 en informatique, Big Data, Data Engineering ou équivalent
- 5 à 10 ans d’expérience en Data Engineering
- Expérience significative sur Databricks (obligatoire)
- Avoir déjà participé à des projets data de grande envergure
- Expérience dans des environnements cloud (Azure ou AWS)
Compétences techniques indispensables
- Expertise Databricks (clusters, notebooks, jobs, Delta Lake, optimisation Spark)
- PySpark avancé
- Python avancé
- SQL expert
- Architectures Lakehouse & Big Data
- Cloud : Azure (ADF, ADLS, Synapse) ou AWS (Glue, S3, Redshift)
- Maîtrise des environnements CI/CD
- Expérience en optimisation Spark (partitions, cache, broadcast, shuffle)
- Très bonnes connaissances en gouvernance de données