Git a pour rôle de suivre l’évolution du code et des fichiers de configuration nécessaires à la reproduction du projet — pas tout ce qui transite ou se génère au passage.
À versionner#
- le code source,
- les fichiers de configuration (
pyproject.toml,uv.lock,dbt_project.yml, etc.), - les scripts, tests et documentation.
À exclure#
Certains fichiers ne doivent pas être suivis par Git, car ils sont temporaires, lourds ou contiennent des informations sensibles.
Les plus courants :
- les données brutes ou intermédiaires (
.parquet,.duckdb,.db), - les artefacts dbt (
target/,logs/), - les environnements virtuels,
- les fichiers de secrets (
.env).
Les petits jeux de données d’exemple peuvent être conservés dans un dossier dédié (data/samples/) pour illustrer les traitements sans alourdir le dépôt.
Voir le .gitignore pour un exemple.