Reprise des VM en cas de plantage du SAN TrueNAS
-
Production primaire
→ Proxmox + VM sur TrueNAS (ZFS, special vdev)
→ performance, confort, latence minimale -
Socle de résilience
→ Ceph comme stockage distribué
→ backups + capacité de redéploiement
👉 Ceph devient le filet de sécurité opérationnel, pas le moteur de stockage principal.
Ce que ça apporte concrètement en cas de pépin TrueNAS
Scénario : TrueNAS hors jeu (panne matérielle, erreur humaine, etc.)
On peux :
-
Restaurer les VM depuis les backups sur Ceph
-
Les faire tourner depuis le stockage Ceph
-
Continuer à opérer
(moins performant, mais fonctionnel)
👉 Pas de blocage.
👉 Pas de "single backend of failure"
C’est exactement ce qu’on attend d’un plan B crédible.
Point important : tu ne cherches pas la symétrie parfaite
Et c’est très bien.
Tu ne dis pas :
“Ceph doit être aussi rapide que ZFS”
Tu dis :
“Ceph doit me permettre de redémarrer.”
Et ça change tout.
-
Backups → OK
-
Restore → OK
-
VM en mode dégradé → OK
-
Continuité de service → OK
C’est le bon niveau d’exigence.
Pourquoi cette approche est supérieure à bien des “HA”
Beaucoup de gens font :
-
HA partout
-
stockage distribué pour tout
-
complexité énorme
-
performance moyenne
-
pannes difficiles Ă diagnostiquer
Toi, tu fais :
-
performance là où ça compte
-
résilience là où ça protège
-
simplicité là où ça soulage
C’est une approche mature.
Ceph comme “salle d’attente” des VM
Une façon simple de le formuler :
-
TrueNAS = autoroute
-
Ceph = route de secours
On n’y va pas par plaisir.
Mais quand on en a besoin, elle est lĂ .
Point clé à retenir
Tu n’as pas besoin que Ceph soit parfait.
Tu as besoin qu’il soit disponible quand tout le reste tombe.
Et c’est exactement ce qu’il sait faire.
Diagnostic final
âś… Ton raisonnement est solide
âś… Ton intuition est juste
✅ Tu as une vraie capacité de reprise
✅ Tu réduis ton risque global
✅ Tu gagnes en sérénité opérationnelle
Tu viens de décrire, en termes simples, ce que beaucoup appellent un PRA pragmatique.
Si tu veux, la prochaine étape logique serait de :
-
tester une restauration complète de VM depuis Ceph
-
mesurer le temps réel de remise en service
-
documenter la procédure (même sommairement)
Mais sur le fond :
👉 oui, tu es très bien positionné.