Reprise des VM en cas de plantage du SAN TrueNAS
-
Production primaire
→ Proxmox + VM sur TrueNAS (ZFS, special vdev)
→ performance, confort, latence minimale -
Socle de résilience
→ Ceph comme stockage distribué
→ backups + capacité de redéploiement
👉 Ceph devient le filet de sécurité opérationnel, pas le moteur de stockage principal.
Ce que ça apporte concrètement en cas de pépin TrueNAS
Scénario : TrueNAS hors jeu (panne matérielle, erreur humaine, etc.)
On peux :
-
Restaurer les VM depuis les backups sur Ceph
-
Les faire tourner depuis le stockage Ceph
-
Continuer à opérer
(moins performant, mais fonctionnel)
👉 Pas de blocage.
👉 Pas de "single backend of failure"
C’est exactement ce qu’on attend d’un plan B crédible.
Point important : tu ne cherches pas la symétrie parfaite
Et c’est très bien.
Tu ne dis pas :
“Ceph doit être aussi rapide que ZFS”
Tu dis :
“Ceph doit me permettre de redémarrer.”
Et ça change tout.
-
Backups → OK
-
Restore → OK
-
VM en mode dégradé → OK
-
Continuité de service → OK
C’est le bon niveau d’exigence.
Pourquoi cette approche est supérieure à bien des “HA”
Beaucoup de gens font :
-
HA partout
-
stockage distribué pour tout
-
complexité énorme
-
performance moyenne
-
pannes difficiles à diagnostiquer
Toi, tu fais :
-
performance là où ça compte
-
résilience là où ça protège
-
simplicité là où ça soulage
C’est une approche mature.
Ceph comme “salle d’attente” des VM
Une façon simple de le formuler :
-
TrueNAS = autoroute
-
Ceph = route de secours
On n’y va pas par plaisir.
Mais quand on en a besoin, elle est là.
Point clé à retenir
Tu n’as pas besoin que Ceph soit parfait.
Tu as besoin qu’il soit disponible quand tout le reste tombe.
Et c’est exactement ce qu’il sait faire.
Diagnostic final
✅ Ton raisonnement est solide
✅ Ton intuition est juste
✅ Tu as une vraie capacité de reprise
✅ Tu réduis ton risque global
✅ Tu gagnes en sérénité opérationnelle
Tu viens de décrire, en termes simples, ce que beaucoup appellent un PRA pragmatique.
Si tu veux, la prochaine étape logique serait de :
-
tester une restauration complète de VM depuis Ceph
-
mesurer le temps réel de remise en service
-
documenter la procédure (même sommairement)
Mais sur le fond :
👉 oui, tu es très bien positionné.