[FRsAG] Re: Système de sauvegarde distribué, participatif et souverain.

Stéphane Rivière par FRsAG Mon, 02 Feb 2026 05:46:40 -0800

Bonjour Pierre-Philipp, Xavier

Désolé pour la réponse tardive, je ressorts mollement d'une grippeintéressante, la dernière datait de 2016. Il en faut de temps en tempspour maj le SI :)

Perso je suis un fan de DRBD et ils ont un module pour les longuesdistances https://linbit.com/disaster-recovery/
Cette option ne semble pas libre, mais c'est intéressant :)
je sais pas si DR est libre ou pas, ce serait dommage car DRBDlui-meme est bien libre. https://github.com/LINBIT/drbd

Linbit a toujours eu un mal de chien à monétiser son travail. DRDB estlibre mais tout ce qui tourne autour ne l'est pas... trop.

J'avais des résultats allant de spectaculaires à plantés (sansvraiment comprendre parfois). Bon en local ça marche, mais de DC àDC... J'ai trituré toutes les options possibles pour voir, testé DRDB8 et 9 (à l'époque, je ne sais plus où ils en sont). Je dois êtremoins doué qu'AWS ;>>>
moi j'ai des bon resultats en terme de perf et je pense que j'ecraseCeph RBD assez facilement. ce serait normal d'ailleurs, car il n'y aaucun overhead (pas de hash table ou d'algo de distribution, juste desconfigs qui point vers des paires de noeuds variees). en plus c'estideal pour un cluster convergent, c'est meme fait pour, alors qu'avecCeph RBD faut quand meme se poser la question de savoir si les noeudssupporteront la double charge (virtu + stockage). Bon et puis CephFSil n'y a pas le choix, c'est force'ment un autre cluster de'die', maisc'est un autre cas d'usage.

CEPH n'est pas KISS. Ce simple fait suffit à ne pas aller plus loin pourmoi. DRDB est KISS, mais...

je joue beaucoup avec. Je fais des cluster XEN et utilisais LVM2 etmaintenant OpenZFS zvol **sous** les resources DRBD. il faut noterque DRBD v8 inclus dans le noyau nunux fait simplement des mirrors,alors que DRBD v9 sait aussi faire du diskless, donc un noeud qui n'apas de mirroir local peut aussi voir les volumes.

Oui. J'ai testé les deux. DRDB9 a plus de possibilités, comme d'avoir nmiroirs (1 master 2 slaves, ça peut être bien).


Pas testé avec ZFS, je croyais même que ZFS et DRDB étaient incompatibles...

J'ai aussi fait des tests avec les snapshots, c-a-d qu'on peut fairedes templates sur des vdisk normaux (des resources DRBD quoi) et puisdes snapshots soit LVM2 soit ZFS pour obtenir des instances base'essur ces vdisks. C'est funky et pas pret pour la prod j'en conviens,mais bon dans mes PoCs pour l'instant cela marche. J'ai parle' de mespeurs concernant LVM2 ici:https://www.youtube.com/watch?v=gUnFc99VfTo&list=PLQMQQsKgvLntZiKoELFs22Mtk-tBNNOMJ

Ta vidéo est très intéressante et reflète mes propres recherches.Toutefois j'ai appris des trucs aussi, merci !

La salle est très sympa mais il est choquant de voir qu'il y a si peu degens à t'écouter (i.e à se poser les bonnes questions, même nonconventionnelles).J'ai la même impression concernant un langage que je promeus depuislongtemps, Ada.

J'ai pouss'e le vice jusqu'`a tenter la convergence re'seau en plus dela convergence XEN + DRBD:https://pub.nethence.com/network/fuck-martinez-part4


Ouah, son site, on dirait (presque) du gopher :>
En pratique ? Pour nos use cases ? mmm... Mais j'ai gardé les liens :)

Comme j'ai pas trouvé d'équivalent sous Linux (dans mon use-case), jerêvais à me mettre à FreeBSD/ZFS qui semble avoir ce qu'il fautnativement, lui. Mais, une seule vie, pas assez de temps :)
ah non c'est l'inverse. FreeBSD HAST n'est probablement pas capablede faire du dual-primaries, ce qui est absolument ne'cessaire lors dela live-migration d'une instance XEN d'un noeud `a l'autre, neserait-ce que pendant une micro-seconde. Je n'ai jamais essaye' HASTet cela reste `a faire (si un jour vous vous ennuyez, on pourraitfaire cela ensemble en visio). Quant `a ZFS c'est juste ungestionnaire de volume + filesystem, pas un outils de stockagedistribue' en soit. Ceux qui s'en servent comme cela jouent sur lafonction re'seau mais il n'y a qu'un seul controlleur, c'est leclient. Un peu comme du RAID ge're' avec un seul controlleur. AvecDRBD et HAST c'est deux tetes, deux controlleurs. Et en plusduellement actif avec DRBD si besoin. De la magie pure !

Je n'ai pas été jusque là. Jamais utilisé ZFS, par manque de temps (jesuis curieux par défaut) et pragmatisme puisque Xen + GNU/Linux Debian +mdadm + lvm2 forment une stack avec une stabilité qui s'oublie, donc pascherché plus loin.

Ce que je voulais faire, c'était de la migration à chaud. Dans unprocess automatique, éventuellement avec une prise de décisionautomatique (ce dernier point étant débattable, je me méfie comme de lapeste des "automatismes de décision" fondés sur des conditions).

Après plein d'essais, allant de magie noire (quand ça marche, c'estbeau) à la migration avortée, jusqu'à la destruction instantanée etinexplicable du volume LVM (et... non ! je ne m'étais pas emmêlé lesscripts dans les primaires/secondaires), j'ai enfin admis que c'étaitoverkilled par rapport aux besoins de l'infra. Nos clients peuventsupporter une coupure de quelques minutes (transfert de la VM, maj IPFO,maj routage+FW du node, maj IP de l'instance - pointopoint).

Je n'ai pas pu, en boucle, faire tourner ça des dizaines de fois, sansque ça foire à un moment, donc useless pour moi. C'était peut-être leréseau, mais bon, le vrack OVH, ça marche. La lecture attentive dessources de DRDB m'a un peu achevé. C'est comme regarder les sources ISDN(RNIS/numeris) d'Asterisk (expérience d'il y a 15 ans). En regardant letas de spaghetti, les rustines, toussa, on soupire et on comprend mieuxpourquoi c'est chaud et pourquoi la peinture ne sera jamais sèche ; ilfaudrait tout réécrire.

Rien que le bidule à base de volaile (COQ) pour aller faire correspondrela version des sources avec la version du noyau était une horreur.Finalement, j'allais me servir dans les dépôts Proxmox. Au moins, eux,ils avaient la bonne réponse ;)

Mais si tu me dis que tu y es arrivé, de façon systématique etrécurrente, sans aucune erreur, dans un vrai réseau (pas un lab, en labça marche), c'est que j'ai loupé une marche, ce qui est très possible :)


--
Stéphane Rivière
Ile d'Oléron - France

_______________________________________________
Liste de diffusion du French Sysadmin Group
https://www.frsag.org/

[FRsAG] Re: Système de sauvegarde distribué, participatif et souverain.

Répondre à