Très sévères ? Non, on parle d’un opérateur d’envergure avec de l’expérience. Ils ont pour devoir d’anticiper, de planifier, de tester, puis en cas d’incident, d’informer et de corriger.
La complexité de leurs choix historiques n’est pas une excuse. Mes premiers clients FTTO ont été coupés hier à 9h , avec un rétablissement seulement aujourd’hui vers 16h, soit plus de 31 heures de coupure ! Les clients grand public semblent avoir été affectés plutôt en début d’après-midi. Donc au milieu de l’incident ? Ils ont démontré que leur capacité de résilience est nulle. « Des routeurs qui ont posé souci ». Non. Des opérateurs humains ont déclenché des opérations manuellement qui ont entrainé des conséquences non maitrisées, probablement par manque de documentation, d’anticipation ou de tests, et ils n’avaient pas de solution de secours. Mon verdict : - gestion technique en dessous des attentes, - communication opérationnelle inexistante et inacceptable. Ce n’est pas du tout acceptable. Vous avez probablement eu la chance d’avoir une position privilégiée, mais ce n’est pas le cas de clients plus petits. Et je l’ai déjà vu sur d’autres incidents, où SFR se moque de couper une PME pendant 24 heures, même avec des GTO, ils s’excusent par un magnifique geste commercial sur l’abonnement, loin de couvrir la réalité de l’impact économique. Après, c’est bien, ça montre qu’il est une nouvelle fois plus que dangereux de reposer sur un seul opérateur. Et aussi, qu’on a encore très souvent un meilleur service avec une FTTH grand public qu’avec une FTTO pro ou entreprise, et c’est bien triste. Beaucoup de TPE/PME basculent sur une ou deux FTTH, et un éventuel backup type Starlink. Plus de débit, plus de redondance, plus de fiabilité pour moins cher. Le 17 juin 2025 à 18:19, DUPLAQUET Guy <[email protected]> a écrit : [Vous ne recevez pas souvent de courriers de [email protected]. Découvrez pourquoi ceci est important à https://aka.ms/LearnAboutSenderIdentification ] Bonjour, Je vous trouve très sévères. Sur la segmentation : côté RIE, nous avons constaté un impact sur un peu plus de 1 100 sites sur les un peu moins de 9 000 en parc. Si on regarde les technologies, ce sont essentiellement des FTTO qui sont tombés, mais même comme cela, cela ne représente que de l'ordre de 25 % du parc SFR. Le premier contact entre le NOC RIE (l'équipe de supervision) et le NOC SFR est horodaté 11h00 CEST pour un incident qui est détecté à partir de 10h50 CEST, et nos interlocuteurs SFR reconnaissent immédiatement leur responsabilité. Après, on a un trou de communication, c'est vrai, mais l'impression donnée est celle de la mise en place très rapide d'une cellule de crise, puis des messages d'attente (qu'on reprend dans notre propre communication interne, premier post à 11h19 CEST) et vers 13h00 un diagnostic - problème de routage sur des routeurs d'épine dorsale nécessitant des interventions manuelles en relève, donc reprise progressive. Fin d'intervention annoncée pour 15h00 puis 14h00 puis 15h00 (et, en vrai, vers 15h15 CEST on était effectivement en impact résiduel, mais il est difficile de caler la fin de l'impact de cet incident car on a commencé à voir quelques sites 4G tomber à partir de midi, et j'ai l'impression que les deux incidents [Fixe et mobile] sont distincts). Pas de RETEX encore, mais je pense qu'on en aura un au moins informel à l'occasion d'un prochain Comex - SFR est assez transparent dans ses explications techniques quand on les questionne. Ce que je comprends - mais sans information officielle - c'est que ce sont des routeurs de l'ancien réseau Completel qui ont posé des soucis. L'hétérogénéité des équipements en cœur de réseau, c'est une opportunité en termes de résilience (cela correspond en sus à un choix réfléchi dans ce cas), mais un défi de tous les jours en termes d'administration technique (et notamment lorsque cette hétérogénéité est subie - par exemple dans une opération de croissance externe pour un opérateur télécom ! Bref, mon verdict : gestion technique plutôt OK, communication opérationnelle toujours trop limitée (mais bien meilleure que celle d'Outscale, par exemple, même si le domaine est un peu différent), bilan global acceptable (sur cet incident générique particulier - ce n'est pas toujours le cas sur toutes les opérations SFR). Très cordialement, Guy Duplaquet Responsable du département ISO (Infrastructures et services opérés) Direction interministérielle du numérique (DINUM) 20 avenue de Ségur, 75007 PARIS Tel. 01 71 21 11 32 Osiris 801 138 numerique.gouv.fr @_DINUM -----Message d'origine----- De : [email protected] <[email protected]> De la part de Raphael Mazelier via frnog Envoyé : mardi 17 juin 2025 16:42 À : [email protected] Objet : Re: [FRnOG] [MISC] Panne SFR d'hier Ce que ça nous apprend c'est que le réseau de SFR n'est pas résilient et n'est pas segmenté (à part pour le FTTH), c'est étonnant pour un gros opérateur avec beaucoup de techno différentes (fixe, mobile, data, voix). Le réseau SFR n'a jamais vraiment été cleané suite à toutes les acquisitions. Ca reste un assemblage des différents réseaux historiques rachetés. Faire du propre n'aura de toute façon jamais été la politique des décideurs. C'est dommage car il y avait des parties très intéressantes et bien tenues (par exemple feu le réseau Numericable que ce soit IP ou cable). -- Raph --------------------------- Liste de diffusion du FRnOG http://www.frnog.org/ --------------------------- Liste de diffusion du FRnOG http://www.frnog.org/ --------------------------- Liste de diffusion du FRnOG http://www.frnog.org/
