Toujours fasciné par le rapport de complexité entre le matériel et le logiciel, inversement proportionnel à leur fiabilités respectives.
Ca ne correspond pas à mon expérience passée à développer des systèmes hardware et software de télécommunications : - le management plane et le control plane sont généralement beaucoup plus complexes que le dataplane - le management plane et le control plane évoluent généralement beaucoup plus rapidement avec des mises à jour de code et configuration fréquentes - à contrario, le dataplane doit être le plus rapide possible et un uptime infini
De plus le coût d'un bug hardware étant bien supérieur au coût d'un bug software, on investit beaucoup plus de budget sur le test et la vérification hardware que sur le software. Et malgré ça, le hardware est tout de même buggé et le workaround est généralement software...
Tout ça pour dire que les contraintes ne sont pas les mêmes entre un dataplane limité en fonctionnalités et stable dans le temps vs un control plane en constante évolution et intégrant toute la complexité métier.
Enfin, les maigres détails du postmortem ne disent pas grand chose, difficile de se faire une idée. "A key software component failure" ça peut être Grok qui a halluciné la configuration des cores routers :)
ben --------------------------- Liste de diffusion du FRnOG http://www.frnog.org/
