L'histoire a commencé le mercredi 06 Mai 2009, le MERCREDI NOIR du NET en Algérie. Ce jour la, les principaux fournisseurs d'accès nationaux (Djaweb - AT, EEPAD, SLC, ARN - CERIST) ont tenté d'interconnecter leurs réseaux via ALGIX le premier point d'échange algérien.
Mais tout ne se déroule pas comme il a été prévu, le protocole BGP (mal maitrisé) a provoqué un effet avalanche sur tous les routeurs lors de la propagation des tables de routage. Résultats des courses : tout le réseau national s'écroule comme un château de carte et c'est le Blackout chez tous les FAIs!
Curieusement, le même jour au soir, AT décide de couper la connexion a EEPAD, les ingénieurs d'AT ayant expliqué le Blackout par une saturation au niveau des Backbones trouvant ainsi la bonne excuse pour la décision de coupure (ce qui ne semble être qu'un conflit d'intérêt).
Depuis ce jour la, tout le réseau national est en souffrance, la liaison ARN-AT est coupée dans un sens, EEPAD est coupée de ARN et AT aléatoirement, les DNS du CERIST ne sont pas accessibles depuis les liaison PRO de AT etc...
En plus des montées en charge périodiques :
Et de mini déconnexions de 30 secondes a deux minutes sur chaque intervalle de 5 minutes :
Ces deux phénomènes sont caractéristiques d'une instabilité oscillatoire du routage provoquée par de mauvaises configuration des routeurs ou des routeurs en mauvais état. Le phénomène qui ne touchait au départ que les Backbones et quelques routeurs s'est propagé pratiquement a tous les routeurs au niveau national!
Ne fallait-il pas bien étudier le réseau national avant de lancer une telle opération, vérifier l'état et la qualité des routeurs, homogénéiser leurs configuration et mettre en place un BGP dumpening afin de freiner la surcharge provoquée par les mise a jour des tables entre les routeurs?!
En attendant je fume des octets et je reste déconnecté, le blackout continu!




Réponse avec citation



Liens sociaux