wir möchten mit unserem Backend umziehen und ich konnte die Konfiguration der Gateways auch soweit erfolgreich mit Ansible ausrollen.
Vor einiger Zeit hatte ich bereits schon mal ein ähnliches Problem, das aber gelöst werden konnte: [gelöst] Benötige Unterstützung
Nun stellt es sich so dar, dass ich nicht mal einen Knoten online bekomme. Laut ifconfig auf dem Gateway scheint ein L2TP-Tunnel zu stehen, aber der Knoten bleibt offline.
Die Tunnel zu FFRL werden nach einem “birdc6 show proto” als “established” angezeigt.
Weiterhin beobachte ich noch den Effekt, dass IPv6 im alten Backend clientseitig nicht mehr funktioniert, sobald die Gateways des neuen Backends online sind. Schalte ich die neuen Server ab, ist das Problem weg. Die Server im alten Backend mit der Tunnelkonfiguration, die ich auf den neuen Gateways benutzen möchte, sind natürlich abgeschaltet.
Ich habe neue IPv6 Präfixe benutzt und verteile auch einen anderen IPv4-Scope, was aber nicht ursächlich sein kann.
Welchen Kernel hast du auf den Gateways? Welchen Tunneldigger habt ihr auf den Knoten?
Es gibt einen Bug im Tunneldigger der dazu führt das immer die gleiche Tunnel ID an den Server übertragen wird. Ein weiterer Bug im Kernel hat dazu geführt das die Tunnel ID vom Kernel ignoriert wurde und die Verbindung zu Stande kam. Dieser Kernel Bug wurde aber in Kerneln > 4.9.0-0.bpo.3-amd64 gefixt und Doppelte IDs werden vom Kernel abgewiesen.
Siehe auch:
Ich nehme an das die Neuen Gateways schlicht Routen zum FFRL exportieren die dazu führen das euer gesamtes /48er Netz an den neuen Gateways ankommen. Zum test kannst du auf den neuen Gateways mal mit systemctl stop bird6 bird6 deaktivieren und gucken ob es dann wieder geht.
OK, wenn ich bird6 anhalte, ist zumindest das zweite Problem weg. Kann man da für eine Übergangszeit was dran ändern? Ich habe leider kein weiteres /48 Netz zur Verfügung.
Wir benutzen einen 4.9.0-0.bpo.6-amd64 Kernel auf den Gateways. Der tunneldigger sollte aktuell sein, wir nutzen Gluon 2018.1.1.
Unser Netz ist 2a03:2260:2004::/48. Reicht es, dann z.B. 2a03:2260:2004:ff00::/56 zu nehmen?
Oder habe ich da noch einen Denkfehler? Muss ich am alten Backend auch etwas ändern?
Gleich nochmal die gateways.yml, die host_vars und die group_vars ab. Die muss man leider immer wieder anpassen, wenn wir neue Variablen einführen. Das ist etwas blöd. Man könnte etwas sauberer mit Standardparametern arbeiten. Da müssen wir uns noch verbessern.