wir sollten uns kurzfristig überlegen, wie wir mit diesem Bug umgehen.
Möglichkeiten:
Von mir vorgeschlagenen Patch überall einkompilieren
Alle L2TP-Domänen auf zwei Gateways reduzieren und auch die IP-Adressen entfernen
Von „usage“ auf „first-available“ umstellen
Gegen letztere Variante spricht, dass wir das dann wieder rückgängig machen müssten.
Das sollten wir innerhalb der nächsten Woche umsetzen, da wenn uns in einer Domäne das primäre Gateway wegbricht, alle Knoten der Domäne offline sein werden.
Ich wäre für Variante drei, denn denn ein gateway ist meiner Ansicht nach ausreichend und vereinfacht das ganz auch. Das zweit gateway sollte nur aktiv werden, wenn das primäre wegbricht.
Das führt aber zu einer ziemlichen Einschränkung: Wenn wir Durchsatz von einer VM auf eine andere verschieben wollen, müssten wir jedes mal ein Firmwareupdate ausrollen.
Ein Fallback auf den first_available-Auswahlalgorithmus, wenn usage kein sinnvolles Ergebnis liefert, weil z. B. das ausgewählte Gateway gar nicht erreichbar ist. (Zur Erklärung, der Client hat drei Algorithmen, nach denen er das Gateway auswählt: zufällig, zuerst verfügbar und nach Auslastung. Zufällig liefert auffällig oft dasselbe Ergebnis, zuerst verfügbar funktioniert korrekt und nach Auslastung (von dem ursprünglichen Programmierer „usage“ genannt) ist völlig kaputt, wenn mehr als zwei Gateways konfiguriert sind. Usage ist bei uns eingestellt.)
@Fungur und ich haben heute das Ding so umprogrammiert, dass usage jetzt aber funktioniert. Es ist zwar nicht ganz sauber, aber das Ding ist völlig chaotisch programmiert, mehr ging nicht. Wir wollen es zusammen mit @descilla mal neu strukturieren.
Wir verwenden für eine Domäne auch Tunneldigger. Unter gluon 2015 lief alles einwandfrei. Jetzt haben wir images mit gluon 2016 gebaut. Nach längerer Zeit kamen die router erst online. Außer einen v6 Prefix erhält der Client nichts: Kein IPv4, kein Durchsatz.