Kea auf Parad0x neu gestartet.
Das ist klasse! Ich überlege gerade, ob es trotzdem noch Sinn macht, Dienste, die abgestürzt sind, per Cronjob zu prüfen und nachzustarten.
IPV6-Routing auf Des1 per Hand auf das neue Konzept umgestellt. Es wird das Gesamtnetz angekündigt und die lokalen Domänen:
bird> show route export ffrl_ber1
2a03:2260:115:1900::/56 unreachable [static_domaene19 2017-12-18] * (200)
2a03:2260:115:1600::/56 unreachable [static_domaene16 2017-12-18] * (200)
2a03:2260:115:1200::/56 unreachable [static_domaene12 2017-12-18] * (200)
2a03:2260:115:900::/56 unreachable [static_domaene09 2017-12-18] * (200)
2a03:2260:115::/48 unreachable [static_Gesamtnetz 23:25:13] * (200)
2a03:2260:115:3500::/56 unreachable [static_domaene35 2017-12-18] * (200)
2a03:2260:115:3200::/56 unreachable [static_domaene32 2017-12-18] * (200)
2a03:2260:115:2800::/56 unreachable [static_domaene28 2017-12-18] * (200)
2a03:2260:115:2600::/56 unreachable [static_domaene26 2017-12-18] * (200)
2a03:2260:115:5500::/56 unreachable [static_domaene55 2017-12-18] * (200)
2a03:2260:115:5400::/56 unreachable [static_domaene54 2017-12-18] * (200)
2a03:2260:115:5100::/56 unreachable [static_domaene51 2017-12-18] * (200)
2a03:2260:115:4600::/56 unreachable [static_domaene46 2017-12-18] * (200)
2a03:2260:115:4500::/56 unreachable [static_domaene45 2017-12-18] * (200)
2a03:2260:115:4100::/56 unreachable [static_domaene41 2017-12-18] * (200)
@corny456 kann mal beobachten, ob der Server jetzt „weniger“ Durchsatz abbekommt, dann können wir das ins Ansible übernehmen und überall umsetzen.
Grüße
Matthias
Domänen-Präfixe nicht mehr zwischen den Gateways austauschen
Jedes Gateway kündigt nur noch seine eigenen Präfixe und das Gesamtnetz an
Soll verhindern, dass Pakete vom Upstream zunächst zu einem Gateway geschickt werden, das die Zieldomäne gar nicht hostet
Sofern mind. ein Gateway pro Domäne direkt angebunden ist, bekommt dieses dann direkt die Pakete vom Upstream
Falls beide indirekt angebunden sind, werden sie von einem beliebigen Gateway über die /48-Ankündigung angenommen
Firmware auf allen Unif Switchen im controller aktualisiert
Leider sind bei der BW mittlerweile
4 UAPs ausgefallen
2 scheinen nur noch per WLAN eine Verbindung zu bekommen
2 haben nur 100Mbit
1 hat nur noch 10 mbit
Cronjob eingerichtet, der alle 20 Minuten versucht neue Firmware vom Buildserver hochzuladen. Allerdings nicht, wenn das Hochladen von 20 Minuten früher noch läuft. Dazu wird eine Sperrdatei in /var/lock angelegt.
*/20 * * * * test -e /var/lock/rsync-upload && exit 0 || (touch /var/lock/rsync-upload;/usr/bin/rsync -av -e "ssh -i /root/.ssh/id_rsa -p 223" /var/www/html/ root@firmware.ffmsl.de:/var/www/html;rm /var/lock/rsync-upload)
Forum neu gestartet.
Hat aber nix gebracht…
Karte von Remue auf Voyager verschoben.
Auf Remue den Swap mittels swapoff -a
deaktiviert. Seitdem läuft auch das Forum wieder annehmbar.
Updates gemacht auf:
- Backup-VM
- Statistic-VM
- Ticketsystem-VM
- DNS-Master-VM
- Firmware-VM
- Icinga-VM
- Karten-VM
- Mailserver
- Webserver
@Fungur hatte vorhin kurz die neue IPV6-Bird-Konfiguration ausgerollt. Ist jetzt auf allen Gateways aktiv.
Forum OS + Discourse aktualisiert.
Infra Updates: Docker + Co ausstehend
Hypervisor von Gateway Parad0x aktualisiert und neu gestartet = 4 Minuten Downtime für Parad0x
und auf Fanlin NEU ausgerollt.
Werde heute Abend da Fanlin ALT durchsatztechnisch in den letzten Zuckungen liegt mal alle Gateways und die Karte ausrollen und somit Fanlin NEU in Betrieb nehmen. @MPW wollen wir in dem Zug Rouletten?
Jo finde ich gut
Hast du denn Zeit zum Rouletten? Alleine mach ich sonst bestimmt was kapod
Fanlin Bleche (alt und neu) und entsprechende VMs mit Kernel- / Microcodeupdates versehen und rebootet.
Das alte fanlin-Blech wird am 22.02. abgeschaltet.
Heute Abend irgendwann ab 7 werde ich Jetplow Hypervisor für Meltdown/Spectre aktualisieren, ergo Downtime von ca 10 Minuten
UPDATE Löuft gerade… FERTIG
Fanlin neu in Betrieb genommen.
Dafür:
- alle Gateways ausgerollt und neu gestartet.
- DNS Master ausgerollt und bind neu gestartet.
- Karte ausgerollt und neustart folgt später.
- Tunnel zu Remue-04 manuell angepasst.
- Icinga VM ausgerollt und neu gestartet.
Keine Verluste erlitten…
Karte neu gestartet.
Ergenzung zu heute Nachmittag:
Auf Fanlin ALT sind alle relevanten Dienste gestoppt und deaktiviert.