Admintagebuch - Dokumentation der Admintätigkeiten

Kea auf Parad0x neu gestartet.

2 „Gefällt mir“

Das ist klasse! Ich überlege gerade, ob es trotzdem noch Sinn macht, Dienste, die abgestürzt sind, per Cronjob zu prüfen und nachzustarten.

IPV6-Routing auf Des1 per Hand auf das neue Konzept umgestellt. Es wird das Gesamtnetz angekündigt und die lokalen Domänen:

bird> show route export ffrl_ber1
2a03:2260:115:1900::/56 unreachable [static_domaene19 2017-12-18] * (200)
2a03:2260:115:1600::/56 unreachable [static_domaene16 2017-12-18] * (200)
2a03:2260:115:1200::/56 unreachable [static_domaene12 2017-12-18] * (200)
2a03:2260:115:900::/56 unreachable [static_domaene09 2017-12-18] * (200)
2a03:2260:115::/48 unreachable [static_Gesamtnetz 23:25:13] * (200)
2a03:2260:115:3500::/56 unreachable [static_domaene35 2017-12-18] * (200)
2a03:2260:115:3200::/56 unreachable [static_domaene32 2017-12-18] * (200)
2a03:2260:115:2800::/56 unreachable [static_domaene28 2017-12-18] * (200)
2a03:2260:115:2600::/56 unreachable [static_domaene26 2017-12-18] * (200)
2a03:2260:115:5500::/56 unreachable [static_domaene55 2017-12-18] * (200)
2a03:2260:115:5400::/56 unreachable [static_domaene54 2017-12-18] * (200)
2a03:2260:115:5100::/56 unreachable [static_domaene51 2017-12-18] * (200)
2a03:2260:115:4600::/56 unreachable [static_domaene46 2017-12-18] * (200)
2a03:2260:115:4500::/56 unreachable [static_domaene45 2017-12-18] * (200)
2a03:2260:115:4100::/56 unreachable [static_domaene41 2017-12-18] * (200)

@corny456 kann mal beobachten, ob der Server jetzt „weniger“ Durchsatz abbekommt, dann können wir das ins Ansible übernehmen und überall umsetzen.

Grüße
Matthias

1 „Gefällt mir“
  • Domänen-Präfixe nicht mehr zwischen den Gateways austauschen

  • Jedes Gateway kündigt nur noch seine eigenen Präfixe und das Gesamtnetz an

  • Soll verhindern, dass Pakete vom Upstream zunächst zu einem Gateway geschickt werden, das die Zieldomäne gar nicht hostet

  • Sofern mind. ein Gateway pro Domäne direkt angebunden ist, bekommt dieses dann direkt die Pakete vom Upstream

  • Falls beide indirekt angebunden sind, werden sie von einem beliebigen Gateway über die /48-Ankündigung angenommen

1 „Gefällt mir“
2 „Gefällt mir“

Firmware auf allen Unif Switchen im controller aktualisiert

Leider sind bei der BW mittlerweile
4 UAPs ausgefallen
2 scheinen nur noch per WLAN eine Verbindung zu bekommen
2 haben nur 100Mbit
1 hat nur noch 10 mbit

2 „Gefällt mir“

Cronjob eingerichtet, der alle 20 Minuten versucht neue Firmware vom Buildserver hochzuladen. Allerdings nicht, wenn das Hochladen von 20 Minuten früher noch läuft. Dazu wird eine Sperrdatei in /var/lock angelegt.

*/20 * * * * test -e /var/lock/rsync-upload && exit 0 || (touch /var/lock/rsync-upload;/usr/bin/rsync -av -e "ssh -i /root/.ssh/id_rsa -p 223" /var/www/html/ root@firmware.ffmsl.de:/var/www/html;rm /var/lock/rsync-upload)

Forum neu gestartet.
Hat aber nix gebracht…

2 „Gefällt mir“

Karte von Remue auf Voyager verschoben.

Auf Remue den Swap mittels swapoff -a deaktiviert. Seitdem läuft auch das Forum wieder annehmbar.

1 „Gefällt mir“

Updates gemacht auf:

  • Backup-VM
  • Statistic-VM
  • Ticketsystem-VM
  • DNS-Master-VM
  • Firmware-VM
  • Icinga-VM
  • Karten-VM
  • Mailserver
  • Webserver
3 „Gefällt mir“

@Fungur hatte vorhin kurz die neue IPV6-Bird-Konfiguration ausgerollt. Ist jetzt auf allen Gateways aktiv.

Forum OS + Discourse aktualisiert.
Infra Updates: Docker + Co ausstehend

3 „Gefällt mir“

Hypervisor von Gateway Parad0x aktualisiert und neu gestartet = 4 Minuten Downtime für Parad0x

3 „Gefällt mir“


und auf Fanlin NEU ausgerollt.

Werde heute Abend da Fanlin ALT durchsatztechnisch in den letzten Zuckungen liegt mal alle Gateways und die Karte ausrollen und somit Fanlin NEU in Betrieb nehmen. @MPW wollen wir in dem Zug Rouletten?

5 „Gefällt mir“

Jo finde ich gut

Hast du denn Zeit zum Rouletten? Alleine mach ich sonst bestimmt was kapod :stuck_out_tongue:

Fanlin Bleche (alt und neu) und entsprechende VMs mit Kernel- / Microcodeupdates versehen und rebootet.
Das alte fanlin-Blech wird am 22.02. abgeschaltet.

3 „Gefällt mir“

Heute Abend irgendwann ab 7 werde ich Jetplow Hypervisor für Meltdown/Spectre aktualisieren, ergo Downtime von ca 10 Minuten

UPDATE Löuft gerade… FERTIG

4 „Gefällt mir“

Fanlin neu in Betrieb genommen.
Dafür:

  • alle Gateways ausgerollt und neu gestartet.
  • DNS Master ausgerollt und bind neu gestartet.
  • Karte ausgerollt und neustart folgt später.
  • Tunnel zu Remue-04 manuell angepasst.
  • Icinga VM ausgerollt und neu gestartet.

Keine Verluste erlitten…

6 „Gefällt mir“

Karte neu gestartet.

Ergenzung zu heute Nachmittag:
Auf Fanlin ALT sind alle relevanten Dienste gestoppt und deaktiviert.

3 „Gefällt mir“