Admintagebuch - Dokumentation der Admintätigkeiten


#1167

Kea auf Parad0x neu gestartet.


DHCP Paradox D21
#1168

Das ist klasse! Ich überlege gerade, ob es trotzdem noch Sinn macht, Dienste, die abgestürzt sind, per Cronjob zu prüfen und nachzustarten.


#1169

IPV6-Routing auf Des1 per Hand auf das neue Konzept umgestellt. Es wird das Gesamtnetz angekündigt und die lokalen Domänen:

bird> show route export ffrl_ber1
2a03:2260:115:1900::/56 unreachable [static_domaene19 2017-12-18] * (200)
2a03:2260:115:1600::/56 unreachable [static_domaene16 2017-12-18] * (200)
2a03:2260:115:1200::/56 unreachable [static_domaene12 2017-12-18] * (200)
2a03:2260:115:900::/56 unreachable [static_domaene09 2017-12-18] * (200)
2a03:2260:115::/48 unreachable [static_Gesamtnetz 23:25:13] * (200)
2a03:2260:115:3500::/56 unreachable [static_domaene35 2017-12-18] * (200)
2a03:2260:115:3200::/56 unreachable [static_domaene32 2017-12-18] * (200)
2a03:2260:115:2800::/56 unreachable [static_domaene28 2017-12-18] * (200)
2a03:2260:115:2600::/56 unreachable [static_domaene26 2017-12-18] * (200)
2a03:2260:115:5500::/56 unreachable [static_domaene55 2017-12-18] * (200)
2a03:2260:115:5400::/56 unreachable [static_domaene54 2017-12-18] * (200)
2a03:2260:115:5100::/56 unreachable [static_domaene51 2017-12-18] * (200)
2a03:2260:115:4600::/56 unreachable [static_domaene46 2017-12-18] * (200)
2a03:2260:115:4500::/56 unreachable [static_domaene45 2017-12-18] * (200)
2a03:2260:115:4100::/56 unreachable [static_domaene41 2017-12-18] * (200)

@corny456 kann mal beobachten, ob der Server jetzt „weniger“ Durchsatz abbekommt, dann können wir das ins Ansible übernehmen und überall umsetzen.

Grüße
Matthias


#1170
  • Domänen-Präfixe nicht mehr zwischen den Gateways austauschen

  • Jedes Gateway kündigt nur noch seine eigenen Präfixe und das Gesamtnetz an

  • Soll verhindern, dass Pakete vom Upstream zunächst zu einem Gateway geschickt werden, das die Zieldomäne gar nicht hostet

  • Sofern mind. ein Gateway pro Domäne direkt angebunden ist, bekommt dieses dann direkt die Pakete vom Upstream

  • Falls beide indirekt angebunden sind, werden sie von einem beliebigen Gateway über die /48-Ankündigung angenommen


#1171

#1172

Firmware auf allen Unif Switchen im controller aktualisiert

Leider sind bei der BW mittlerweile
4 UAPs ausgefallen
2 scheinen nur noch per WLAN eine Verbindung zu bekommen
2 haben nur 100Mbit
1 hat nur noch 10 mbit


#1173

Cronjob eingerichtet, der alle 20 Minuten versucht neue Firmware vom Buildserver hochzuladen. Allerdings nicht, wenn das Hochladen von 20 Minuten früher noch läuft. Dazu wird eine Sperrdatei in /var/lock angelegt.

*/20 * * * * test -e /var/lock/rsync-upload && exit 0 || (touch /var/lock/rsync-upload;/usr/bin/rsync -av -e "ssh -i /root/.ssh/id_rsa -p 223" /var/www/html/ root@firmware.ffmsl.de:/var/www/html;rm /var/lock/rsync-upload)

Shell locks
#1174

Forum neu gestartet.
Hat aber nix gebracht…


#1175

Karte von Remue auf Voyager verschoben.

Auf Remue den Swap mittels swapoff -a deaktiviert. Seitdem läuft auch das Forum wieder annehmbar.


[gelöst] Forum sehr träge
#1176

Updates gemacht auf:

  • Backup-VM
  • Statistic-VM
  • Ticketsystem-VM
  • DNS-Master-VM
  • Firmware-VM
  • Icinga-VM
  • Karten-VM
  • Mailserver
  • Webserver

#1177

@Fungur hatte vorhin kurz die neue IPV6-Bird-Konfiguration ausgerollt. Ist jetzt auf allen Gateways aktiv.


#1178

Forum OS + Discourse aktualisiert.
Infra Updates: Docker + Co ausstehend


#1179

Hypervisor von Gateway Parad0x aktualisiert und neu gestartet = 4 Minuten Downtime für Parad0x


#1180


und auf Fanlin NEU ausgerollt.

Werde heute Abend da Fanlin ALT durchsatztechnisch in den letzten Zuckungen liegt mal alle Gateways und die Karte ausrollen und somit Fanlin NEU in Betrieb nehmen. @MPW wollen wir in dem Zug Rouletten?


#1181

Jo finde ich gut


#1182

Hast du denn Zeit zum Rouletten? Alleine mach ich sonst bestimmt was kapod :stuck_out_tongue:


#1183

Fanlin Bleche (alt und neu) und entsprechende VMs mit Kernel- / Microcodeupdates versehen und rebootet.
Das alte fanlin-Blech wird am 22.02. abgeschaltet.


#1184

Heute Abend irgendwann ab 7 werde ich Jetplow Hypervisor für Meltdown/Spectre aktualisieren, ergo Downtime von ca 10 Minuten

UPDATE Löuft gerade… FERTIG


#1185

Fanlin neu in Betrieb genommen.
Dafür:

  • alle Gateways ausgerollt und neu gestartet.
  • DNS Master ausgerollt und bind neu gestartet.
  • Karte ausgerollt und neustart folgt später.
  • Tunnel zu Remue-04 manuell angepasst.
  • Icinga VM ausgerollt und neu gestartet.

Keine Verluste erlitten…


#1186

Karte neu gestartet.

Ergenzung zu heute Nachmittag:
Auf Fanlin ALT sind alle relevanten Dienste gestoppt und deaktiviert.