Admintagebuch - Dokumentation der Admintätigkeiten

Auf Des1 Kerneldowngrade von 4.9 auf 4.7.

Das Batman aus Kernel 4.9 mag nicht arbeiten:

# batctl -m bat12 o
Error - mesh has not been enabled yet
Activate your mesh by adding interfaces to batman-adv

Auf des1 schien das Problem ein Anderes zu sein. Siehe Kommentar zu:

  • Logfile-Einstellungen von kea-dhcp4 geändert (von INFO auf WARN umgestellt)
  • logrotate angepasst
    • jetzt wird auch das kea-dhcp4 logfile rotiert
    • außerdem wurden die rotate und count Einstellungen nicht auf die einträge in /etc/logrotate.d/ angewandt.
  • Außerdem habe ich die tasks zum bauen von batctl angepasst
    • ab batadv 2016.3 fallen die einträge im debugfs weg und es muss über netlink/ioctl gearbeitet werden. Das konnte die bisherige batctl Version (2015.1) nicht. batctl 2016.4 (was nun installiert wird) funktioniert aber auch noch mit dem 4.7er Kerneln, respektive batadv 2016.2 (getestet).
    • es wird nun geprüft ob die passende Version installiert ist, ansonsten wird neu gebaut.
    • Erforderliche Pakete zum bauen hinzugefügt (libnl-genl-3-dev)
  • respondd Rolle aktualisiert und auf allen Gateways ausgerollt
    • repos von nodejs (und key) werden hinzugefügt
    • abhängigkeit nodejs wird nun installiert
    • die node-respondd-* services werden nun auch aktiviert
  • “networking restart” Handler angepasst (überall werden nun die selben Aufrufe durchgeführt)
    • es wird nun auch der kea-dhcp-server restartet
  • tunearpcache dem services playbook hinzugefügt und auf karteneu ausgerollt. Dort ist der ndisc cache vollgelaufen (respondd geht ja über ipv6 multicast).
  • hopglass server
    • Daten werden nun über nginx reverse-proxy ausgeliefert
    • dadurch ist die nodes.json ist 403 kb anstatt 2,6 mb groß
    • Auf den Detailseiten zu den Nodes werden die Statistiken jetzt als Grafana-Iframe eingeblendet (schön interaktiv)
    • Auf der globalen Statusseite findet sich jetzt der Status aller Grafana-Alerts.
    • Pull-Request von @Handle muss noch gemerged werden (da sollte das alles drin sein, aber @Handle hat noch einiges mehr gemacht).
  • und bestimmt 1000 Sachen, die ich vergessen habe.
5 „Gefällt mir“

Forum aktualisiert:

3 „Gefällt mir“
  • node-respondd wieder deaktiviert, da es einen zu großen Ressourcenbedarf hatte.
  • logging für named angepasst
    • es wird nun in ein eigenes logfile geschrieben
    • es wird jetzt nur noch ab der stufe “error” geloggt
  • logrotate für named und tunneldigger-broker konfiguriert
1 „Gefällt mir“

sysupgrade auf fanlin durchgeführt (ohne Kernelupgrade) und neu gestartet, da:

PS: Es bleibt zu beobachten, ob das BATMAN-Problem unter 4.9 weiterhin besteht. Für die Eifrigen unter euch: Ihr könnt ja mal die entsprechenden Commit-Messages zwischen 4.7 und 4.9 durchblättern. :wink:

Ich habe auf der Service-VM und auf dem Firmwareserver simp_le aus einem neuen Git-Repository neu installiert (weil das alte nicht mehr funktioniert) und dann neue Let’s-Encrypt-Zertifikate erzeugt.

1 „Gefällt mir“

des2 hatte gerade eine kurze Downtime, läuft aber nun alles wieder.

PS: Habe dann natürlich gleich Updates eingespielt.

1 „Gefällt mir“

Security Updates auf Nightbounce eingespielt, reboot.

3 „Gefällt mir“

Ich habe mir jetzt mal angeschaut, warum die iptables regeln nie nach einem neustart laden:

netfilter-persistent.service (welches die iptables regeln lädt) wird von systemd nicht gestartet, da es abhängigkeitsprobleme gibt, die dadurch entstehen, dass zuvor das laden eines kernelmoduls fehlschlägt, das laden des kernelmoduls schlägt fehl, weil zwar ein neuer kernel (4.7) installiert wurde aber nicht die passenden headers dazu.

Da 4.7 nicht mehr supportet ist und ich auch gerade nicht die headers zur hand hatte, habe ich kurzerhand kernel in version 4.9.4 installiert. Nun läuft alles wie es soll. :slight_smile:

3 „Gefällt mir“

Wegen geplanter Wartungsarbeiten an der Stromversorgung werde ich das fanlin-Blech, heute um 22:55, herunterfahren.
Es soll nur ein Ausfall von ca. 20 Minuten entstehen, aber im Zeitraum von 23:00 bis 07:00 des Folgetages. :dizzy_face: Servdiscount - Status - Webseite

1 „Gefällt mir“

Des1 neugestartet da sich in Dom25 das batman auf die Nase gelegt hat.
Anschließend auf Parad0x den Tunneldigger neugestartet zum Knoten verteilen.

1 „Gefällt mir“

Auf Des2 und Nightbounce IPV6 repariert, dazu Ansible gateways_batman und gateway_l2tp ausgerollt.

1 „Gefällt mir“

Blech fanlin ist wieder up.
Leider nur mit einem CPU-Kern, obwohl ich ihm im virt-manager zwei Kerne zugewiesen habe.

1 „Gefällt mir“

Möglicherweise ist der noch im grub deaktiviert. Da hatten wir mal eine zeitlang nr ansible rolle die das gemacht hat. Ich schaue nachher mal.

Das wird es sein.

Auf GW @FanLin sind nun zwei CPU Cores aktiviert

2 „Gefällt mir“

Batman DAT für alle Domänen auf des2 und parad0x zu Testzwecken deaktiviert:

for i in $(netstat -i | grep -oE "bat[0-9]{2}" | tr '\n' ' '); do batctl -m $i dat 0; done
1 „Gefällt mir“

Die alten Kartendaten waren in fast allen Domänen kaputt. Habe sie gelöscht, damit sie wieder neu erstellt werden. Die Karte geht nun zwar wieder, aber die History ist weg. Ich habe die alten Daten im Unterordner “backup” gesichert.

2 „Gefällt mir“

node-respondd auf Fanlin gestoppt und deaktiviert.

1 „Gefällt mir“