Admintagebuch - Dokumentation der Admintätigkeiten

Service-VM ausgerollt, damit der DNS-Eintrag von @kgbvax aktiviert wird.

https://github.com/FreiFunkMuenster/Ansible-Freifunk-Gateway/pull/23

Neues Wiki jetzt unter
https://wiki.freifunk-muensterland.de

4 „Gefällt mir“

Die FanLin-VM hatte ihren IPv4-Betrieb eingestellt (IPv6 funktionierte allerdings).
Ein service networking restart brachte, ebenso wie ifdown / ifup eth0, keine Verbesserung.
Ich habe die Gunst der Stunde genutzt um dem Blech und der VM die aktuellsten Sicherheitsupdates zu verpassen (u.a. Kernel,bind9, …).
Nach einem Neustart des Blechs war die VM wieder erreichbar. Die Ursache ist mir rätselhaft; die Logfiles vom Blech enthalten nix außergewöhnliches.

4 „Gefällt mir“

Gerade erst gemerkt, dass ich das an die falsche Emailadresse geschickt habe. Wird also jetzt nochmal ein paar Tage dauern, dann sollte es aber klappen :).

1 „Gefällt mir“

Unnötigen Mysql Server auf dem Firmwareserver gestoppt und Deinstalliert.

2 „Gefällt mir“

Bind auf Des1 und Parad0x war irgendwie kaputt. Habe ich gegen 17:30 Uhr neu gestartet.

Kurzer Reboot HC und Wiki um RAM anzupassen.

2 „Gefällt mir“

Letzte Nacht habe ich auf remue sysupgrade eingespielt und wollte dann gleich ein Kernelupgrade durchführen (da es zwischen 3.16 und 4.7 einige interessante Änderungen im Bereit KVM und Networking gab). Leider hat sich der Treiber der Netzwerkkarte quer gestellt (Realtek, verwendeter Treiber wurde nachträglich als Modul einkompiliert), sodass das System nicht mehr hoch kam.

Dies Risiko hatte ich durchaus einkalkuliert und wollte im Fall der Fälle das über den Resque-Modus beheben. Leider startete die Kiste noch nicht mal mehr in den Resque Modus (live system über tftp gebootet).

Leider hatte wohl niemand die Zugangsdaten zum “vollwertigen” Hetzner-Account. Sodass wir erst heute Morgen die LARA-Konsole beantragen konnten (KVMoE). Da haben wir dann festgestellt, dass die Boot-Reihenfolge im BIOS (bzw. UEFI) falsch eingestellt war.

Daher war das remue-Blech von ca. 01:00 Uhr bis ca. 09:00 Uhr nicht erreichbar. Damit waren auch die VMs remue-04, remue-08, forum, sowie firmware nicht erreichbar.

(Es war also eine GAU (hoffentlich nicht DAU) -Kaskade. :frowning:

Ich habe gestern und heute mal ein wenig im Grafana aufgeräumt und umgebaut:

  • Dashboards entfernt (da nur zu alter Infrastruktur kompatibel)
    • Domänen Übersicht
    • Domänen Host-Details
    • Spielwiese von descilla 2
  • Auf Multidomaenen Gateways Details ein wenig aufgeräumt.
  • Auf Spielwiese von descilla l2tp Übersicht über alle Gateways und Stats zu Paketen/Sekunde eingebaut.

Ich werde Spielwiese von descilla zu einer Art Gesamtübersicht umbauen und dann umbenennen. Außerdem werde ich mal mehr zu Paketen/Sekunde darstellen, da das imho hilfreicher ist als der Durchsatz in bit/s.

Falls ihr noch irgendwelche Anregungen und wünsche hab, dann erstellt bitte einfach auf Basis dieses Beitrags einen neuen Thread und äußert diese dann dort. Ich werde schauen, dass ich sie umsetzen kann.

5 „Gefällt mir“

Auf rhe alle Interfaces (außer eth0 und lo) abgerissen (und source Eintrag aus der Interfaces-Datei entfernt). Zwar glaube ich nicht, das das irgendwie Probleme gemacht hätte, aber man muss ja einen möglichen Fehlervektor nicht unnötig groß machen.

1 „Gefällt mir“

Des2 neu gestartet, weil in Domäne 11 die 10.43.88.3 (Partnergateway Remü-08) und die Service-VM nicht mehr pingbar waren.

@Tim hat gerade die Eigentümerschaft von FreiFunkMuenster auf Github an den FFI-Vorstand übertragen und wir haben ein paar tote Accounts gelöscht.

Damit bin ich endlich degradiert.

1 „Gefällt mir“

Gerade die Gateways umgezogen. Sollte alles soweit fertig sein, Nightbounce ist dabei leider abgestürtzt. Ansonsten sollte alles laufen. Des1 und Des2 sind momentan noch etwas überbelastet.

4 „Gefällt mir“

Abgestürzt? Oder beim Reboot hängengeblieben?

Beim Neustart hängen geblieben, schließe ich mal aus dem Bildschirmfoto, was du in HipChat veröffentlich hattest.

DHCP Script auf den Gateways aus collectd entfernt (gestern Abend schon). Ansible entsprechend angepasst. Die Load ist dadurch merklich gesunken.

2 „Gefällt mir“

Directory Listing auf dem Firmwareserver gepimpt.

https://firmware.freifunk-muensterland.de/domaene01/beta/sysupgrade/

Somit sind die langen Dateinamen auch ohne probleme lesbar.

5 „Gefällt mir“

deshyper-01, des1, deshyper-02und des2 neu gestartet, um (u. a. kernel-)updates anzuwenden.

1 „Gefällt mir“

Des2 neu gestartet, weil das Batman sich aufgehängt hatte (insbesondere Domäne 09).