Admintagebuch - Dokumentation der Admintätigkeiten

Tunnel zwischen des2 und remue-08 erstellt (gestern schon). Um des1 zu entlasten (der Tunnel dahin muss noch abgerissen werden).

1 „Gefällt mir“

Pünktlich zu Allerheiligen ist das RHE wieder aufgestanden. Naja gut, mit Christi Himmelfahrt wäre es wohl noch passender.

Ich hab bird, bird6 und den tunneldigger gestoppt und aus dem Autostart geworfen, bis klar ist, was mit der Kiste jetzt passiert.

2 „Gefällt mir“

Ist Nighbounce nun noch im Plan?

Ja, die Tunnel sind beantragt, aber noch nicht geschaltet.

Ich habe für Mittwoch auf die Tagesordnung gesetzt, dass wir darüber diskutieren, wie unsere Strategie ist. Gateways, die einfach mal so eine Woche ausgeschaltet sind, halte ich nicht für erstrebenswert.

1 „Gefällt mir“
1 „Gefällt mir“

Leider hatte ich die letzten Tage einen zu guten Schlaf, daher musste ich das jetzt tagsüber machen (aber immerhin am Morgen), tut mir leid :confused: :

  • Das virtio-net Device von des4 von 2 auf 4 interrupt-queues geändert
  • Da dazu des2 eh gestoppt und neu gestartet werden musste:
    • Sysupgrade auf des2
    • Sysupgrade auf dem hypervisor
  • Anschließend auf remue-08, greyworm, ausrufer den tunneldigger restartet, um die verbindungen wieder auszugleichen.
2 „Gefällt mir“

GRE-Tunnel zwischen remue-08 und des1 abgerissen, da schon vor einigen Tagen bereits der Tunnel zwischen remue-08 und des2 aufgebaut wurde.

Der Anwender sollte davon (fast) nichts mitbekommen haben. Da ich erst händisch die Interfaces gestoppt habe und die Interfaces Dateien händisch bearbeitet habe, bevor ich dann (nur noch zur überprüfung) ansible drüber laufen lassen habe und somit den networking daemon nicht neustarten musste (da müssen wir uns irgendwann mal was überlegen).

edit: Aktive (auf IPv4 sitzende) TCP Sessions, etc. werden natürlich gestorben sein, das bleibt bei NATting aber leider nicht aus.

1 „Gefällt mir“

Service-VM ausgerollt, damit der DNS-Eintrag von @kgbvax aktiviert wird.

https://github.com/FreiFunkMuenster/Ansible-Freifunk-Gateway/pull/23

Neues Wiki jetzt unter
https://wiki.freifunk-muensterland.de

4 „Gefällt mir“

Die FanLin-VM hatte ihren IPv4-Betrieb eingestellt (IPv6 funktionierte allerdings).
Ein service networking restart brachte, ebenso wie ifdown / ifup eth0, keine Verbesserung.
Ich habe die Gunst der Stunde genutzt um dem Blech und der VM die aktuellsten Sicherheitsupdates zu verpassen (u.a. Kernel,bind9, …).
Nach einem Neustart des Blechs war die VM wieder erreichbar. Die Ursache ist mir rätselhaft; die Logfiles vom Blech enthalten nix außergewöhnliches.

4 „Gefällt mir“

Gerade erst gemerkt, dass ich das an die falsche Emailadresse geschickt habe. Wird also jetzt nochmal ein paar Tage dauern, dann sollte es aber klappen :).

1 „Gefällt mir“

Unnötigen Mysql Server auf dem Firmwareserver gestoppt und Deinstalliert.

2 „Gefällt mir“

Bind auf Des1 und Parad0x war irgendwie kaputt. Habe ich gegen 17:30 Uhr neu gestartet.

Kurzer Reboot HC und Wiki um RAM anzupassen.

2 „Gefällt mir“

Letzte Nacht habe ich auf remue sysupgrade eingespielt und wollte dann gleich ein Kernelupgrade durchführen (da es zwischen 3.16 und 4.7 einige interessante Änderungen im Bereit KVM und Networking gab). Leider hat sich der Treiber der Netzwerkkarte quer gestellt (Realtek, verwendeter Treiber wurde nachträglich als Modul einkompiliert), sodass das System nicht mehr hoch kam.

Dies Risiko hatte ich durchaus einkalkuliert und wollte im Fall der Fälle das über den Resque-Modus beheben. Leider startete die Kiste noch nicht mal mehr in den Resque Modus (live system über tftp gebootet).

Leider hatte wohl niemand die Zugangsdaten zum “vollwertigen” Hetzner-Account. Sodass wir erst heute Morgen die LARA-Konsole beantragen konnten (KVMoE). Da haben wir dann festgestellt, dass die Boot-Reihenfolge im BIOS (bzw. UEFI) falsch eingestellt war.

Daher war das remue-Blech von ca. 01:00 Uhr bis ca. 09:00 Uhr nicht erreichbar. Damit waren auch die VMs remue-04, remue-08, forum, sowie firmware nicht erreichbar.

(Es war also eine GAU (hoffentlich nicht DAU) -Kaskade. :frowning:

Ich habe gestern und heute mal ein wenig im Grafana aufgeräumt und umgebaut:

  • Dashboards entfernt (da nur zu alter Infrastruktur kompatibel)
    • Domänen Übersicht
    • Domänen Host-Details
    • Spielwiese von descilla 2
  • Auf Multidomaenen Gateways Details ein wenig aufgeräumt.
  • Auf Spielwiese von descilla l2tp Übersicht über alle Gateways und Stats zu Paketen/Sekunde eingebaut.

Ich werde Spielwiese von descilla zu einer Art Gesamtübersicht umbauen und dann umbenennen. Außerdem werde ich mal mehr zu Paketen/Sekunde darstellen, da das imho hilfreicher ist als der Durchsatz in bit/s.

Falls ihr noch irgendwelche Anregungen und wünsche hab, dann erstellt bitte einfach auf Basis dieses Beitrags einen neuen Thread und äußert diese dann dort. Ich werde schauen, dass ich sie umsetzen kann.

5 „Gefällt mir“

Auf rhe alle Interfaces (außer eth0 und lo) abgerissen (und source Eintrag aus der Interfaces-Datei entfernt). Zwar glaube ich nicht, das das irgendwie Probleme gemacht hätte, aber man muss ja einen möglichen Fehlervektor nicht unnötig groß machen.

1 „Gefällt mir“

Des2 neu gestartet, weil in Domäne 11 die 10.43.88.3 (Partnergateway Remü-08) und die Service-VM nicht mehr pingbar waren.

@Tim hat gerade die Eigentümerschaft von FreiFunkMuenster auf Github an den FFI-Vorstand übertragen und wir haben ein paar tote Accounts gelöscht.

Damit bin ich endlich degradiert.

1 „Gefällt mir“