Admintagebuch - Dokumentation der Admintätigkeiten

Hetzner hat beim Blech von Des1 eine defekte Festplatte getauscht. Nun läuft ein erneuter Check des Systems.

2 „Gefällt mir“

TTL im servers.ff-msl.de Zonefile auf 600 reduziert um beim Gateway-Roulette die Ausfallzeit zu minimieren.

Updates auf Corny gemacht und Multiqueue aktiviert.

Das Skript zum Domänen umsortieren fertig gestellt und auf’s Ansible angewendet. Bitte derzeit nicht ausrollen, sonst gibt es Chaos.

Update zu Des1: Die Hardwartests laufen trotz Festplatten- und RAM-Tausch immer noch schief. Wir haben den Hoster gebeten, den Server zu ersetzen.

Auf Remue-04 Fehlte das Tunnelendstück zu c1024 daher war Dom06 Offline nachdem wir Des1 vom Netz genommen hatten :see_no_evil:

Hab’s jetzt Manuell eingetragen da es die Ansible Rollen aktuell nicht mehr gibt. Sollten wir vlt. mal wiederherstellen…

1 „Gefällt mir“

Des1 läuft wieder \o/

sowohl ansible-hypervisor als auch ansible-ffms ohne Domänen drüber laufen lassen.

@mpw des1 sollten wir vlt. als erstes ausrollen heute Abend da kea noch bauen muss…

1 „Gefällt mir“

@corny456 und ich haben heute Abend endlich das Gatewayroulette-Projekt verwirklich und die Liste von @jotzt in die Tat umgesetzt.

Handle von @Handle ist dadurch jetzt im Produktivbetrieb und Des1 ist auch wieder dabei, nachdem der Hoster gestern die Kiste getauscht hat.

Wir haben dabei einige Fehler noch im Zuordnungsskript und im Ansible behoben. Falls etwas noch nicht rund läuft, bitte Störungstickets erstellen. Wir haben aber eigentlich kontrolliert, dass der DHCP-Server Kea überall läuft und das Routing sah auch gut aus.

6 „Gefällt mir“

PS: Die ffmsl.net-Domäne ist derzeit leider defekt. Ursache ist unklar.

Es ist wieder Remue-09 Day! \o/ --> Reboot…

1 „Gefällt mir“

Auf Corny, Des1 und Parad0x den Multi Tunneldigger wieder ausgerollt damit die Knoten sich innerhalb einer Domäne besser auf die Gateways verteilen.

Zwecks Stabilität sollten wir Parad0x beobachten und dann entscheiden was wir da weiter machen…

2 „Gefällt mir“
  • @Hoepers hat jetzt einen Wordpress-Account, willkommen im Redaktionsteam
  • Bei der Gelegenheit ehemalige Freifunker stillgelegt oder gelöscht
4 „Gefällt mir“

Nicht extern angebundene VMs hatten Probleme mit dem DNS, also konkret Remü-08 und -09.

Diese haben jetzt eine IP auf dem lo nach dem Schema 10.0.0.vm_Id. DNS-Abfragen, die über gre-* rausgehen, werden auf diese genattet.

Sehr dubioser Weise schickt bind die Abfragen mit der eth0-IP statt mit der lo-IP raus. Vermutlich wird da irgendwie die größte oder kleinste genommen. Bei den Servern mit FF{RL,NW}-Anbindung klappt das, mit der 10.0.0.X nicht. Also haut er die mit der Hoster-IP raus, iptables ändert die Source-IP und dann klappt es auch.

DNS über V6 ist noch irgendwie kaputt.

Hoster-V6 geht auf Remü-08 und -09 auch nicht richtig, aber da habe ich jetzt keine Zeit zu.

@Fungur, hast du eine Idee, wie ich beeinflussen kann, mit welcher IP Bind die Abfrage, die wer für die rekursive Auflösung braucht, beeinflussen kann?

wieder rückgängig gemacht…

FanLin-Blech und -VM mit Sicherheitsupdates (u.a. DSA-3886) versorgt. Der Notwendige Reboot wird am 24.ten gegen 24:00 stattfinden.

3 „Gefällt mir“
  • Gateway Ansible Rollen so angepasst das sie auf Debian 9 laufen.
  • collectd rolle so angeglichen das man sie auch ausrollen kann wenn ein Gateway ohne Domänen vorhanden ist.
  • KEA Version von 1.1.0 auf 1.2.0 angehoben.
  • Ansible auf das neue Gateway tj01 von @Jannis losgelassen.
  • Tunnel zwischen nightbounce und handle entfernt aber noch nicht ausgerollt.
  • remue-08 Domänen auf tj01 verschoben aber noch nicht ausgerollt.
  • Tunnel von allen Hetzner Kisten zu tj01 eingefügt aber noch nicht ausgerollt.
  • Diversen anderen kleinkram…

Ausrollen können wir das erst wenn die Service VM wieder da ist und wir die TTL vom DNS wieder runter gedreht haben. Vlt. sollten wir uns da mal auf einen Wert < 24h einigen.

1 „Gefällt mir“

Mach das ruhig dauerhaft auf 60 Minuten. Nur der wann es vergessen wird Wert sollte hoch sein.

Carbon Dienst auf der Service VM neu gestartet. Stand.

Die FFNW-IP ist bei imap.gmx.net blockiert. Verbindung läuft ins Timeout, keine brauchbare Fehlermeldung.

Tunnel auf Corny deaktiviert.

2 „Gefällt mir“

Bitte bitte bei GMX gemacht, die IP zu entsperren.

3 „Gefällt mir“