Admintagebuch - Dokumentation der Admintätigkeiten

Vor 'ner Stunde Forum auf Beta16 gehoben, sorry @fanlin

Ich habe gerade das mit dem Logrotate, was @kgbvax vorgeschlagen hat, implementiert und Testweise auf Parad0x ausgerollt.

@kgbvax, kannst du mal überprüfen, ob das so passt?

Kernel 4.6 Problem: Debian 8.3 hat den 4.5er Kernel drin. Dann sollten wir das jetzt wohl benutzen. Problematisch ist auch, dass wir für alle anderen Systeme mit den Backports jetzt keine Kernelupdates mehr fahren können.

Wir sollten darüber nachdenken, ob wir alle Systeme auf 8.3 ziehen. Ich kenne Debian aber nicht so gut und weiß nicht, wie lange das mit Sicherheitsupdates versorgt wird.

Das war eine Fehlinfo. Debian 8.5 hat ganz normal den 3.16er Kernel drin. Aber Batman 2016 war nicht das Problem. Das läuft mit dem 2015er von den Knoten zusammen.

Problem: Auf Barristan wird scheinbar DNS nicht mehr genattet.

Aufrufer ist heute Nachmittag mal wieder abgeschmiert. Keine Ausgabe oder Kernelpanik zu sehen. Holger hat ihn neu gestartet.

Rhe läuft jetzt mit Kernel 4.6 und Batctl 2016.2. Leider hat er ein paar Probleme bei einem Neustart:

  • Es dauert extrem lange, mehr als vier Minuten
  • Man muss den Tunneldigger nochmal neu startet, da beim ersten Start immer folgendes passiert:

Jul 31 12:06:01 rhe bash[2581]: [WARNING/tunneldigger.broker] Failed to listen on 46.105.252.246:20065, skipping.

Habe den Ausrufer gestern neu gestartet udn einen Call beim Provider aufgemacht.
Die haben den Server dann (nach telef. Rückfrage) im Support-Mode hochgefahren udn einen Systemtest gemacht. Hardware ist angeblich OK. Ich habe sie gefragt, warum ich keine E-Mail oder SMS bekomme, wenn weder Ping noch TTY funktioniert und warte auf Antwort. Seit ca. 19:00 Uhr läuft der Server wieder im Normal Mode.
Bin gerade in Berlin und nur sporadisch online. Daher kommt es zu Verzögerungen.

2 „Gefällt mir“

Gerade auf dem FanLin-Blech u.a. das Sicherheitsupdate DSA-3636 für collectd eingespielt.
@Adminteam bitte das Update auf allen anderen Büchsen einspielen.

2 „Gefällt mir“

Danke. DSS-3636 ist vor allem für die Service VM relevant. Durchaus Handlungsbedarf.

1 „Gefällt mir“

Heute gegen Mittag hat das Backway parad0x entschieden nicht mehr erreichbar zu sein. Simon hat den Zusatnd bemerkt und über Twitter die Anwender informiert.
Auch über die Virtualisierungs-Konsole war nichts zu machen. Nach einem harten Reset um 18:30 läuft wieder alles.
Das Syslog ist ziemlich voll mit DNS-Fehlern (Hauptsächlich durch ungültige Anfragen) . Es erschwert die Suche. Auf die Schnelle konnte ich die Ursache nicht finden. Aus Zeitgründen konnte ich den Fall nicht genauer untersuchen.

1 „Gefällt mir“

Entsprechend wie hier beschrieben: Problem in der Firmware: Knoten schalten nicht um

Auf Parad0x den Tunneldigger wieder auf die FFRL-Version zurückgestellt.

Sollten wir überall tun.

Auf Remü-08 und Ausrufer muss noch wieder der alte Tunneldiggerbroker installiert werden. Falls jemand Zeit hat, einfach /srv/tunneldigger rekursiv löschen und Ansible drüber bügeln. Ich muss jetzt los.

1 „Gefällt mir“

Tunneldigger auf Ausrufer und Remü-08 nun wieder auf die FFRL-Version umgestellt.

Domäne-65 jetzt auf Ausrufer und Rhe. Domäne-65 kann starten.

Gestern und Heute habe ich unser Wiki und alle Erweiterungen auf den aktuellen Stand gebracht.

3 „Gefällt mir“

Forum auf 1.6 aktualisiert.
Discourse branch auf stable gewechselt, dadurch in Zukunft weniger Updates (=Downtime)

3 „Gefällt mir“

Ansible konfiguriert um Domäne 01 und 05 mit L2TP auf Barristan und Rhe zu legen, noch nicht ausgerollt.

Die Domänen 01 und05 sind jetzt als L2TP auf Barristan und Rhe konfiguriert. Es gibt zusätzlich je einen von Hand eingetragenen Querlink link-01 und link-05 rüber zu Remü-01 und Remü-06.

Rhe hat nun ebenfalls die Domänen 7-9 und 11 konfiguriert.

@corny456 wird in Kürze mit dem Testen und Ausrollen der Firmware beginnen.

Greyworm-01 ausgeschaltet, weil ein Großteil der Knoten migriert ist.

Die IP-Bereiche der Domänen 01 und 05 sind jetzt angepasst. Greyworm-01 ist ausgeschaltet und parad0x-01 ist eh abgestürzt, wird aber auch nicht mehr benötigt.

Das gröbste sollt überstanden sein. @corny456 kümmert sich heute Abend noch um das Einspielen der Firmware mit manipulierten Manifesten für die Domänen 7-11, dann kann auch Greyworm-06 abgeschaltet werden.

Die Gateways gw01 und gw02 von Freifunk Bergstraße für Port 2003 auf Service-VM blockiert. Da diese unsere Statistiken kaputt gemacht haben.

3 Beiträge wurden in ein neues Thema verschoben: Firmwaretagebuch