Admintagebuch - Dokumentation der Admintätigkeiten

Forum auf 1.6.0.beta10 aktualisiert.

3 „Gefällt mir“

Auf Des2 waren nur noch acht Knoten, die sich irgendwie weigern, die Firmware zu aktualisieren. Obwohl ich sie pingen kann, fragen sie nie beim Firmwareserver an.

Ich habe gerade mal Anhand eines Knotens verifiziert, dass er sich auf mit Parad0x verbindet, wenn ich den Port der betreffenden Domäne auf Des2 sperre. Das war erfolgreich und dann hab ich poweroff getippt.

@descilla: Die IP von Des2 kann dann weg.

Grüße
Matthias

Unter ffhost01.yadn.de:224 oder 2a01:4f8:191:21e1::12 hab ich gerade für @wurmi eine VM konfiguriert, auf die Icinga kommt.

Der Server für Domäne 14 bei uns in der Firma ist heute abgebaut worden.

Jul 14 15:20:45 ausrufer named[3972]: client 10.48.168.11#27204: view domaene-53: received notify for zone 'knoten.freifunk-muensterland.de': not authoritative
Jul 14 15:20:45 ausrufer dhcpd: DHCPOFFER on 10.48.168.48 to [Mac entfernt] (Marens-iPhone) via bat53
Jul 14 15:20:46 ausrufer dhcpd: DHCPREQUEST for 10.48.168.48 (10.48.168.3) from [Mac entfernt] (Marens-iPhone) via bat53
Jul 14 15:20:46 ausrufer dhcpd: DHCPACK on 10.48.168.48 to [Mac entfernt] (Marens-iPhone) via bat53
Jul 14 15:20:49 ausrufer dhcpd: DHCPREQUEST for 10.48.164.116 from [Mac entfernt] via bat52: unknown lease 10.48.164.116.
Jul 14 15:20:50 ausrufer dhcpd: DHCPREQUEST for 10.48.164.116 from [Mac entfernt] via bat52: unknown lease 10.48.164.116.
^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@
Jul 14 17:00:38 ausrufer rsyslogd: [origin software="rsyslogd" swVersion="8.4.2" x-pid="4007" x-info="http://www.rsyslog.com"] start
Jul 14 17:00:38 ausrufer kernel: [    0.000000] Linux version 4.5.0-0.bpo.2-amd64 (debian-kernel@lists.debian.org) (gcc version 4.9.2 (Debian 4.9.2-10) ) #1 SMP Debian 4.5.4-1~bpo8+1 (2016-05-13)

Ausrufer ist heute wieder stehen geblieben. Obiges Schnipsel ist aus dem Syslog. Als ich sowas mal bei mir hatte, war es ein defekter Rambaustein. Kann aber auch was ganz anderes sein. Jemand eine Idee, was wir tun sollten?

@Fungur

2 Beiträge wurden in ein neues Thema verschoben: Problemdiagnostik Ausrufer

Kann man auf die Konsole des Rechners zugreifen? Vielleicht sieht man beim Absturz Meldungen, wenn man syslog so konfiguriert, dass die Meldungen auf die Konsole ausgibt.

Forum aktualisiert auf 1.6.0.beta11

Bird6 auf Remü-02 und Greyworm-03 neu gestartet, weil alle Knoten in der Domäne keine IPV6 mehr hatten. Läuft wieder.

Ergänzung: Greyworm-03 hat immer noch rumgezickt, hab die Kiste mal rebootet, weil sie irgendwie IPV6-Pakete gefressen hat.

Des1 neu gestartet, der hatte sich komplett weggehanden. In der Konsole war kein Fehler zu sehen, ich konnte mich aber auch nicht mehr einloggen und es gab auch keinen Ping mehr zurück.

Bird6 hatte auf der Kiste irgendwie alle statischen Routen doppelt, also in der Konfigurationsdatei. Die habe ich gerade per Hand gelöscht, damit es wieder läuft. Müssen wir uns aber angucken, @descilla, @Fungur

Habe gerade u.a. das openSSH-Sicherheitsupdate DSA-3626 auf dem FanLin-Blech installiert.
@Adminteam alle anderen Bleche überprüfen, ob das Update benötigt wird.

1 „Gefällt mir“

Im laufe des Abends (~ 8 Uhr) wurde das Blech Parad0x mit Updates versorgt und neu gestartet.
Alle VMs sind wieder up und die Anzahl der Connections steigt.

P.S.: Das Blech liegt recht stabil im Schnitt bei >800 GB / Tag ausgehendem Traffic

@Fungur hat gestern die DHCP-Bereiche in Domäne-01 überarbeitet, weil einer der Server keine Leases mehr hatte. Vermutlich hat man deswegen so oft keine IP in Domäne-01 bekommen.

Ansible:

  • Tunneldigger wieder auf die FFRL-Version zurückgesetzt und den Merge des Zweiges über den ich das aktualisiert hatte, rückgängig gemacht. Bei WLAN-Slovenia scheint niemand den CPU-Load-Bug zu beheben und die FFRL-Version läuft auch gut, also warum nicht die nehmen. Ich plane das Stück für Stück wieder auf die Gateways auszurollen. Leider passiert das nicht automatisch, man muss die andere Version, bzw. das andere Git vorher löschen.
  • Strukturänderung im Ansible: Die Rollen sind jetzt in einem separaten Repo, dass über submodules eingebunden wird. Ich habe es extra so gemacht, dass der Commit-Verlauf erhalten bleibt. Ich nutze submodules gerade selbst das erste mal, daher habe ich noch keine Anleitung dafür im Kopf, aber auf der Ansible-VM ist es korrekt initialisiert. Ggfs. findet man aber schnell die benötigten Befehle über Google.

Aufpassen bei Kernelupgrades: Kernel 4.6 enthält Batman 2016 und man kann Batman 2015 nicht gegen den Kernel 4.6 kompilieren.

Ich hab noch nicht rausgefunden, wie man Kernel 4.5 wieder installiert, wenn er nicht mehr in den backports auftaucht.

Vor 'ner Stunde Forum auf Beta16 gehoben, sorry @fanlin

Ich habe gerade das mit dem Logrotate, was @kgbvax vorgeschlagen hat, implementiert und Testweise auf Parad0x ausgerollt.

@kgbvax, kannst du mal überprüfen, ob das so passt?

Kernel 4.6 Problem: Debian 8.3 hat den 4.5er Kernel drin. Dann sollten wir das jetzt wohl benutzen. Problematisch ist auch, dass wir für alle anderen Systeme mit den Backports jetzt keine Kernelupdates mehr fahren können.

Wir sollten darüber nachdenken, ob wir alle Systeme auf 8.3 ziehen. Ich kenne Debian aber nicht so gut und weiß nicht, wie lange das mit Sicherheitsupdates versorgt wird.

Das war eine Fehlinfo. Debian 8.5 hat ganz normal den 3.16er Kernel drin. Aber Batman 2016 war nicht das Problem. Das läuft mit dem 2015er von den Knoten zusammen.

Problem: Auf Barristan wird scheinbar DNS nicht mehr genattet.

Aufrufer ist heute Nachmittag mal wieder abgeschmiert. Keine Ausgabe oder Kernelpanik zu sehen. Holger hat ihn neu gestartet.

Rhe läuft jetzt mit Kernel 4.6 und Batctl 2016.2. Leider hat er ein paar Probleme bei einem Neustart:

  • Es dauert extrem lange, mehr als vier Minuten
  • Man muss den Tunneldigger nochmal neu startet, da beim ersten Start immer folgendes passiert:

Jul 31 12:06:01 rhe bash[2581]: [WARNING/tunneldigger.broker] Failed to listen on 46.105.252.246:20065, skipping.