Admintagebuch - Dokumentation der Admintätigkeiten

Jul 14 15:20:45 ausrufer named[3972]: client 10.48.168.11#27204: view domaene-53: received notify for zone 'knoten.freifunk-muensterland.de': not authoritative
Jul 14 15:20:45 ausrufer dhcpd: DHCPOFFER on 10.48.168.48 to [Mac entfernt] (Marens-iPhone) via bat53
Jul 14 15:20:46 ausrufer dhcpd: DHCPREQUEST for 10.48.168.48 (10.48.168.3) from [Mac entfernt] (Marens-iPhone) via bat53
Jul 14 15:20:46 ausrufer dhcpd: DHCPACK on 10.48.168.48 to [Mac entfernt] (Marens-iPhone) via bat53
Jul 14 15:20:49 ausrufer dhcpd: DHCPREQUEST for 10.48.164.116 from [Mac entfernt] via bat52: unknown lease 10.48.164.116.
Jul 14 15:20:50 ausrufer dhcpd: DHCPREQUEST for 10.48.164.116 from [Mac entfernt] via bat52: unknown lease 10.48.164.116.
^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@
Jul 14 17:00:38 ausrufer rsyslogd: [origin software="rsyslogd" swVersion="8.4.2" x-pid="4007" x-info="http://www.rsyslog.com"] start
Jul 14 17:00:38 ausrufer kernel: [    0.000000] Linux version 4.5.0-0.bpo.2-amd64 (debian-kernel@lists.debian.org) (gcc version 4.9.2 (Debian 4.9.2-10) ) #1 SMP Debian 4.5.4-1~bpo8+1 (2016-05-13)

Ausrufer ist heute wieder stehen geblieben. Obiges Schnipsel ist aus dem Syslog. Als ich sowas mal bei mir hatte, war es ein defekter Rambaustein. Kann aber auch was ganz anderes sein. Jemand eine Idee, was wir tun sollten?

@Fungur

2 Beiträge wurden in ein neues Thema verschoben: Problemdiagnostik Ausrufer

Kann man auf die Konsole des Rechners zugreifen? Vielleicht sieht man beim Absturz Meldungen, wenn man syslog so konfiguriert, dass die Meldungen auf die Konsole ausgibt.

Forum aktualisiert auf 1.6.0.beta11

Bird6 auf Remü-02 und Greyworm-03 neu gestartet, weil alle Knoten in der Domäne keine IPV6 mehr hatten. Läuft wieder.

Ergänzung: Greyworm-03 hat immer noch rumgezickt, hab die Kiste mal rebootet, weil sie irgendwie IPV6-Pakete gefressen hat.

Des1 neu gestartet, der hatte sich komplett weggehanden. In der Konsole war kein Fehler zu sehen, ich konnte mich aber auch nicht mehr einloggen und es gab auch keinen Ping mehr zurück.

Bird6 hatte auf der Kiste irgendwie alle statischen Routen doppelt, also in der Konfigurationsdatei. Die habe ich gerade per Hand gelöscht, damit es wieder läuft. Müssen wir uns aber angucken, @descilla, @Fungur

Habe gerade u.a. das openSSH-Sicherheitsupdate DSA-3626 auf dem FanLin-Blech installiert.
@Adminteam alle anderen Bleche überprüfen, ob das Update benötigt wird.

1 „Gefällt mir“

Im laufe des Abends (~ 8 Uhr) wurde das Blech Parad0x mit Updates versorgt und neu gestartet.
Alle VMs sind wieder up und die Anzahl der Connections steigt.

P.S.: Das Blech liegt recht stabil im Schnitt bei >800 GB / Tag ausgehendem Traffic

@Fungur hat gestern die DHCP-Bereiche in Domäne-01 überarbeitet, weil einer der Server keine Leases mehr hatte. Vermutlich hat man deswegen so oft keine IP in Domäne-01 bekommen.

Ansible:

  • Tunneldigger wieder auf die FFRL-Version zurückgesetzt und den Merge des Zweiges über den ich das aktualisiert hatte, rückgängig gemacht. Bei WLAN-Slovenia scheint niemand den CPU-Load-Bug zu beheben und die FFRL-Version läuft auch gut, also warum nicht die nehmen. Ich plane das Stück für Stück wieder auf die Gateways auszurollen. Leider passiert das nicht automatisch, man muss die andere Version, bzw. das andere Git vorher löschen.
  • Strukturänderung im Ansible: Die Rollen sind jetzt in einem separaten Repo, dass über submodules eingebunden wird. Ich habe es extra so gemacht, dass der Commit-Verlauf erhalten bleibt. Ich nutze submodules gerade selbst das erste mal, daher habe ich noch keine Anleitung dafür im Kopf, aber auf der Ansible-VM ist es korrekt initialisiert. Ggfs. findet man aber schnell die benötigten Befehle über Google.

Aufpassen bei Kernelupgrades: Kernel 4.6 enthält Batman 2016 und man kann Batman 2015 nicht gegen den Kernel 4.6 kompilieren.

Ich hab noch nicht rausgefunden, wie man Kernel 4.5 wieder installiert, wenn er nicht mehr in den backports auftaucht.

Vor 'ner Stunde Forum auf Beta16 gehoben, sorry @fanlin

Ich habe gerade das mit dem Logrotate, was @kgbvax vorgeschlagen hat, implementiert und Testweise auf Parad0x ausgerollt.

@kgbvax, kannst du mal überprüfen, ob das so passt?

Kernel 4.6 Problem: Debian 8.3 hat den 4.5er Kernel drin. Dann sollten wir das jetzt wohl benutzen. Problematisch ist auch, dass wir für alle anderen Systeme mit den Backports jetzt keine Kernelupdates mehr fahren können.

Wir sollten darüber nachdenken, ob wir alle Systeme auf 8.3 ziehen. Ich kenne Debian aber nicht so gut und weiß nicht, wie lange das mit Sicherheitsupdates versorgt wird.

Das war eine Fehlinfo. Debian 8.5 hat ganz normal den 3.16er Kernel drin. Aber Batman 2016 war nicht das Problem. Das läuft mit dem 2015er von den Knoten zusammen.

Problem: Auf Barristan wird scheinbar DNS nicht mehr genattet.

Aufrufer ist heute Nachmittag mal wieder abgeschmiert. Keine Ausgabe oder Kernelpanik zu sehen. Holger hat ihn neu gestartet.

Rhe läuft jetzt mit Kernel 4.6 und Batctl 2016.2. Leider hat er ein paar Probleme bei einem Neustart:

  • Es dauert extrem lange, mehr als vier Minuten
  • Man muss den Tunneldigger nochmal neu startet, da beim ersten Start immer folgendes passiert:

Jul 31 12:06:01 rhe bash[2581]: [WARNING/tunneldigger.broker] Failed to listen on 46.105.252.246:20065, skipping.

Habe den Ausrufer gestern neu gestartet udn einen Call beim Provider aufgemacht.
Die haben den Server dann (nach telef. Rückfrage) im Support-Mode hochgefahren udn einen Systemtest gemacht. Hardware ist angeblich OK. Ich habe sie gefragt, warum ich keine E-Mail oder SMS bekomme, wenn weder Ping noch TTY funktioniert und warte auf Antwort. Seit ca. 19:00 Uhr läuft der Server wieder im Normal Mode.
Bin gerade in Berlin und nur sporadisch online. Daher kommt es zu Verzögerungen.

2 „Gefällt mir“

Gerade auf dem FanLin-Blech u.a. das Sicherheitsupdate DSA-3636 für collectd eingespielt.
@Adminteam bitte das Update auf allen anderen Büchsen einspielen.

2 „Gefällt mir“

Danke. DSS-3636 ist vor allem für die Service VM relevant. Durchaus Handlungsbedarf.

1 „Gefällt mir“

Heute gegen Mittag hat das Backway parad0x entschieden nicht mehr erreichbar zu sein. Simon hat den Zusatnd bemerkt und über Twitter die Anwender informiert.
Auch über die Virtualisierungs-Konsole war nichts zu machen. Nach einem harten Reset um 18:30 läuft wieder alles.
Das Syslog ist ziemlich voll mit DNS-Fehlern (Hauptsächlich durch ungültige Anfragen) . Es erschwert die Suche. Auf die Schnelle konnte ich die Ursache nicht finden. Aus Zeitgründen konnte ich den Fall nicht genauer untersuchen.

1 „Gefällt mir“