Admintagebuch - Dokumentation der Admintätigkeiten

Mehrere Gateways neu gestartet um das Problem mit der spray-and-pray Methode zu beheben, welches @corny456 dann hier behoben hat:

dabei py-respondd auf corny manuell nach gestartet, weil es von selbst nicht wollte.

3 „Gefällt mir“

Irgendeine Nase hat ifupdown2 auf Deshyper-01 installiert. Bitte darauf achten, das nicht zu tun. Ifupdown2 kommt mit unserer komplexen Netzwerkarchitektur nicht zu recht, daher war der Server offline.

Habe aus dem Rescue-System per chroot ifupdown(1) wieder eingespielt. Jetzt läuft Deshyper-01 wieder.

4 „Gefällt mir“

Statistics VM auf Deshyper-01 wieder gestartet.

Hypercorn hat eine neue Festplatte bekommen und macht grad den resync des RAID’s. Hypercorn und somit Gateway Corny ist dank der Hilfe von @MPW seit gestern wieder online. Irgendwann musst du mir nochmal erklären was genau du da gemacht hast :slight_smile:

Somit sollte alles bis auf Corny2 wieder rennen. Die Corny2 VM ist durch #hetznerdown in den Schredder geplumpst und wird in den nächsten Tagen ersetzt.

1 „Gefällt mir“

Einfach mit der Lara aus Grub Rescue gestartet und die Bootreihenfolge der Platten im Bios getauscht.

Corny2 wieder neu aufzusetzen wäre doch mal ein super Job für @wurmi und @fll.

3 „Gefällt mir“

Klar. Ich bereite nächste Tage die VM vor dann können die zwei loslegen.

3 „Gefällt mir“

Beim Fläschen der AC-Lite für den Hawerkamp haben wir die bootselect-Partition nicht gelöscht. Leider kann man das in unserer Firmware nicht nachträglich nachholen.

root@HAW-Gluon-Sd:~# cat /proc/mtd | grep bs
mtd7: 00020000 00010000 "bs"
root@HAW-Gluon-Sd:~# dd if=/dev/zero bs=1 count=1 of=/dev/mtd7
dd: can't open '/dev/mtd7': Permission denied

Details: https://forum.freifunk.net/t/unifi-ac-mesh-pro/13863/100?u=mpw

Wie es richtig geht: https://wiki.darmstadt.freifunk.net/Unifi_AC#5_Bootselect_schreiben

Ich habe daher erstmal den Autoupdater auf den drei Geräten hier deaktiviert:

HAW-Gluon-Süd
HAW-Gluon-Nord
Tankstelle-Nottuln-2

@fll @wurmi: Davon sind ebenfalls die AC-Lite betroffen, die wir in Hiltrup und Amelsbüren aufgebaut haben.

Es gibt schon 69 AC-Lite bei uns im Netz \o/ und noch einige AC-Mesh.

Da müssen wir auf jeden Fall die Leute kontaktieren, bevor wir die Firmware ausrollen. Die Wahrscheinlichkeit für einen Softbrick liegt wohl so bei 50%.

Entweder das riskieren und die dann im neueren Gluon entsperrte Partition löschen. Dabei muss man zu 50% per tftp an die Geräte ran. Oder von vorne herein einmal zurück auf die Originalfirmware fläschen.

Für Hiltrup und Amelsbüren könnten wir evtl. per SSH zurück auf die Originalfirmware, dann richtig fläschen und per Portweiterleitung neu konfigurieren. Das ist vermutlich unter dem Strich besser als nachher hinzufahren, denn ein Gerät pro Standort würde es sonst vermutlich sicherlich erwischen.

2 „Gefällt mir“

corny2 neu augerollt, DHCP-Reservierung for Streamrechner in der Warpzone auf des2 und corny2 ausgerollt und DNSmaster auf alle gateways ausgerollt.

3 „Gefällt mir“

Das wäre nicht gut… Haste aber auch nicht :wink:
Wir haben DNS auf alle Gateways ausgerollt um streamboxen.ffms zu aktivieren und den DNS Master haben wir ausgerollt um streambox.$TLD an den Start zu bringen :slight_smile:

Klugscheißmodus aus.
Gute Nacht. :slight_smile:

2 „Gefällt mir“

ah lol, jo danke! :smiley:

2 „Gefällt mir“

Danke euch für die Arbeit, geile Sache!

2 „Gefällt mir“

Tiles Cache auf der Karten VM gelöscht weil der irgendwie fehlerhafte Daten gecached hatte und Teile der Karte nicht angezeigt wurden.

Wenn das nochmal auftreten sollte, das hier hat geholfen:

systemctl stop nginx
rm -r /opt/tiles_cache/osm
rm -r /opt/tiles_cache/nrw
systemctl start nginx
6 „Gefällt mir“


Dafür habe ich die Mapserver Config Templates erweitert:

Dadurch scrollt die Karte nicht mehr automatisch runter wenn man die Nodedetails aufruft.
Entschleunigt leider das laden der Karte ein wenig da die JPGs auf dem Statistik Server on the Fly gerendert werden müssen.

3 „Gefällt mir“

@wurmi s Account zum Moderator befördert, er ist Adminteammitglied und möchte Löschanfragen aus dem Ticketsystem bearbeiten.

2 „Gefällt mir“

User im Forum, auf seine Anfrage hin, gelöscht.
https://ticket.freifunk-muensterland.de/scp/tickets.php?id=5959

Um den Grundstein für ein Mumble-Bot zu legen hab ich einen neuen Mumble-Server auf Linux Basis aufgesetzt und dafür eine Ansible Rolle gebaut. Sobald der DNS Cache abgelaufen ist sollte er erreichbar sein.


3 „Gefällt mir“

OS Updates auf Folgenden Maschinen gemacht und wenn nötig gebootet:

  • mastodon
  • forum
  • wiki
  • firmware
  • mumble
  • ansible
  • mail
  • streamer
  • karte
  • stats
  • graphite-node-01
  • webserver
  • ticket
  • dnsmaster
4 „Gefällt mir“

Aber man kann lesend drauf zugreifen:

opkg update
opkg install xxd
head -c 1 /dev/mtd7 | xxd

Beispiel:

root@Tankstelle-Nottuln-2:~# head -c 1 /dev/mtd7 | xxd
0000000: 00                                       .

Habe den Autoupdater auf den drei Geräten wieder eingeschaltet, die sehen in Ordnung aus.

@wurmi, wir müssen das dann auch in Hiltrup und Amelsbüren testen.

2 „Gefällt mir“

HAW-Gluon-Ost war offline, über den PoE-Switch neu gestartet.

Wie genau? hatte die mehrfach neu gestartet die kam aber nicht wieder, einzig der Stromverbrauch wurde im switch angezeigt.

Man könnte das auch vor Ort machen, wenn die Zugangsdaten des ISP vorliegen, und damit zeitgleich nach dem anderen Problem suchen.

2 „Gefällt mir“

Einmal für zehn Sekunden aus.