Admintagebuch - Dokumentation der Admintätigkeiten


#1287

Mehrere Tunneldigger Instanzen auf Automatix neu gestartet.


#1288

Mehrere Gateways neu gestartet um das Problem mit der spray-and-pray Methode zu beheben, welches @corny456 dann hier behoben hat:

dabei py-respondd auf corny manuell nach gestartet, weil es von selbst nicht wollte.


#1289

Irgendeine Nase hat ifupdown2 auf Deshyper-01 installiert. Bitte darauf achten, das nicht zu tun. Ifupdown2 kommt mit unserer komplexen Netzwerkarchitektur nicht zu recht, daher war der Server offline.

Habe aus dem Rescue-System per chroot ifupdown(1) wieder eingespielt. Jetzt läuft Deshyper-01 wieder.


#1290

Statistics VM auf Deshyper-01 wieder gestartet.

Hypercorn hat eine neue Festplatte bekommen und macht grad den resync des RAID’s. Hypercorn und somit Gateway Corny ist dank der Hilfe von @MPW seit gestern wieder online. Irgendwann musst du mir nochmal erklären was genau du da gemacht hast :slight_smile:

Somit sollte alles bis auf Corny2 wieder rennen. Die Corny2 VM ist durch #hetznerdown in den Schredder geplumpst und wird in den nächsten Tagen ersetzt.


#1291

Einfach mit der Lara aus Grub Rescue gestartet und die Bootreihenfolge der Platten im Bios getauscht.

Corny2 wieder neu aufzusetzen wäre doch mal ein super Job für @wurmi und @fll.


#1292

Klar. Ich bereite nächste Tage die VM vor dann können die zwei loslegen.


#1293

Beim Fläschen der AC-Lite für den Hawerkamp haben wir die bootselect-Partition nicht gelöscht. Leider kann man das in unserer Firmware nicht nachträglich nachholen.

root@HAW-Gluon-Sd:~# cat /proc/mtd | grep bs
mtd7: 00020000 00010000 "bs"
root@HAW-Gluon-Sd:~# dd if=/dev/zero bs=1 count=1 of=/dev/mtd7
dd: can't open '/dev/mtd7': Permission denied

Details: https://forum.freifunk.net/t/unifi-ac-mesh-pro/13863/100?u=mpw

Wie es richtig geht: https://wiki.darmstadt.freifunk.net/Unifi_AC#5_Bootselect_schreiben

Ich habe daher erstmal den Autoupdater auf den drei Geräten hier deaktiviert:

HAW-Gluon-Süd
HAW-Gluon-Nord
Tankstelle-Nottuln-2

@fll @wurmi: Davon sind ebenfalls die AC-Lite betroffen, die wir in Hiltrup und Amelsbüren aufgebaut haben.

Es gibt schon 69 AC-Lite bei uns im Netz \o/ und noch einige AC-Mesh.

Da müssen wir auf jeden Fall die Leute kontaktieren, bevor wir die Firmware ausrollen. Die Wahrscheinlichkeit für einen Softbrick liegt wohl so bei 50%.

Entweder das riskieren und die dann im neueren Gluon entsperrte Partition löschen. Dabei muss man zu 50% per tftp an die Geräte ran. Oder von vorne herein einmal zurück auf die Originalfirmware fläschen.

Für Hiltrup und Amelsbüren könnten wir evtl. per SSH zurück auf die Originalfirmware, dann richtig fläschen und per Portweiterleitung neu konfigurieren. Das ist vermutlich unter dem Strich besser als nachher hinzufahren, denn ein Gerät pro Standort würde es sonst vermutlich sicherlich erwischen.


Tagesordnung 06.06.2018
#1294

corny2 neu augerollt, DHCP-Reservierung for Streamrechner in der Warpzone auf des2 und corny2 ausgerollt und DNSmaster auf alle gateways ausgerollt.


#1295

Das wäre nicht gut… Haste aber auch nicht :wink:
Wir haben DNS auf alle Gateways ausgerollt um streamboxen.ffms zu aktivieren und den DNS Master haben wir ausgerollt um streambox.$TLD an den Start zu bringen :slight_smile:

Klugscheißmodus aus.
Gute Nacht. :slight_smile:


#1296

ah lol, jo danke! :smiley:


#1297

Danke euch für die Arbeit, geile Sache!


#1298

Tiles Cache auf der Karten VM gelöscht weil der irgendwie fehlerhafte Daten gecached hatte und Teile der Karte nicht angezeigt wurden.

Wenn das nochmal auftreten sollte, das hier hat geholfen:

systemctl stop nginx
rm -r /opt/tiles_cache/osm
rm -r /opt/tiles_cache/nrw
systemctl start nginx

Tiles-Ausfälle auf Mapserver
#1299


Dafür habe ich die Mapserver Config Templates erweitert:

Dadurch scrollt die Karte nicht mehr automatisch runter wenn man die Nodedetails aufruft.
Entschleunigt leider das laden der Karte ein wenig da die JPGs auf dem Statistik Server on the Fly gerendert werden müssen.


#1300

@wurmi s Account zum Moderator befördert, er ist Adminteammitglied und möchte Löschanfragen aus dem Ticketsystem bearbeiten.


#1301

User im Forum, auf seine Anfrage hin, gelöscht.
https://ticket.freifunk-muensterland.de/scp/tickets.php?id=5959


#1302

Um den Grundstein für ein Mumble-Bot zu legen hab ich einen neuen Mumble-Server auf Linux Basis aufgesetzt und dafür eine Ansible Rolle gebaut. Sobald der DNS Cache abgelaufen ist sollte er erreichbar sein.



#1303

OS Updates auf Folgenden Maschinen gemacht und wenn nötig gebootet:

  • mastodon
  • forum
  • wiki
  • firmware
  • mumble
  • ansible
  • mail
  • streamer
  • karte
  • stats
  • graphite-node-01
  • webserver
  • ticket
  • dnsmaster

#1304

Aber man kann lesend drauf zugreifen:

opkg update
opkg install xxd
head -c 1 /dev/mtd7 | xxd

Beispiel:

root@Tankstelle-Nottuln-2:~# head -c 1 /dev/mtd7 | xxd
0000000: 00                                       .

Habe den Autoupdater auf den drei Geräten wieder eingeschaltet, die sehen in Ordnung aus.

@wurmi, wir müssen das dann auch in Hiltrup und Amelsbüren testen.


Drohender Softbrick: Ubiquiti Unifi-AC-Lite
#1305

HAW-Gluon-Ost war offline, über den PoE-Switch neu gestartet.


#1306

Wie genau? hatte die mehrfach neu gestartet die kam aber nicht wieder, einzig der Stromverbrauch wurde im switch angezeigt.

Man könnte das auch vor Ort machen, wenn die Zugangsdaten des ISP vorliegen, und damit zeitgleich nach dem anderen Problem suchen.