841 verlieren Mesh-Verbindung


#1

Hallo,
wir haben in Domäne 07 bei reinen WiFi-mesh-Verbindungen immer wieder das Problem, dass diese abbrechen und nicht automatisch wieder kommen. Immer wieder Probleme machen beispielsweise (aktuell) ff_Telgte_ks4/_ks2, ff_westb_PWS/_ILE5_I, oder ff_westb_ZurBever_I/_II. Gemeinsamkeit ist, dass die wegfallenden Router allesamt die Brot-und-Butter 841er sind. Oftmals hilft ein Reboot des Uplink um den Meshaufbau neu anzuregen, manchmal muss der distant end Router aber auch stromlos gemacht werden, bevor es weitergeht. Vermutungen deuten auf zu viele Störungen auf Kanal 1 hin und ein Wechsel auf andere Kanäle hat Linderung verschafft. Ist aber auch nicht dauerhaft und eigentlich nicht Sinn der Sache.


#2

Habe in Münster auch das Problem mit einem Mesh Knoten der auf andere abhäbgig ist. Dieser reine Meshknoten verabschiedet sich und ein weiterer einzig auf diesen abhängiger Knoten ist damit dann auch tot. So “halb gelöst” habe ich das mit einem Crontab der an 4 Tagen in der Woche um 21 Uhr einen Reboot auslöst… einfaches Neustarten des Wifi/Mesh hilft nicht. Dadzrch funktioniert dann immerhin der auf diesem Knoten abhängige.


#3

… ist denn häufiger Reboot eine gute Lösung?
Es wurde mal gemunkelt, das die Speicherbausteine das nicht ewig mitmachen.

… und Crontab wird doch auch bei einem FW-Update überschrieben?
Einigen Maschinen im Bereich Telgte steuere ich aus anderen Gründen per zeitgesteuertem SSH-Script von meinem Server aus. Das wäre auch für Reboot denkbar (zurück zu Problem 1)


#4

Ja, das stimmt, das kannst Du aber verhindern:
echo /etc/crontabs/root >> /etc/sysupgrade.conf
Damit wird z.B. die /etc/crontabs/root bei Updates stehen gelassen.


#5

Habe die Crontab (einzelne Datei) jedoch in dem Ordner abgelegt, wo u.a auch das Script für den SSID Changer liegt. Hab das Verzeichnis gerade nicht parat. Darüber restartet er dann alle 2 Tage. Im Endeffekt nur wie an/aus bisher macht der sonst kaum Probleme. Sprich nicht über crontab -e angelegt. Aber bisher werden ja kaum stable FW ausgerollt. Daher kann ich dazu nichts sagen… @PeterB klingt nützlich.


#6

OK, das hört sich zumindest nach einem gangbaren WorkArround an.
… ich warte bis am Ende des threads eine Lösung hängt (Wurzel des Übels … etc.).


#7

Vielleicht ein Crontab der nur die WLAN-Interfaces für kurze Zeit ausschaltet?


#8

Hab ich ja versucht. Das Ergebnis war dann, dass Mesh weiter funktioniert. Ssh ist dann tot sowie das Clientnetz.

So war der 3. Node auf diesen Node abhängige Router wieder online nur der selbst Betroffene nicht. An VPN Routern trat das nicht auf.


#9

Das habe ich noch nicht gehört. Bei einem Systemstart wird doch nur gelesen.

@holger, läuft da noch 2016ener oder schon 2017ener Firmware drauf? Wie ist die Auslastung der Geräte?

Viele Communities arbeiten inzwischen mit Skripten die mehr oder weniger stumpf die Geräte nachts neu startet.


#10

Alle komplett auf 2016
Die Auslastung schwankt stark (1 - 60 User)
Dann muss ich mir mal anlesen, wie man einen Cron-Job erstellt und den dann auf alle ausrollen.


#11

Das meinte ich zwar nicht, sondern die Linux-Auslastung des Gerätes, weil das unter 2017 oft ein Problem ist.

Aber nunja 60 direkt verbundene Geräte auf einem 841er, da geht halt nichts mehr. Ich würde das Clientnetz abschalten und über Kabel professionellere APs verbinden. Das kann nicht funktionieren.

Dann kümmern sich die Freifunk-Geräte auf Kanal 1 ums Mesch und die Endgeräte können sich auf anderen Kanälen mit anderen APs verbinden.


#12

bei meinem Router hatte ich die crontab’s dort abgelegt: (ohne Dateiendung)
/usr/lib/micron.d/
der Inhalt der Datei war schlicht und einfach:

cat reboot22h

0 21 * * 0,2,4,6 reboot
Sonntag, Dienstag, Donnerstag und Samstag reboot um 22 Uhr.

Dort findest du auch den crontab, der dann so oft wie möglich (jede Minute) das SSID-Script für die Offline-SSID ausführt und könntest nun den SSID-Changer weg kicken.

Ansonsten hier ist die Syntax nochmal genauer aufgeführt.
https://wiki.ubuntuusers.de/Cron/


#13

Also auf meiner 841er hab ich 2017 drauf und es ist bereits ein crontab eintrag drin:
0 4 * * * reboot

scheint als währe das problem bereits bekannt.


#14

in einer FFMS Firmware? Wäre mir nicht bekannt, meine 841er haben auch kein Auto-Reboot drin, außer bei den händisch eingefügten 940er. Da ich nicht jeden Tag neustarten lassen wollte, hatte ich das einfach auf bestimmte Wochentage beschränkt.


#15

Ok, kann mich auch irren und hab vergessen das ich das selber angelegt habe.


#16

So, ich habe das rebot um 4h auf allen 841 und 1043 in unserer Komune verteilt. Bin gespannt.


#17

Die beste Lösung ist es nachwievor nicht. Aber wenn sich einer weg hängt, rettet er sich um diese Zeit aus seiner verlorenen Verbindung…

Habe meinen betroffenen Node schonmal neustarten müssen als es Tag war und die 2 Tage noch nicht rum waren.


#18

Offensichtlich ist ein reboot oder “/etc/init.d/micrond reload” erforderlich, damit es zieht.

[UPDATE]
Gestern “/etc/init.d/micrond reload” auf allen Nodes abgesetzt. Jetzt haben alle wie geplant gebootet.