Merkwürdiges Verhalten von einzelnen WiFi Mesh Routern


#1

Huhu zusammen,

kann sich das jemand erklären? Die Karte merkt der ist offline, aber vermerkt "Online letzte Nachricht vor 2 Std"
https://karte.freifunk-muensterland.de/map21/#!v:m;n:60e327e72d1c
Dabei sind solche Router in der Regel nicht per mesh, ping und SSH erreichbar, also einfach tot.

Letzte 10 Minuten vielleicht logisch, kann ja mal schlechtes Mesh da sein. Aber der ist sicher tot und bräuchte mal kurz 1 Sek Strom weg. Dann würde der wieder laufen.

Warum ich darauf zu sprechen komme, weil ich’s selbst letztens in Münster hatte.Voraussetzung ist, dass der Knoten nur per Mesh ibss0 angebunden ist. Der auf ihm abhängige Knoten in meinem Fall war dann eigentlich richtig angezeigt - offline und fing sich erst wieder ein, sobald der andere neustartete, der tot war. Der in d3. Kette abhängige sieht eben keinen anderen Meshpartner außer diesen Knoten der sich weghing.

Vielleicht ein Bug im Gluon oder Batman? Oder sowas ähnliches?
Gruß

Manu


#2

Hallo,

ich finde diese Formulierung auch etwas komisch. In diesem Fall scheint es so zu sein, dass das Gerät eingeschaltet ist, denn der Router nebendran sieht ihn (siehe Statusseite von Connys-Koeppken).

Da das Gerät aber nicht erreichbar ist, tippe ich drauf, dass die WAN-Verbindung getrennt ist, also vermutlich das Kabel raus ist. Er meldet sich so sporadisch über die 5%-Meschverbindung, die er noch hat.

Da muss vermutlich mal jemand das Kabel wieder reinstecken und überprüfen ob L2TP aktiviert ist.

Viele Grüße
Matthias


#3

Der Knoten hat sicher die glaube die gleiche Konstellation wie bei mir in Münster nur per Mesh. Der hing sich weg und meldet sich dann nicht mehr. Aber dass der eine den anderen trotzdem noch sieht erklärt natürlich etwas die Konstellation. Nur andersrum ist der nicht mehr in der Lage zu kommunizieren. Aus irgendeinem Grund. Der Pegel ist dafür eigentlich noch viel zu hoch um überhaupt nur einseitig zu funktionieren. Hier habe ich noch weniger Signalstärke und der läuft noch. Nur der 941er hat sich letztens auch so weggehangen.https://karte.freifunk-muensterland.de/map02/#!v:m;n:10feed329750

Und mehr als 100 mW gehen da wohl nicht in die Luft. Sind ja beides Router die man nicht wie z.b die Picostation hochdrehen könnte was dieses einseitige sehen erklären könnte.

Ich schätze mal, dass das irgendwas mit Mesh zu tun haben muss. Da ja Kabel gar nicht vorhanden sind.


#4

das passiert z.b. auch wenn sich das respondd auf dem knoten verabschiedet. die Karte weiß von Knoten A das dieser eine Verbindung zu Knoten B hat. Knoten B meldet sich aber aufgrund von respondd kapod nicht bei der Karte.


#5

Müsste aber in deinem Beispiel trotzdem sonst funktionieren? Der hat nämlich zur Offline Ssid gewechselt und war dann ganz eben ganz tot.


#6

Ein W-Lan Reset hilf am Knoten der das Problem verursacht ist mir bei mehreren Knoten von mir vorgekommen.
Kann bei dem reinen Mesh Knoten als auch bei dem Knoten mit VPN vorkommen.
habe ich mit einem Cronjob gelöst.
*/60 * * * * wifi down ; sleep 1 ; wifi

Gruß Wolfgang


#7

klingt gut, wo steckt die crontab-Datei in openwrt bzw. heißt die anders? An Crontabs und auto-Reboots hatte ich auch schon irgendwie gedacht. Aber wenn das Wifi reicht, dann muss man ja nicht ständig durchstarten lassen.

/etc/crontabs/ ist leer und der Rest sieht nicht nach einer crontab-Datei aus.

Alle jede Stunde finde ich ist nicht nötig, reicht wenn das alle 12 Std etwa ausgeführt wird. Dann käme der falls mal was auftritt jedenfalls nach einer Weile selbst wieder hoch.


#8

Habe ähnliches Verhalten auch schon beobachtet. Zum Teil ging auch folgendes:

  • Wifi bei der Mesh-Gegenstelle neu starten
  • Knoten war noch per SSH über die Link-Lokal-Adresse auf dem mesh0 bzw. bat0-Interface erreichbar

#9

Das trennt aber einmal pro Stunde das WLAN und schmeißt alle Knoten raus.


#10

Deswegen dachte ich ja nach crontab gesehen alle 24h z.b um 6 uhr und 18 uhr. Oder je nachdem nur uhr 6 uhr. Wo liegt denn die crontab Datei um neue anzulegen?


#11

…oder man erstellt dazu mal einen Bugreport im Gluon oder Lede. Das würde die Stabilität dann für alle verbessern :).


#12

Das trennt zwar alle knoten und alle Clients einmal pro Stunde die sich dann eine paar Sekunden später wieder verbinden. Bei reinem Mesh Knoten hat den vorteil das der den Dienst nicht Stundenlang einstellt und man ihn von Extern nicht erreichen kann um das Problem zu lösen.

Gruß Wolfgang


#13

Nochmal zu deiner Lösung: habe das letztens selbst ausgeführt, jetzt nochmal per Cronjob. Das passiert wenn man wifi down; wifi macht: : der Node selbst ist weg, aber von ihm abhängige Knoten tun es wieder oder weiterhin.
In Domäne21 tut das ohne Probleme.
Verweigert er sein mesh-dienst nach paar Tagen, passiert es wieder. Der fliegt um die Ohren und alle mesh abhängigen sind auch weg.

Habe mir allerdings einen Fallback eingebaut, nämlich Cronjob um 21 Uhr “reboot”. So sollte ich auf den Knoten nach 21 Uhr wieder drauf können ohne 50 km fahren und power on off.


#14

Hallo zusammen,
ich hatte mit dem Router ähnliche Probleme, mit dem 841 sowie dem CPE210. Richtig gelöst habe ich das zwar nicht, aber das Symptom gelindert. Und zwar habe ich ein Traffic Limit eingestellt.
Teils konnte man den Router noch anpingen (über das Internet) Teilweise wurde noch die besagte 5% Verbindung gehalten.
Einmal war ich Live dabei wie es passierte, und zwar ging der Load sehr hoch, erst 1,5 nach 5 Minuten auf 2 und teils noch höher. Dabei war der Durchsatz im Download bei 20 Mbit.
Kam dann noch ein weiterer Client hinzu der paar seiten per Notebook oder Tablet abruft, füllte sich der RAM auf 90 % (laut Anzeige) - kurze zeit später war dann Schluss.
Vermutlich wollte er Auslager, aber bei dem kleinem ROM geht da nicht viel (wenn überhaupt). Manchmal kann man den SSH noch erreichen, aber einloggen geht dann meist schon gar nicht mehr und das Teil befindet sich in einer Art Zombie zustand.
Mit den etwas größeren Modellen 1043 tritt dies “fast” gar nicht auf.

Erst dachte ich das liegt an der Hardware Revision, aber von dem 841 habe ich von V9-V11 alle Versionen durchgetestet und auf kurz oder lang hatten die alle die gleiche “Macke”.
Wenn der Traffic Limitiert ist auf 10-15 Mbit sollte das recht Stabil funktionieren.
Grüße
Boris

P.S.: It´s not a bug, it´s a feature :wink:


#15

Das Tempolimit greift nur bei Mesh-VPN per L2TP.
Test mit 500 kbit/s up/down. -> Download mit knapp 500 kbit/s läuft und plötzlich deutlich drüber so 8 mbit/s.
Hat auf Mesh umgeswitcht wo das Limit nicht mehr greift, da der Meshknoten kein Limit hat. Sonst würds beim nächsten Router greifen.
ist das L2TP infolgedessen schlechter, könnte es sein, er wechselt auf Mesh weils da besser läuft.

Meinst du das hilft trotzdem? Bei “wifi” kam der Knoten trotzdem nicht wieder alleine hoch, es sei denn er steckte zu dem Zeitpunkt per Mesh-WAN oder L2TP am Netz und trenne ihn nach dem “wifi” vom Kabelnetz dann funkt das Mesh trotz kurzen Restart des WLans.
Aber nicht, wenn der alleine per WLAN dran hängt und man startet ihn dann neu, da hängt er sich dann weg.


#16

Dafür haben da die V4er das Problem, dass die teilweise ganz abstürzen.

Ich kann deine Erfahrungen aber nicht bestätigen. Die 841er laufen eigentlich super. Sie haben natürlich ihre baulich bedingten Limitierungen, aber ansonsten ist das super Hardware.


#17

Top Hardware auf jeden Fall für den Preis aber dieses komische Mesh Problem tritt auch beim 841er auf, auch wenn sonst kein anderer FF-Router auf den bestimmten Kanal lauscht.

in der Routerseite des funktionierenden Routers ist der Meshrouter noch zu sehen, nur umgekehrt tut der es nicht mehr bis zu nem Reboot. Nur wenn VPN zum Befehl “wifi” dran hängt, switcht der dann um und rennt weiter.

Daher tritt das Problem immer vorzugsweise bei Meshknoten auf.