[Berlin-wireless] olsrd crash

Horst Krause offlinehorst
Di Okt 31 23:24:14 CET 2006


bin etwas delayed und mein beitrag ist wie immer etwas oversized,
ich seh, ihr werkelt schon dran, aber ich will auch klugscheissern...
ich befürchtete schon, dass nach einem jahr netz-abstinenz sich nix
zum guten geändert hätte, aber ich sehe, jetzt kann ich mich auf
viel höherem level wundern....

jau, soweit ich von hier aus (4hops entfernt) zukucken kann, 
zuckte 104.131.131.1 nur noch sporadisch,
zz. 16:43 gehts, 16:46 geht wieder nicht,
sondern geht zwingli_flo, lichtenberg, tobias, bouche raus.
stop+go für 10~30sec, dann wieder längere zeit o.k.
es scheinen mehrere nodes in der umgebung husten zu haben...
war gestern u. vorgestern zeitweise auch schon so flatterig
(mit mtr ge-orakelt, die ältere version, press 2x[d],
 oder kann mir jemand was besseres empfehlen, bis ping
 zu potte kommt, ist die route evt.'n paarmal ge-flappt/-ript)

hatte grad das unexpected_network_event,
- dass [mtr www.heise.de] scheinbar noch zur ..131.1 rauslief:
  104.131.10.1 = horstwrt
  104.131.10.2 = molly-SO
  104.131.83.1 = eth-molo-N
  104.131.1.2  = müggel-oso (yokoy)
  104.131.131.1= marek
  ...  #von hand, weil ich aus der console nicht copy+past kann :-(
- während es gleichzeitig nicht mehr pingte, u.
- die ..131.1-status-seite nicht lud; hmm...

ich bin mir noch nicht sicher,
was von den im mtr gesehenen phänomenen:
- 'griseln'    = nur einzeln '?'
- 'vergrauung' = phasenweise, längere pingzeiten-cluster
                 mit zt. zentralem komplett-???abriss,
- 'blockaden'  = scharf begrenzte ???-blöcke diff. länge.
in wirklichkeit aber
- mtr-artefakte, 
- hardware-wackler (funkwetter: regen, wind, kälte :-))) ,
- routine, wie cron-minutly, olsrdclear, ect., 
- overload durch filesharing, ect.,
- environment, wie µ-wave-oven-noise,
- soft-bugs
sind.

top/cpu-load der nodes, soweit loginmässig zeitnah erreichbar,
sind unauffällig, soweit man das beurteilen kann, wenn im
entscheidenden moment der ssh-output stehenbleibt,
aber der average_load müsste sich ja auffälligkeiten merken.
und an meinem Horstwrt hänge ich über eth.

betroffen scheinen phasenweise mehrere nodes, zt. sogar 1.hop;
schade, daß es nicht geht, simultan in mehrere, verschiedene
richtungen scannen zu lassen, zb. mehrere mtrs beissen sich leider,
um mal zu sehen, wie weit räumlich sich diese phänomene ausbreiten;
und wenns gar nicht mehr geht, gehts auch nicht in verschiedene richtungen.
bleibt das alte problem, dass man durch einen broken link nicht mehr
von *hinten* ranpingen kann, bliebe nur loggen und zentral sammeln.
hatten wir nicht mal so eine ini? 

ich kann mir das, nach einem jahr unterbrechung,
auch erst seit ein paar tagen wieder anschauen,
aber mir kommen immer mehr fragen und bedenken:
- wenn alle nodes cron-minutely, ect. resetten/rebooten
  (was eigentlich / wie lange / warum)
  dann ist es statistisch kein wunder, wenn ausser ein paar hello-
  packets nie content stabil auch nur ein paar hops weit kommt,
  und das routing im wesentlichen, und trotzdem vergeblich,
  damit beschäftigt ist, diese selbsterzeugte unruhe zu regeln..
  oder sehe ich da was zu hyperkritisch, oder gar ganz falsch?
- wieso interessiert sich niemand dafür,
  hängen eigentlich alle direkt an'ner dsl, und der rest wird als
  un-important wireless-extension-dumm-user abgestempelt?
- wieso gibt es im 3.jahr dieser fantastischen community
  KEIN verteiltes_monitoring, das auf die frage hinweise geben kann:
   was tat es im letzten moment, bevor es nichts mehr tat?
- wieso gibts keine tools dafür, weder manuell noch automatisch.
- sind alle zu sehr mit soft- und media-releases beschäftigt, und
  damit, sich zu beweisen, dass sie die grossen (heils)bringer sind,
  als dass sie sich mit tatsächlichen seit jahren bestehenden
  problemen beschäftigen könnten.
  (ach ja ich vergaß, es gibt keine probleme, nur lösungen!)  

mir graut schon vor dem moment, wo batman verbreitet läuft.

der zusage, daß alle alten tools kompatibel sein, stehe ich sehr
skeptisch gegenüber, dann würd man ja das evt. neue elend sehen!

ich kann mich noch lebhaft erinnern an die situation nach der
einführung von olsr (bevor bruno auf mein betteln hin scan.pl +
hOrst-tool schrieb), als kein tool mehr zur verfügung stand, um
die nun olsr-ad-hoc-nodes zu unterscheiden und so die antenne auf
den besten auszurichten, und wie die community auf meine klagen hin
sich feixend auf die schenkel klopfte und mir beschied:
"das brauchst du auch nicht wissen, DAS MACHT BEI UNS DAS PROTOKOLL".

na ja, das hat man dann schon kurze zeit später gesehen, was
das flatsch-neue protokoll so alles machte, als uns mit cell-
split u.ä. reihenweise die brocken um die ohren flogen.

gruss horst
offlinehorst at web.de

ps: so lasset uns nun beten, batfrau unsere,
    geheiligt sei..
    erlöse uns...


 

On Tue, 31 Oct 2006 13:45:46 +0100 (MET)
Marek Lindner <lindner_marek at yahoo.de> wrote:

> 
> Hi,
> 
> kleiner Nachtrag: Da Yokoy heute wieder angerufen hat und meinte, dass das 
> Internet nicht ginge und ich grad zu Hause war, konnte ich das ein wenig 
> debuggen. Der olsrd auf meinem WRT schmiert einfach ständig ab. Ich poste das 
> gleich mal auf der Malingliste.
> 
> Gruß,
> Marek
> 
> PS: Evtl. sollten wir bei uns schon mal batman an den Start bringen.




On Tue, 31 Oct 2006 14:57:11 +0100 (MET)
Marek Lindner <lindner_marek at yahoo.de> wrote:

> Am Dienstag, 31. Oktober 2006 14:11 schrieb Dennis Bartsch:
> > hi,auch in WSE crashen regelmäßig die olsrds, wenn unsere netze
> > gegenseitigen empfang haben. da die großen APs in der konfiguration nicht
> > verändert wurden, also der olsrd seit dem reverse-dykstra-patch von
> > sven-ola ein und der selbe ist, kann es nur an der größe des netzes
> > liegen.grußDennis 
> 
> Ja, ist auch meine Vermutung. Die OLSR-Entwickler haben nicht damit gerechnet, 
> dass es ein OLSR-Netz mit 32 Hops geben würde. Darunter leiden natürlich 
> erstmal nur die "Randbezirke".
> 
> Gruß,
> Marek
> 
> 
> PS: Mit welchem Email-Client verfasst du eigentlich deine Mails ? Bei mir sehe 
> ich deinen Text in nur einer Zeile ohne Zeilenumbruch. Das macht die Sache 
> etwas unleserlich ...
> 
> _______________________________________________
> Berlin mailing list
> Berlin at olsrexperiment.de
> https://www.olsrexperiment.de/cgi-bin/mailman/listinfo/berlin

_______________________________________________
Berlin mailing list
Berlin at olsrexperiment.de
https://www.olsrexperiment.de/cgi-bin/mailman/listinfo/berlin





Mehr Informationen über die Mailingliste Berlin