[Berlin-wireless] olsrd crash

Marek Lindner lindner_marek
Mi Nov 1 00:45:44 CET 2006



Hi,

> bin etwas delayed und mein beitrag ist wie immer etwas oversized,
> ich seh, ihr werkelt schon dran, aber ich will auch klugscheissern...
> ich befürchtete schon, dass nach einem jahr netz-abstinenz sich nix
> zum guten geändert hätte, aber ich sehe, jetzt kann ich mich auf
> viel höherem level wundern....

kein Problem - hier darf jeder Mal.
Schön, dass du wieder (halbwegs) online bist - deine mahnenden, aber dennnoch 
aufmunternden Worte wurden von einigen schmerzlich vermisst.  ;-)


> jau, soweit ich von hier aus (4hops entfernt) zukucken kann,
> zuckte 104.131.131.1 nur noch sporadisch,
> zz. 16:43 gehts, 16:46 geht wieder nicht,
> sondern geht zwingli_flo, lichtenberg, tobias, bouche raus.
> stop+go für 10~30sec, dann wieder längere zeit o.k.

Jo, vielen Dank nochmal. Deine Mail hat den Debugvorgang erst richtig ins 
rollen gebracht und den Kreis der Verdächtigen arg eingeschränkt.
Danke auch an Yokoy.


> es scheinen mehrere nodes in der umgebung husten zu haben...

Alle die Routen mit mehr als 31 Hops haben ....


> - wenn alle nodes cron-minutely, ect. resetten/rebooten
>   (was eigentlich / wie lange / warum)
>   dann ist es statistisch kein wunder, wenn ausser ein paar hello-
>   packets nie content stabil auch nur ein paar hops weit kommt,
>   und das routing im wesentlichen, und trotzdem vergeblich,
>   damit beschäftigt ist, diese selbsterzeugte unruhe zu regeln..
>   oder sehe ich da was zu hyperkritisch, oder gar ganz falsch?

Fast.  :-)
Der cron checkt, ob der olsr noch läuft. Falls nicht, wird eben dieser 
neugestartet. Also eher eine self Wiederbelebung der Toten. Und da Tote 
prinzipiell am Routing nicht beteiligt sind, stört es auch nicht, diese 
wieder auferstehen zu lassen.
Zum Problem wird das nur, wenn der Tote sich vehement weigert seinen Dienst 
wieder aufzunehmen und unmittelbar nach dem Neustart wieder ins Jenseits 
reitet (neudeutsch: er crasht).


> - wieso interessiert sich niemand dafür,
>   hängen eigentlich alle direkt an'ner dsl, und der rest wird als
>   un-important wireless-extension-dumm-user abgestempelt?

Es interessieren sich schon einige Leutchen dafür, aber es nicht so simpel dem 
Problem auf die Spur zu kommen oder das ganze überhaupt erst als Problem zu 
erkennen. Dafür braucht es qualifiziertes Personal, mit langjähriger 
Erfahrung und mit dem Willen, anderen Freifunkern solange oder eindringlich 
in den Ohren zu liegen, bis sich was tut ..  ;-)


> - wieso gibt es im 3.jahr dieser fantastischen community
>   KEIN verteiltes_monitoring, das auf die frage hinweise geben kann:
>    was tat es im letzten moment, bevor es nichts mehr tat?

Es wollte sich einfach niemand finden, der sich dafür verantwortlich fühlt.


> - wieso gibts keine tools dafür, weder manuell noch automatisch.

Weil wir es prinizpiell ablehnen, Tools einzusetzen, welche das 
Unvorhersehbare monitoren können (die sind uns einfach unheimlich).


> mir graut schon vor dem moment, wo batman verbreitet läuft.
>
> der zusage, daß alle alten tools kompatibel sein, stehe ich sehr
> skeptisch gegenüber, dann würd man ja das evt. neue elend sehen!

Wie gesagt, über einen Visualisierungsserver können wir den olsr dot_draw 
output nachbilden und das horst tool auf batman anzupassen sollte nicht das 
Problem sein. Bin da auch gern bereit noch etwas Schützhilfe zu geben.


> ps: so lasset uns nun beten, batfrau unsere,
>     geheiligt sei..
>     erlöse uns...

Herrlich - ich wusste mir fehlt was. Wir sollten nochmal in unseren 
Mailarchiven kramen und ein Best-of-Horst rausbringen. Der Erlös fließt 
natürlich unserem Projekt zu.

Gruß,
Marek

_______________________________________________
Berlin mailing list
Berlin at olsrexperiment.de
https://www.olsrexperiment.de/cgi-bin/mailman/listinfo/berlin





Mehr Informationen über die Mailingliste Berlin