[Berlin-wireless] Collectd Bugs und unser Monitoring

Philipp Borgers borgers
Fr Mai 9 21:30:36 CEST 2014


On 09.05.2014 14:50, Bastian wrote:
> Hallo,
> 
> für meine Standorte guck ich täglich z.T. sogar mehrfach in die
> Statistiken und finde den Service super praktisch. Kudos an die Admins!
> Aber kann mir evtl. jemand erklären, wie Detail-Einträge unter
> monitor.berlin.freifunk.net aufgeräumt werden können?

Der collectd legt rrd-Files in ein Verzeichnis. Für jeden Router gibt es
ein Unterverzeichnis und für jedes Plugin und ...
Ich kann einzelne Verzeichnisse per Hand löschen. Mehr ist im Moment
nicht drin. Es steht uns natürlich frei nach anderen Lösungen zu suchen
die collectd Daten auf dem Server zu verwalten.

> Zum Beispiel bleiben alte iwinfo-Stats für ehemalige Interfaces auch
> weiterhin eingetragen. Passiert z.B. wenn von pberg-221 auf eine moderne
> FW-Version gewechselt wird und sich dabei die Namen von adhoc/ap
> Interfaces ändern. Siehe [1]

Wenn du sagst, was weg soll, kann ich das löschen.

> Warum wird manchmal nur ein Wert zwischen 0 und 1 für "Number of
> Stations" angezeigt, obwohl definitiv mehr als 1 Client verbunden ist?
> Siehe [2]

Kann ich dir auch nicht sagen. Was sagt denn das collectd im Router? Ist
das wirklich ein Problem vom Server/Frontend?

> Das betrifft jetzt nur RAW-Knoten, und falls das Problem auf
> Client-Seite liegt und jemand zufällig einen Hint hat, bin ich dafür
> sehr dankbar!
> 
> 
> Dann gibt es noch den Bug zu collectd_olsr. In der
> Collectd-Konfiguration von Zwingli-Core hatte ich vor Monaten kurzzeitig
> die Options CollectLinks, CollectRoutes und CollectTopology auf "Detail"
> gesetzt. Seit langem ist aber nur noch "Summary" definiert, ein Klick
> auf den Entsprechenden Eintrag auf unserer Monitoring-Seite führt aber
> zu ganz ganz unschönen Ergebnissen. (ich verlinke jetzt mal absichtlich
> nicht) - Das Problem lässt sich sicher auch mit einem Fix für Bug#1 lösen.
> 
> Soviel zu den Bugs, einen Feature-Request hab ich aber auch noch:
> Mit dem AAAA-Record zu monitor.berlin.freifunk.net sind uns zwar so
> einige Nodes verloren gegangen, das besser sich aber sichtlich.Trotzdem
> fände ich eine Downtime-Anzeige auf der Startseite sehr sinnvoll, für
> den Fall das ein Node wirklich seit X Stunden kein Update mehr
> eingeliefert hat.

Studierst du nicht auch Informatik? Hier findest du den Code:

https://github.com/stargieg/CGP/

Wir können uns auch nochmal fragen, ob collectd die nicht das falsche
Tool ist um Monitoring zu betreiben. Um Notifications beim Ausfall von
Netzkomponenten zu generieren ist das eher das falsche Tool.


> [1] http://monitor.berlin.freifunk.net/host.php?h=RAW-Ost&p=iwinfo
> [2] http://monitor.berlin.freifunk.net/host.php?h=RAW-West&p=iwinfo
> 
> Gruß
> Bastian
> 
> _______________________________________________
> Berlin mailing list
> Berlin at berlin.freifunk.net
> http://lists.berlin.freifunk.net/cgi-bin/mailman/listinfo/berlin


-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 901 bytes
Beschreibung: OpenPGP digital signature
URL         : <http://lists.berlin.freifunk.net/pipermail/berlin/attachments/20140509/3c982fa0/attachment.pgp>



Mehr Informationen über die Mailingliste Berlin