[Wien] Wartungsarbeiten NIG, Vermeidbarer Totalausfall der FunkFeuer-Services

Markus Gschwendt (spam-protected)
Sa Jul 10 12:12:37 CEST 2021


Hi!
Mal zur Aufklärung.
Eigentlich gabs nicht wirklich was dringendes am NIX zu tun.
Dass das alles Vorwand war ist ziemlich offensichtlich.
Wen's interessiert ... weiterlesen sonst besser ignorieren.

Sorry wenn ich hier etwas offensiv werde, aber das ist meine letzte
mail dazu und ich denke, dass auch die Vereinsöffentlichkeit etwas
Information haben sollte was da grad abgeht. Es gibt mehr Leute die
ähnlich denken wie ich, aber ich versteh gut, wenn sie sich aus der
Schusslinie halten wollen.


On Fri, 2021-07-09 at 01:29 +0200, Daniel A. Maierhofer wrote:
> 
> Ich hatte die Wartungsarbeiten vorab mit dem Vorstand & Backbone Team
> sowie dem Roofnode-Maintainer Markus Kittenberger abgeklärt.

Den Zugang, aber nicht das Highchecken des Switches. Aber egal...
Ich zieh mich sowieso zurück, weil diese Lügen einfach untragbar sind
und beende hiermit meine Maintainerschaft am NIX-Roof.

> Es war leider unerwartet doch ein Reset und Neukonfiguration des
> Switches notwendig, da die Dokumentation zum Konfigurieren nicht
> aktuell war und nun auch aktualisiert ist. Das zog dann leider doch
> eine kurze Downtime nach sich.

Die Doku hat 1:1 gestimmt, ihr hattet wohl nur keinen Zugriff.
Allerdings habt ihr Markit nicht nach dem Login am Switch gefragt
gehabt und das schaut nun eher so aus, dass das alles ein Vorwand war
und es swieso nur um die Übernahme des Switches ging und das alles so
geplant war. - Auch egal - nur zur allgemeinen Info.

> 
> Zuvor war weder die Antenne Richtung conesphere, noch der Switch am
> Dach von extern erreichbar.

Doch, aber ma muss sich halt auskennen.

> - Die Antenne nig-csph ist nun für das housing-orga-Team erreichbar
> gemacht (für Konfigurationsänderungen/Backups sowie
> Firmwareupgrades).
> - Der Switch sr02nig ist nun wieder für das Backbone-Team zur
> Verwaltung und Monitoring erreichbar gemacht.
> 

Hätte immer so sein können. Das BB-Team hatte das explizit abgelehnt
gehabt.

> Beim letzten Ausfall im Mai musste ich zum VKM fahren, um die Störung
> ausfindig zu machen,
> nun kann eine Störung auch aus der Ferne diagnostiziert werden.
> 

Ihr hattet nach der Antennen-Übergabe mehrere Monate Zeit um ein
Management-Netzwerk einzurichten. Wohl euer Versäumnis gewesen.

> Der nächste Schritt in Richtung ausfallsichereres Netzwerk wäre, das
> Server VLAN im VKM von dem bei Nessus abzutrennen, 
> damit es keinen Totalausfall der FunkFeuer-Services durch
> Arbeiten/Störungen am NIG-csph-VKM geben kann.
> 

Sinnvoller wäre eine Alternativstrecke, die auch angedacht war. Aber
seit ich mich aus dem Housing zurückgezogen habe (und auch andere, die
was weitergebracht hatten) passiert gar nixhts mehr. Deshalb siedeln
auch reihenweise Leute ihre Maschinen ab (auch ich).

> Dabei wäre die Unterstützung der Community bzw. Maintainer der VMs
> gefragt, gemeinsam den IP-Adressbereichswechsel möglichst zeitgleich
> und zeitnah umzusetzen.
> 

Wie ich in anderer eMail ggeschrieben hab suchen etliche Maschinen neue
Betreuer und die können das dann aja alles machen.


> Wie ist aktuell eigentlich der Status am Knoten Krypta?
> Das Metalab wird ja über nig-krypta-metalab versorgt.
> 
> Die Antenne auf conesphere Richtung krypta hat schon länger keine
> Gegenstelle. 
> Es gab ja bereits die Alternativstrecke nig-krypta-csph-vkm, wo ist
> eigentlich die Antenne krypta-csph?

Das ist keine echte Alternativstrecke.
Weil einerseits, nachdem der Link Krypta-NBG43 weg ist, das NIX SPOF
ist und auch der Link conesphere-vkm nicht redundant ist.
Und, die Antennen sind ansich Privateigentum von Clemens.

Markus




> Damit könnten wir eine Redundanz für die Strecke nig-csph schaffen.
> 
> lG,
> Daniel
> 
> On 08.07.21 23:38, Clemens Hopfer wrote:
> > Hi,
> > 
> > Am 08.07.21 um 12:49 schrieb Daniel A. Maierhofer:
> > > Aufgrund von Wartungsarbeiten am Roofnode-Standort NIG kann es
> > > heute ab ca. 15:00 zu kurzen Ausfällen des Housing-Uplinks und
> > > somit auch von Vereins-Services kommen.
> > 
> > Aus Interesse, was waren denn die Gründe für die sehr kurzfristigen
> > Wartungsarbeiten?
> > Wenn ich mich richtig erinnere gabs ja von Christoph die Bitte
> > mindestens 24h bzw. besser 48h vor Wartungsarbeiten zu informieren,
> > damit auch die Community unterstützen kann?
> > 
> > Lg,
> > Clemens
> 





Mehr Informationen über die Mailingliste Wien