[Wien] Wartungsarbeiten NIG, Vermeidbarer Totalausfall der FunkFeuer-Services

Daniel A. Maierhofer (spam-protected)
Fr Jul 9 01:29:28 CEST 2021


Servus!

Ich hatte die Wartungsarbeiten vorab mit dem Vorstand & Backbone Team sowie dem Roofnode-Maintainer Markus Kittenberger abgeklärt.
Es war leider unerwartet doch ein Reset und Neukonfiguration des Switches notwendig, da die Dokumentation zum Konfigurieren nicht aktuell war und nun auch aktualisiert ist. Das zog dann leider doch eine kurze Downtime nach sich.

Zuvor war weder die Antenne Richtung conesphere, noch der Switch am Dach von extern erreichbar.
- Die Antenne nig-csph ist nun für das housing-orga-Team erreichbar gemacht (für Konfigurationsänderungen/Backups sowie Firmwareupgrades).
- Der Switch sr02nig ist nun wieder für das Backbone-Team zur Verwaltung und Monitoring erreichbar gemacht.

Beim letzten Ausfall im Mai musste ich zum VKM fahren, um die Störung ausfindig zu machen,
nun kann eine Störung auch aus der Ferne diagnostiziert werden.


Der nächste Schritt in Richtung ausfallsichereres Netzwerk wäre, das Server VLAN im VKM von dem bei Nessus abzutrennen, 
damit es keinen Totalausfall der FunkFeuer-Services durch Arbeiten/Störungen am NIG-csph-VKM geben kann.

Dabei wäre die Unterstützung der Community bzw. Maintainer der VMs gefragt, gemeinsam den IP-Adressbereichswechsel möglichst zeitgleich und zeitnah umzusetzen.


Wie ist aktuell eigentlich der Status am Knoten Krypta?
Das Metalab wird ja über nig-krypta-metalab versorgt.

Die Antenne auf conesphere Richtung krypta hat schon länger keine Gegenstelle. 
Es gab ja bereits die Alternativstrecke nig-krypta-csph-vkm, wo ist eigentlich die Antenne krypta-csph?
Damit könnten wir eine Redundanz für die Strecke nig-csph schaffen.

lG,
Daniel

On 08.07.21 23:38, Clemens Hopfer wrote:
> Hi,
> 
> Am 08.07.21 um 12:49 schrieb Daniel A. Maierhofer:
>> Aufgrund von Wartungsarbeiten am Roofnode-Standort NIG kann es heute ab ca. 15:00 zu kurzen Ausfällen des Housing-Uplinks und somit auch von Vereins-Services kommen.
> 
> Aus Interesse, was waren denn die Gründe für die sehr kurzfristigen Wartungsarbeiten?
> Wenn ich mich richtig erinnere gabs ja von Christoph die Bitte mindestens 24h bzw. besser 48h vor Wartungsarbeiten zu informieren, damit auch die Community unterstützen kann?
> 
> Lg,
> Clemens

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 833 bytes
Beschreibung: OpenPGP digital signature
URL         : <http://lists.funkfeuer.at/pipermail/wien/attachments/20210709/ce3d7e4f/attachment.sig>


Mehr Informationen über die Mailingliste Wien