Disqualification 5 hours offline per month? (German Thread)

So, die Diskussion gibt es schon länger, aber wie sieht es jetzt aus mit Disqualifizierungen, sind es wirklich die 5 Stunden im Monat.

Bei mir ist in den Jahren wo ich bei storj mittmachte schon öfter der ISP für einen Tag ausgefallen. Im Moment sind ca. 7 TB Daten beir mir und das Ding läuft. Verstehe ich richtig, einmal Stromausfall beim ISP und die brauchen einen Tag, dann ist alles für den Ar… ? Und ich bin raus und muss von vorne Anfangen, wäre eine Verschwendung für storj und für mich als SNO.

Wie seht ihr dass, wenn man nun 2 Jahre dabei ist ohne irgendeinen Ausfall und dann crasht einem dass aus Gründen, für die man nichts kann und man darf wieder von vorne Anfangen bis man die 15 Monate escrow abgesessen hat. Ist doch für alle ineffiziet, solange man selbst keine Daten verloren hat.

Oder gibt es mittlerweile eine elegantere Lösung ? Mir scheint es die Holzhammerlösung.

4 Likes

Derzeit ist das Design zum Bestimmen von Offline-Knoten unterschiedlich. Es gibt zwar keine Informationen darüber, wie lange die zulässige Offline-Dauer sein wird. Bisher scheint es, dass mehr als 5 Stunden:

1 Like

So und genau heute war es soweit, der ISP ging offline. Als es wieder ging hatte der Server probleme sich wieder mit dem Netzwerk zu verbinden, es half nur ein Neustart. Soweit läuft es wieder, unklar, wie lange der Node offline war. Evtl. mehrere Stunden und im Grunde Zufall, dass ich drauf gestoßen bin.

Mal sehen, wie das Netzwerk meinen Node jetzt wertet. Wenn der nun nach 3 Jahren disqualifiziert wird (zuvor V2), dann ergbit es für mich als Privatmann einfach keinen Sinn, dass am Laufen zu halten. 24/7 365 ist kaum durchgehend am laufen zu halten. Neben Arbeiten und Schlafen kann ich nicht ständig schauen, dass der Node läuft und v.a. nicht sofort intervenieren (bei ISP Ausfall ohnehin sinnfrei).

Wie war das jetzt mit den audits und der DQ ? Habs nicht ganz verstanden, wie jetzt offline Zeit gewertet wird bzw. offline Knoten bestimmt werden ?

noch gar nicht.

uptimerobot

2 Likes

Ich werfe mal ein, dass bei einer meiner Windows-Nodes nach jedem automatischen Update der storj-Dienst nicht startet. Passiert das unmittelbar nachdem ich schlafen gegangen bin, ist die Node somit 7-8h down.

Ich denke, dass ein Zeitfenster von 24h eine angemessene Fehlersuche und -behebung erlauben würde, auch für die Leute, die Arbeit und Familie haben und nicht wegen einer Downmeldung nachts aufstehen möchten :wink:

Uptimerobot/Freshping (sendet dir auch Mails wenn was ist) und einen cron für die Überwachung des Prozesses der den Node bei Bedarf neu startet. Je nach dem ob du deinen Node per Docker oder Windows betreibst.

Grund für eine Disqualifizierung oder Suspendierung sind derzeit ausschließlich failed Audits.

Aber ja, gehen wir mal von dem Fall aus dass man für Offlinezeiten wieder suspendiert oder disqualifiziert wird dann wäre der Node nun am Arsch. Egal ob du 2 Jahre oder 3 Monate dabei bist.

5 Stunden im Monat ist eigentlich kein Problem, sofern es denn kein Problem auf Anbieterseite gibt wo man selbst Machtlos ist und nur abwarten kann. Oder man tatsächlich gerade auf der Arbeit ist.
Und so kann einem die Downtime des Anbieters richtig Geld kosten wenn plötzlich all das gehaltene Guthaben verloren ist.

Richte dir Uptimerobot oder Freshping ein, dann weißt du ganz genau wie oft dein Node wie lange im Monat Offline war/ist.
Dann noch einen OpenVPN Server damit du jederzeit Zugriff bekommen kannst, auch wenn du gerade nicht zuhause bist. Wenn du eine FritzBox hast kannst du auch das FritzVPN nutzen, für sowas reicht das allemal.

PS: Was fällt dir ein an Familie und Arbeit zu denken?! Du MUSST innerhalb von 5 Stunden deinen Node in Ordnung bringen! :joy: Aber ja, gerade Nachts kann das zu einem Problem dann werden. Ich sehe jetzt schon die etlichen hunderten Threads die dann aufgemacht werden.

1 Like

Ja, dass sehe ich auch kommen, hunderte Threads weil die Nodes zu lange offline waren. Das wird mittelfristig zum Ausstieg der Privaten führen. Wenn ein Node nach 3 Jahren oder mehr aussteigt, weil der ISP halt mal offline ist, dann dürfte jeder Private sich überlegen ob er überhaupt sowas betreiben möchte. Es ist ja mehr Hobby als alles andere, ich wäre schon etwas angepestet.

Was ist denn jetzt, wenn man mit der Familie umzieht der Arbeit wegen und der Umzug dauert halt 2-3 Tage, weil nicht gleich um die Ecke und man evtl. nicht gleich online sein kann. Spätestens dann bin ich doch disqualifiziert und der Node am Ende. Es gibt unzählige Konstellationen, dass man mal länger offline sein kann. Was ist, wenn man mal Urlaub macht ? Soll ich den Urlaub abbrechen, für storj :slight_smile: ?

Da Privatmenschen niemals umziehen, nicht schlafen und auf gar keinen Fall Urlaub machen oder Zeit mit anderen Menschen verbringen anstatt auf den Server zu starren stellt das für storj auch gar kein Problem dar, nicht wahr :slight_smile: ?

Das ganze geht ganz klar in die professionelle Richtung, was Ausstattung und vor allem Verfügbarkeit angeht. Ich denke auch nicht, dass es anders geht, wenn man storj an den Mann bringen möchte mit einer gewissen Verlässlichkeit.

Als Laie fällt mir nur eine Lösung ein. Man wird erst ab einer gewissen Schwelle von inaktiven Servern disqualifiziert. Als Beispiel in etwa so:

Verteilung der Daten auf 89 Server, es dürfen 30 Server offline gehen (egal wie lange) ohne Konsequenz und erst ab einer gewissen Schwelle sagen wir mal ab 31 Servern offline beginnt die Disqualifizierung der Server und die Neuverteilung auf andere Server. Das würde mehr Leute im Netzwerk halten und die Wahrscheinlichkeit, dass gleich 30 Server gleichzeitig offline gehen ist doch sehr begrenzt, so hätten die Privaten auch die Möglichkeit mal offline zu gehen.

Bei anderen Lösungen sehe ich nur noch professionelle Anbieter am Zug.

Oder ein workaround, wenn mal wieder der ISP streikt, dann einfach einen komplett neuen Node aufsetzen und 15 Monate warten bis man wieder soweit ist wie vorher und hoffen, das inzwischen mal einfach nichts passiert.

1 Like

Verwende ich natürlich, aber selbst wenn ich die Nachricht sehe, veranlasst mich das nicht dazu, aus dem Bett aufzustehen.

Das ist diese sog. Node/Life-Balance :wink:

Die Node könnte derweil bei Freunden oder auf der Arbeit unterkommen…es gibt schon Möglichkeiten. Aber sollten die 5h irgendwann wirklich rigoros bestraft werden, steigen wie du schon sagst “die Privaten” aus.

Durch VPN hat man ja immerhin die Möglichkeiten von außerhalb zu überprüfen was da los ist und gff. auch zu fixxen. Zum echten Problem wird es erst wenn der Node komplett nicht mehr erreichbar ist, also wenn zb. der gesamte Server abgestürzt ist oder eben der ISP Down ist oder man tatsächlich am schlafen ist… Dann hilft auch VPN nicht mehr.

Ich weiß nicht wie das im Falle des laufenden Betriebs ist aber ich hab das bei mir nun so gelöst dass ich meine Identität mit auf der Festplatte speicher. Startet der Node nun und die Festplatte ist nicht verfügbar bricht der Start aufgrund der fehlenden Identität ab.

Ich weiß aber nicht wie das im Falle des laufenden Betriebes ist. Ich hab die Identität erst verschoben als ich den Fall hatte dass der mount sich verabschiedet hat und mein Node über 8 Stunden ohne Festplatte lief. Toi Toi Toi dass ich dafür nicht disqualifiziert wurde, jedoch suspendiert. Die Suspendierung wurde nach dem fix aber innerhalb weniger Minuten wieder aufgehoben.

Im Falle des Umzugs muss man halt sehen dass man in der neuen Wohnung frühzeitig Internet hat, dann den Node in der alten Wohnung Offline nehmen und schnellstmöglich zum neuen Ort bringen und wieder Online schalten. Da sehe ich ein kleineres Problem außer man hat natürlich mehr wie 5 Stunden Fahrt zum neuen Wohnort. Das wäre natürlich sehr Ärgerlich, aber wie oft zieht man im Jahr um…

Ja ganz zufrieden bin ich mit der Handhabung der Offline Zeiten auch nicht. Ich denke dass Storj sich da aber noch was anderes einfallen lässt, bzw. würde ich es mir wünschen. Ein Zeitfenster von 8-12 Stunden wäre tatsächlich sinnvoller. Da ist es dann auch noch machbar den Node zu fixen wenn der tatsächlich Nachts ausfällt und man im Land der Träume ist und den Fehler nicht mitbekommt.

Abgesehen davon verstehe ich dass es ein gewisses Maß an professionalität da sein muss. Jeder Fehlerhafte Node belastet das Netzwerk und Storj muss natürlich dafür sorgen dass die Daten für die Benutzer jederzeit abrufbar sind.

Ja gut storj möchte ein billiges dezentrales Netzwerk und das vor allem ohne microsoft, google und amazon clouds. Das geht dann nur mit den Privaten und da muss storj eben damit leben, dass es eben eben Privat ist und das Netzwerk so auslegen, dass es eben durch fehlerhafte Nodes belastet werden kann. Storj selbst stellt doch auch gar nicht das Netzwerk, das sind wir, das ist für storj dann eher ne Perfomancefrage.

Storj sollte auch ganz klar kommunizieren, welche Regeln gelten, das dürfte auch Teil eines stabilen Netzwerkse sein, dann gehen viele Nodes gar nicht erst online, wenn man schon vorher weis, dass das nix wird und es verbleiben die “professionellen”, die sich das zutrauen.

Ja und zum Thema VPN, genauso fiel es mir auf. VPN Verbindung klappte nicht mehr über den definierten port. Komischerweise anpingen konnte ich den Server noch über den DynDNS. Aber der Server war im lokalen LAN nicht mehr angemeldet (wer hat den nun hier beim ping geantwortet, nur der Router ?). Erst nach einem Serverneustart konnte ich wie gewohnt auf den Server aus der Ferne zugreifen. Es war nötig den Server hart zu resetten, kam in 3 Jahren noch nie vor, genau das ist das, langfristig lässt sich das nicht vermeiden, das sich ein Server mal für längere Zeit verabschiedet. Als Ursache alles denkbar, Softwarefehler, RAM Fehler, Mainboardfehler, schwer zu finden. Normalerweise auch völlig unwichtig bei 24/7 365 aber relevant. Ob jetzt Serverhardware besser läuft weis ich nicht. Evtl schaff ich mir die an mit ECC RAM.

Praktisch wäre jetzt eine Anleitung für ein minimal Unbuntu Server System, dass 1x / Woche selbständig neu startet und gleichzeitig den Server überwacht und per cron selbständig neu startet.
MIr kommt es vor, als wenn die minimal CLI Systeme einfach stabiler laufen als Linux mit GUI. Da stürzt bei mir alle paar Monate auch gerne mal die GUI Oberfläche ab und kann nur per ssh auf den Server zugreifen.

Wenn storj jetzt ein script bereitstellen würde, wo man nur noch die Daten eingeben müsste mit Speicherort und Identität und ETH Adresse und dass würde dann einem den cron job einstellen und den Neutsart etc., dann würden möglicherweise viel dabei sein mit einem stabilerem System.

Ohne wäre es doch evtl. sinnvoll den Server automatisch 1 x / Tag neu zu starten, wenn er nicht ganz abschmiert wäre dass ne Chance, dass er selbständig online geht, selbst dann wenn man schläft. Das hätte in meinem Fall evtl. geholfen.

Habe jetzt nicht jeden langen Kommentar gelesen (sorry), denn die meisten Sachen werden/wurden ausführlich in englishen threads diskutiert.

Da hier immer wieder mit 5h offline zeit herumgeworfen wird: Der Plan ist, nodes in den Suspension mode zu setzen, wenn sie zu lange offline sind und sie nicht gleich zu disqualifizieren. Wie lange eine node offline sein kann, bevor sie disqualifiziert wird, wurde bisher nicht angekündigt und wird auch erst angekündigt werden, wenn das neue System zum downtime-tracking zuverlässig läuft. Bis dahin ist es sinnlos, weiter darüber zu spekulieren.
Ich bin mir allerdings sicher, dass wir mehr als 5h haben werden.

1 Like

Ein Server muss nicht täglich neu gestartet werden, auch nicht Wöchentlich sofern es keine Fehler gibt.
Normalerweise lässt sich Linux ziemlich easy und in den meisten fällen auch ohne Neustart konfigurieren. Wie es mit GUI ist weiß ich nicht, ich nutze Linux ausschließlich mit CLI.

All die Punkte die du gerne hättest lassen sich relativ einfach lösen:

Überwachung: Zabbix (sendet dir unter anerem bei jedem kleinsten Fehler eine Mail)
Cron (Überwachung/Neustarts): Service Check via Cron
Mit Zabbix und Cron wird einem viel Arbeit und Fehlersuche abgenommen und Crontabs kann man für alle möglichen Sachen anlegen

Ich bin übrigens auch kein Profi, ich betreibe all meine Server aus reinem Hobby und zum Lernen.
Die Einrichtung von Zabbix klingt schwieriger als sie ist. Nicht abschrecken.