Проблема: Your node has been disqualified, но audit score 96%

Что бы не плодить похожие темы , напишу тут свой вопрос:
Проблема: Your node has been disqualified on 12EayRS2V1kEsWESU9QMRseFhdxYxKicsiFmxrsLZHeLUtdps3S. If you have any questions regarding this please check our Node Operators thread on Storj forum.

Аудит сейчас на этом сателлите 96% us1.storj.io:7777 и ниже не падает, прошло уже больше 3х дней, нода на новом диске если что.

В правилах по Аудиту пишут: слишком много неудачных аудитов (потеря более 4% аудиторской оценки: когда аудиторская оценка падает ниже порога 96%, узел будет дисквалифицирован) - то есть для дисквалификации должно быть 95,99% и ниже, а у меня 96% и уже дисквалифицирован… :frowning:
ID Node: 1oehtwGRNRVHNpbo9VD8WF7BKZ6sm3R5CafFocq63wZQqDpWfH

дисквалификация наступает за потерю 4% данных, audit score не восстановится.
Иногда он успевает упасть ниже 96%, но обычно она наступает при 96%.

Судя по тому, что аудит не 100% и на других сателлитах, скорее всего ваш узел будет дисквалифицирован и на них тоже, но это может занять время. Вероятность восстановления оценки очень мала, сателлит может проверять те же отсутствующие кусочки снова и снова, пока они не будут удалены клиентом или восстановлены на другие узлы.
Восстановление на другие узлы происходит, когда количество здоровых кусочков сегмента падает ниже порога ремонта, то есть это происходит не сразу. За это время ваш узел с большой вероятностью будет дисквалифицирован.
Так что вы можете продолжать держать этот узел online, пока он не будет дисквалифицирован на остальных и надеяться, что отсутствующие кусочки будут либо удалены клиентом, либо будут восстановлены на другие узлы и больше не будут проверяться сателлитом. Получение новых данных также сокращает вероятность проверки пропавших кусочков, так что это гонка со временем.

Спасибо за ответ.
Есть еще замечание по поводу уведомления.
Когда я решил перенести текущую ноду ( с моим аудитом 96%) на другой диск, мне пришлось ее выключить, как на удивление мне на почту пришло уведомление, скриншот:
image
После переноса и включение в онлайн мне опять пришло уведомление, скриншот:
image
Мне еще не приходили такие уведомления по другим нодам когда они просто уходили в оффлайн, даже сейчас если я выключу любую другую ноду на время то уведомления такого рода нету, а по именно текущей ноде приходит, может это связано что эта нода с 96% аудитом попала под пристальное внимание?
Было бы хорошо если бы такие уведомления приходили по всем нодам если на них упал аудит хотя бы на -1% для быстрого реагирования.
По онлайну нод использую uptimerobot но это малоинформативный сервис но полезный.
Есть изменения по аудиту, в зеленой области рост, есть и падение. А серая зона http://us1.storj.io:7777/ как я понял выключена и статистику уже не посмотреть получается? Скриншот:

Даже подросло на 0,02%

Мы включили уведомления:

да, такое может быть, пока audit score выше 96% по причинам описанным выше:

  • процент вычисляется от количества пройденных аудитов (чем больше здоровых кусочков, тем выше процент).
  • каждый проваленный аудит уменьшает оценку аудита.
  • каждый пройденный аудит увеличивает оценку аудита.
  • если приходят новые данные, они увеличивают процент здоровых кусочков, поэтому оценка аудита может медленно расти.
  • если клиенты удаляют данные, кусочки которых пропали/повреждены на вашем узле - эти кусочки больше не будут снижать оценку аудита.
  • если сработал триггер восстановления для сегмента - пропавший/повреждённый кусочек будет восстановлен на другой узел, он больше не будет снижать оценку аудита (на вашем узле только один кусочек сегмента из 80). 4% потерянных данных задело наверняка больше одного сегмента.

ваш узел дисквалифицирован на этом сателлите, он больше не доверяет вашему узлу и пометил все кусочки своих клиентов на вашем узле как нездоровые, никаких проверок он больше производить не будет и своим клиентам предлагать ваш узел - тоже. Удержанная сумма будет потрачена на восстановление кусочков на другие узлы.

1 Like

У меня есть одноногая нода, дисквалифицированная на US1. На других спутниках все в порядке. Со временем недостаток данных был компенсирован бОльшей заливкой с EU1. Сейчас она мало чем отличается от моих других нод.

2 Likes

У меня до сих пор есть узел, дисквалифицированный на двух сателлитах, тоже работает.

1 Like

For a month, the EU satellite recovered very well!
image

If the US satellite was given at least 7(+/-) days to restore it, they blocked it by 96% without the possibility of restoration. It would be nice if they were given the opportunity to recover.


Data on the US satellite on my HDD just take up space without benefit?
How to remove them?
What’s the point of keeping them on HDD now if they are no longer in use?

It depends on many factors. In this case - the data usage grow from the customers of this particular satellite - it extended your node to survive. Just a great luck.

yep. You may check this mapping between satellites and blobs folder:

As a Community Leader I would not offer to delete this data, it’s up on you

1 Like

столкнулся с тем же самым нода 1DpQDKu2k3dupWpwh9GUz9ty6gbxyn8pLpMYUbws8mBE5Zi2aP

Your node has been disqualified on 12EayRS2V1kEsWESU9QMRseFhdxYxKicsiFmxrsLZHeLUtdps3S.
при этом

Ого при 98% уже дисквал… било же при 96%… кстати у меня другие ноди имели 97% и они отошли и вернулись на 100%… а тут при 98 уже все… очень странно.

Данные вернулись с того света? Как это?

Я считаю даже 2% слишком щедро. Два процента от одного терабайта это 20 гигабайт. Если года потеряла 20 гигабайт это не нода а хрен пойми что.

Я бы дисквалифицировал за 1 мегабайт потерянных данных. Не процент от объема, а фиксированый размер. Тем более что аудит статистический. Иметь пару плохих секторов на диске - ок. Но потерять мегабайт данных — до свидания.

Задача ноды — хранить данные. Если она с этой задачей не справляется — о чем вообще разговор?!

Совершенно вернно, ви смотрели текст више? Аудит востановился. Ето прекрасно видно на моих скриншотах в етой теме как востанавливается % аудита.

А разговор тут о правилах дисквалификации саттелита, в правилах указано про ниже 96%, у vladro он при 98% дисквалификация.

Правила тут https://support.storj.io/hc/en-us/articles/4403035941780-Why-is-my-node-disqualified-

Конечно смотрел. Именно потому учитывать процент данных плохая идея.

Иными словами – я не согласен с правилами, потому что как вы продемонстрировали, в теперешнем состоянии правила дают возможность ноде, потерявшей данные, продолжать работать как ни в чем ни бывало, если потеря не замечена вовремя.

Конкретный пример: Если нода хранила 2 гигабайта, и потеряла 1 гигабайт – она потеряла 50% данных. Надо дисквалифицировать? Еще бы!

Что если потери никто не заметил месяц, в течении которого дополнительно 1 терабайт данных закачался, или пользователи удалили файлы с потерянными кусочками – получается что теперь потеря составляет всего 0.1%. Дисквалифицировать не надо?

Но ведь нода не стала лучше, это все та же нода которая умудрилась потерять 50% данных месяц назад! Если ее нужно было дисквалифицировать за потерю данных тогда – то также нужно дисквалифицировать и сейчас. Гигабайт данных есть гигабайт данных, вне зависимости от суммарного количества хранимой информации.

Провалы аудита должны быть кумулятивные и никогда не восстанавливаться.

Читайте правила там все написано.
Ранее аудит бил куда нижче 96%
Никто не застрахован от вихода из истроя hdd, кто-то вовремя заметили и решил очаг проблеми, кто-то не успел.

Ваш узел возвращал повреждённые кусочки.
На какой ОС работает узел? это виртуалка?

Может быть вы знаете, почему кусочки оказались повреждены?

Если это Windows, использовали ли вы Ultradefrag (не нужно этого делать)?

ос-винда 2019, не виртуалка- физика, дефраги никаких видов не использовались

А какая файловая система? Перемещали ли вы этот узел с одного диска на другой?

Может вы знаете, почему кусочки оказались повреждёнными?
Кстати, вы можете их проверить:

файловая система- нтфс, нет, директория хранения не перемещалась. почему повреждены- нет никакой идеи- проверка нтфс проходит. утилитой - прогоню, но разве показатели аудита не должны соответствовать необходимому для дисквалификации и согласитесь- использовать дополнительный инструмент для проверки целостности- противоречит самой идее сторжея как законченного решения

Этот инструмент был создан как раз для диагностики повреждённых кусочков, мы пытаемся выяснить, почему кусочки оказались повреждены и в-основном на Windows. Причём популяция узлов на Linux куда больше.
А аудиты, как видите, работают - они-то и обнаружили аномалии.