Lsof и datapacket.com это баг или провокация?

Заметил на нескольких нодах снижение отзывчивости в консоли на некоторых командах. Не буду утомлять расследованием но вот промежуточные выводы к которым я пришел.
Проверьте свои ноды двумя командами

# lsof | grep TCP | grep datapacket.com | wc -l
367285
# netstat -n | wc -l
1447

на проблемных нодах кол-во якобы ESTABLISHED соединений у меня доходило до 700 тысяч! При этом netstat показывал единицы тысяч

при перезапуске storagenode кол-во приходит в норму, но на каких-то нодах быстро набирается к сотням тысяч, на каких-то нет

Почему баг?
У меня не получилось отфильтровать lsof параметром -i сохраняя в выводе эти сотни тысяч якобы ESTABLISHED конектов. Это намекает на то что процесс storagenode закрывая соединение оставляет где-то у себя висеть открытый дескриптор сокета, не давая тем самым ОС освободить системный ресурс

Примерный аналог как удалить файл при том что в какой-то программе он остается открытым. В листингах перестанет отображаться, но место в ФС не освободится.

Почему провокация?
Ну например трафик на одной из нод от соленого сателита 28ТБ за этот неполный месяц при оплате с этого сателита 3$
Это явно указывает на необходимость выхода с этого сателита. Но если даже эти 3 бакса убрать то стоит и задуматься вообще об отключении сторжа.
Да, и в треше у меня более 10ТБ суммарно

Сейчас проводится эмуляция трафика потенциальных клиентов используя SLC, данные загружаются с TTL, то есть они должны самоудаляться по истечение оного минуя trash.
То, что Garbage Collector собрал в trash, это удалённые данные клиентами (или автоматическая очистка expired free trial), не результат проводимого теста.
Цель теста - выявить потенциальные проблемы на узлах и исправить их, ещё достичь нужных параметров по пропускной способности и объёму, чтобы подписать контракты с этими клиентами. Ожидается, что паттерн эмулируется достаточно близко к тому, что ожидается. Если контракты будут подписаны, вы будете наблюдать всё то же самое, но на постоянной основе. Может быть нагрузка будет немного меньше по началу, но наши инженеры постарались сделать это максимально похожим.
Все загруженные данные оплачиваются, независимо от того, тестовые они или нет.
См. Updates on Test Data и Upcoming storage node improvements including benchmark tool
Могу предположить, что datapacket.com - это место, откуда проводится тест, хотя как по мне, то значения не имеет. Клиентов несколько и места могут быть разные.

Так что ваша замечательная конспирологическая теория о каких-то провокациях потерпела сокрушительный крах :wink:

Баги - возможны. Для их выявления и проводится тест. Уже много было найдено и находится в исправлении. Так же была существенно увеличена производительность.
Теперь нужно собрать аналогичную информацию с других (не ваших) узлов. Насколько я понимаю, необходимые и достаточные условия:

  1. Linux
  2. Docker (?)
  3. Наличие свободного места
  4. SLC в доверенных и вы с него не вышли.

Всё верно?
Если docker вовлечён, то где должны выполняться команды? В контейнере или на хосте?
У меня в контейнере если не ставить фильтр по datapacket.com, то результаты такие:

root@9fb28e5cf48a:/app# lsof | grep TCP | wc -l
1903
root@9fb28e5cf48a:/app# netstat -n | wc -l
89

На хосте однако ничего не видно:

$ sudo lsof | grep TCP | wc -l
0
$ netstat -n | wc -l
229

Так что делаю вывод, что запрашивать надо именно в контейнере.
Если оставить ваш фильтр по datapacket.com, то команда с lsof возвращает 0. Но у меня узлы полные.

Не могли бы вы посмотреть, от клиентов какого сателлита?
У меня есть подозрение, что вот это

не прошло даром.

lsof возвращает список открытых файлов (все есть файл), так что там где открываются файлы (коннекты), те в контейнере где запущен storagenode
Я докер не использую, процесс крутится в основной ОС

ну значит вас datapacket.com не мучает

1 Like

Ну так то да… Находясь в запоре 23 TB ингреса, а уж тем более 28, не получить :rofl:

Клиенты, которые навалят 30ТБ в папку треш, заплатив 3$ никому не нужны

Крей, сорян… Так то я и близкие прибили озеро как только оно стало стоить дешевле других.
Не вижу смысла, тем более сейчас, его держать, учитывая что его сбросили в ноль по хранению - выбор очевиден, выходим с озера и забираем хелд. Пусть подопытными крысами побудут более лояльные к этому паттерну коллеги.

2 Likes

А вот тут я не догнал. На нашей стороне никаких лимитов нет.
Можете пояснить?

Хорошо Вам. А мы принимаем любых, кто будет платить. Потом, можно будет носом крутить, но точно не сейчас.

Вы же написали, что Ваши ноды полные - полная нода = запор. Ей не куда принимать :rofl:
Это лимит не со стороны сторжа, это лимит со стороны блинов сно.

У меня признаюсь на данный момент занято 49% после большой уборки сторжа.
так вот… скажу о том, что мне не очень понравилось.
За крайние 24 часа трафик на интрефейсе составил 15.1 ТБ, а хранение отросло на 1 ТБ. Вот такой вот выстрел в пустоту. И как помните у меня сброшено везде озеро.
Понятно что пришли блюмы, да и кусков с ттл в среднем по 800тысяч на ноду…
НО! Есть нюанс. Мало какой домашний провайдер будет в восторге от такого, а не домашний это 200-300usd за гигабит полосы гарантированной.
Конечно у нас есть триван, который расширил шланг до 25Гбит, закупил 27 блинов по 24 ТБ. 3 тера мозгов… Рад я конечно за него…
НО! Он нарушил Вашу Алексей заповедь - не покупай ни чего для сторжа, используй что есть. А триван купил, причем явно не из своего кармана и расположив сервер явно не у себя дома. Так что он нарушил все возможные Ваши харамы Алексей!

1 Like

Вы меня неправильно поняли.
Я утверждаю что несуществует реальных клиентов с паттерном вашего теста, когда заливается и сразу удаляется 28ТБ на один IP в месяц.
Я могу и дальше продолжить рассуждения, но у нас тут с базовыми понятиями непонимание.
И вообще тема не об этом. А о баге
Как и когда блочить сателиты я и сам разберусь

Русская народная пословица - одна голова хорошо, а две лучше.
Без обид :wink:

Хм. Да. Но это же не связано с нагрузкой от ожидаемого трафика от этих клиентов? Я всё равно не смогу расширить мой сервер в ближайшие пару лет.

А это может быть вообще не релевантно. В 1.104.5 там используется allocated, а не settled. В следующей версии это реверчено.

К сожалению, я вообще не в курсе, о чём речь. Переведите на английский (да, понимаю, но… спасибо некоторым, особо одарённым на всю голову…).

Так он - датацентр. Ему не убудет. Не Сторж, так клиенты.

Как я уже сказал - он - датацентр. Он вообще должен быть в Селект, но в Европе его пока нет. Но, если клиенты захотят - будет. А пока - лучший провайдер в публичной сети… Ещё он и Пользователь (не хилый), я бы даже сказал - Клиент!. А потому - Добро Пожаловать!

А как Вы определили что он лучший. По его кошельку ? Он просто нарцис, бывает…
Многие не ложат все ноды на один кошелек, чтобы не отсвечивать, ну те что не нарцисы, как триван.

По его размеру данных… И что они в течение последних 5 лет никуда не делись. Самый низкий процент восстановления из 20к узлов…
Мне продолжать?

эх. да (моё ЛИЧНОЕ мнение, не цитировать. Пожалуйста?), но - не безосновательное. Он с нами с В2 (а это - с 2013 года). Я так думаю, что он заслуживает специального отношения, не находите?
Он ни разу нас не подвёл. Даже когда контракты были хардкожены на 90 дней (версия 2…). У него всегда все данные были доступны. И мы могли особо невнимательным клиентам помочь, когда они крупный шрифт не смогли прочитать, что их данные БУДУТ УДАЛЕНЫ ЧЕРЕЗ 90 ДНЕЙ, НЕЗАВИСИМО ОТ. ПОЖАЛУЙСТА, ПЕРЕЗАГРУЗИТЕ ИХ ДО ИСТЕЧЕНИЯ СРОКА КОНТРАКТА!..
Да не важно. Сейчас этой “проблемы” даже вообще нет. Пока платишь - данные будут доступны…

По размеру данных конкретно сейчас он не лучший, если брать в разрезе 5 лет, тут я не знаю. Много кто со старта v2 вместе со сторжом и тоже сторж не подвел ни чем.
А так да, например у меня много данных делось, после того как стефана закрыли :joy:
Алексей, я не вижу какого-то особого стремления сторжа познакомиться с другими операторами размером ± триван, потому я не принимаю к рассмотрению Ваши оды в его адрес :wink:

1 Like

Ну, может быть. Но история заставляет меня относится к нему чуть иначе. Простите…

так это… Это же на форуме тут обсуждалось задолго до…
Ну и вообще. Вы же могли публичный Стордж сателлит использовать? А они гарантируют, если вы платите.

А тут вам нужно сюда: Put your available storage capacity to work on Storj.

Я о том Алексей, что тогда я отказался в один момент от 100+ нод, из-за одномоментного несхождения кредита с дебитом. А перетащить это кол-во нод на более дешевую локацию было невозможно, вернее сказать экономически необоснованно. Так что тогда не дожидаясь пока сторж закроет стефана, я сам его закрыл и забрал хорошие хелды с него, как Вы помните по ±1000usd с каждой ноды.
Ровно также я вышел давно с озера и заполнил его место продспутниками постепенно, а кто не вышел получил катастрофическое падение хранения после сброса данных на озере и плюсом теперь адскую нагрузку во время тестов.
Но то дела давно минувших дней, продолжаем движение.

Я - нет, сети со специальными отношениями не мое

Потому что в сети сторжа реальных данных мало. Триван потерял в момент весь свой стор. Обнулился когда рейд переделывал.

О каком объеме вообще речь то? 100Пб это человек 5-8 топов например в чии.
И все же понимают что объем в сторже это не про обьем, а про кол-во IP

1 Like

Ой да какие обиды.
Не грохаю только потому что понимю, что когда грохну солтлейк, придется и все остальное сносить. И так уже выплаты ниже плинтуса.

А вот и нет… Озеро было сброшено практически в ноль в мае. Это был весьма удобный момент для выхода, заказать выход в мае и забрать хелд в июне, я вышел с оставшихся 15 нод, вот так сложилось, что с них не вышел после снижения выплат. Так что в июньской выплате получу с каждого выхода ±25$. Сейчас уже момент упущен, ибо навалили на озеро прилично и заказав выход сейчас, это наваленное еще месяц будет лежать мертвым грузом.
Хранение сейчас можно набить и через американца c европейцем, а не вот это вот всё… адские соленые пляски - это сильно на любителя.