Диск загружен при запуске stroj на docker

Kira3 · September 14, 2022, 12:31pm

Всех приветствую.

Есть 2 ноды на одном узле, на разных дисках. Как только на одной ноде объем начал подходить к 2Тб, на диск стала высокая нагрузка, дашборд не загружается, есть сбор данных через grafana + Prometheus (данные с этой ноды не идут). Если перезагрузить контейнер, то данные идут, дашборд работает минуты 3, после чего опять тоже самое. В логах иногда ошибка:
ERROR piecestore failed to add bandwidth usage {“Process”: “storagenode”, “error”: “bandwidthdb: database is locked”, “errorVerbose”: “bandwidthdb: database is locked\n[tstorj.io/storj/storagenode/storagenodedb.(*bandwidthDB).Add:60](http://tstorj.io/storj/storagenode/storagenodedb.(*bandwidthDB).Add:60)\n[tstorj.io/storj/storagenode/piecestore.(*Endpoint).beginSaveOrder.func1:724](http://tstorj.io/storj/storagenode/piecestore.(*Endpoint).beginSaveOrder.func1:724)\n[tstorj.io/storj/storagenode/piecestore.(*Endpoint).Upload:436](http://tstorj.io/storj/storagenode/piecestore.(*Endpoint).Upload:436)\n[tstorj.io/common/pb.DRPCPiecestoreDescription.Method.func1:220](http://tstorj.io/common/pb.DRPCPiecestoreDescription.Method.func1:220)\n[tstorj.io/drpc/drpcmux.(*Mux).HandleRPC:33](http://tstorj.io/drpc/drpcmux.(*Mux).HandleRPC:33)\n[tstorj.io/common/rpc/rpctracing.(*Handler).HandleRPC:61](http://tstorj.io/common/rpc/rpctracing.(*Handler).HandleRPC:61)\n[tstorj.io/drpc/drpcserver.(*Server).handleRPC:122](http://tstorj.io/drpc/drpcserver.(*Server).handleRPC:122)\n[tstorj.io/drpc/drpcserver.(*Server).ServeOne:66](http://tstorj.io/drpc/drpcserver.(*Server).ServeOne:66)\n[tstorj.io/drpc/drpcserver.(*Server).Serve.func2:112](http://tstorj.io/drpc/drpcserver.(*Server).Serve.func2:112)\n[tstorj.io/drpc/drpcctx.(*Tracker).track:52](http://tstorj.io/drpc/drpcctx.(*Tracker).track:52)”}

Нода была одна на винде, после чего их стало 2 на windows docker, сейчас 2 на linux docker. Вторая работает без нареканий. Подскажите куда копать вообще

Vadim · September 14, 2022, 1:26pm

Eto normalno, tak kak noda proverjaet realnyi objom skanirujavse kusorki, u menja posle restarta obytno zagruzka dlitsa na bolshih nodah 24+h

Kira3 · September 14, 2022, 4:07pm

Ну на данный момент длится более 72ч

Vadim · September 14, 2022, 4:30pm

mozhet HDD nakrylsja

Kira3 · September 14, 2022, 4:51pm

Да проверял, всë ок с ним. Да и при выключенной ноде, работает как положенно.

arrogantrabbit · September 14, 2022, 5:26pm

Я не уверен какие инструменты есть на линуксе для мониторига файловой системы – может strace? – но я бы попробовал посмотреть на какие конкретно файлы нода трогает.

Моя нода (на freebsd) на старте хрустит дисками около часа, хотя там сейчас совсем немного данных (пол терабайта) и на сервере куча свободной памяти (для кеша метаданных). Если в этот момент посмотреть на что делает файловая система – там storage node перебирает все файлы в хранилище.

Я пытаюсь выразить что надо убедится что нода не щупает одни и те же файлы по кругу; в этом случае рано или поздно она закончит. Можно попробовать добавить RAM на сервер – линукс будет его использовать как кеш файловой системы и может чуть ускорить процесс (хотя на старте кеша все равно нет, и потому скорее всего никакой разницы не будет) но зато потом вся метадата будет закеширована и теоретически это должно помочь ноде обрабатывать запросы быстрее.

Alexey · September 14, 2022, 6:52pm

Говорит о том, что ваш диск достаточно медленный, чтобы в эту БД не успевала добавляться информация об использованной полосе пропускания.
Возможно пора перемещать БД на SSD: How to move DB’s to SSD on Docker
А какую файловую систему вы используете?

Смотреть, чем занят узел, можно через порт для отладки: Guide to debug my storage node, uplink, s3 gateway, satellite
См. также:

Filewalker running twice simulatenously?

From the mon/ps page…

[641491950405662978] storj.io/storj/storagenode/pieces.(*CacheService).Run() (elapsed: 26h16m57.3032232s, orphaned)
 [4234253337856310446] storj.io/storj/storagenode/pieces.(*Store).SpaceUsedTotalAndBySatellite() (elapsed: 26h16m57.3032085s)
  [6861140452394329368] storj.io/storj/storagenode/pieces.(*Store).WalkSatellitePieces() (elapsed: 26h16m57.3028626s)
   [6181857365076502411] storj.io/storj/storage/filestore.(*Dir).WalkNamespace() (elapsed: 26h16m57.302855s)
    [5502574277758675454] storj.io/storj/storage/filestore.(*Dir).walkNamespaceInPath() (elapsed: 26h16m57.3028459s)

theurs · September 15, 2022, 9:59pm

а может разработчикам надо уже за голову взяться и упаковывать кучу мелких файлов в архивы покрупнее?

arrogantrabbit · September 16, 2022, 5:18am

Дык если клиент хочет маленький кусочек, все равно нужно будет где то его из большого выковыривать — либо на ноде, тогда экономии дисковой активности все равно не получится, или на клиенте, тогда лишний трафик гонять придётся.

Я думаю все же решение — куча рама на ноде чтоб всю метадату закешировать.

Ну и чтоб два раза не вставать — чтоб датабазы не тормозили — slog на optane, это если zfs, чтоб синхронные врайты оптимизировать.

Alexey · September 16, 2022, 5:42am

@arrogantrabbit прав, к тому же на узле хранятся кусочки из разных сегментов файлов разных клиентов. То есть запросы всегда будут на кусочки, а не пакет. Упаковывать и распаковывать излишняя нагрузка как на диск, так и на процессор и память. Так что либо использовать один узел-один диск и родная файловая система - для Linux ext4, для Windows NTFS, либо монструозные дорогие массивы с SSD прослойкой и большим количеством RAM.

Vadim · September 16, 2022, 7:07am

V printsipe, u menja na 1 sisteme windows rabotaet 8 nodov, zdelan cache na NVME 1TB, vse bazy dannyh nahodjatsa na SSD s OS. Rabotaet kak chasy. Dazhe posle restarta proverka zanjala vsego okolo 6 chasov, pri tom 4to nody po4ti vse polnye po 4TB primerno

serger001 · September 16, 2022, 7:54am

Можно сюда копнуть: --storage2.piece-scan-on-startup=false
хоть разработчики вроде и не рекомендуют, но если диск не вывозит после рестарта, то вот это спасет.

Kira3 · September 16, 2022, 3:57pm

Ну хорошо, переведу я БД на ССД, а через пол года ССД умрëт. Что с моей нодой произойдëт?

Alexey · September 16, 2022, 5:41pm

Ничего, но потеряется историческая статистика на dashboard.

arrogantrabbit · September 16, 2022, 7:01pm

А почему ССД должен умереть так быстро? Там не так много записей чтоб изтерзать все ячейки за такое короткое время, даже с учетом write amplification. И потом всегда можно мониторить и заменить ссд когда ресурс записи подходит к концу.

И потом многие (все?) ссд помирают в readonly. Можно будет скопировать данные тогда.

USB флешки конечно это совсем другой разговор. Они плохо контролируют износ и если в них записывать в один и тот же сектор (что базы данных часто делают) они реально могут износить несколько физических секторов в ноль.

Kira3 · September 16, 2022, 7:31pm

Всякое бывает, пол года как пример.

Vadim · September 16, 2022, 7:37pm

u menja na ssd uzhe 3 goda rabotaet i normalno, iz 7 serverov ni odin ne umer.

Kira3 · September 16, 2022, 7:44pm

Сделал перенос баз на ССД, всë как по инструкции. Но диск говорит пустой - это надо проверку ждать как раз?

theurs · September 17, 2022, 2:28pm

Никакой упаковки распаковки, файлы можно просто склеивать, как это делают с текстурами в играх.

arrogantrabbit · September 17, 2022, 8:39pm

А чем это поможет?

Сравнивать с играми не стоит, там другие цели. Текстуры (всегда сжатые, кстати) читаются один раз, на старте, и в основном последовательно, поэтому даже если произвольный доступ к файловой системе занимает время (seek latency) для одноразового чтения текстур это несущественно.

Тут ситуация другая: произвольный доступ подразумевается и ожидается с самого начала и до конца; под него надо оптимизировать.

Склеивая файлы можно сделать только хуже: это совсем не поможет уменьшить время доступа к самому файлу (часть которого — чтение метаданных из директории — прекрасно можно закешировать) но зато добавит ещё один seek внутри файла (который закешировать уже не получится)

Получается никаких преимуществ, одни недостатки.