Упал объем передаваемого трафика. Помогите разобраться

arrogantrabbit · April 28, 2023, 7:32pm

В этом случае я думаю это не будет лишним.

Вот пример: Database issue (No such table)

Если бы нода проверила integrity каждой базе на старте, и пересоздала поломанные (можно еще dismissible сообщение в дашборде написать — we detected database corruption and re-created the affected databases. Some statistic will be lost”, и послать имейл) — не было бы того топика и даунтайма ноды. И не пришлось бы сотрудникам Сторж объяснять в сотый раз как сделать вручную то, что нода должна была бы сделать сама.

Это звучит красиво в теории, но мы оба знаем, что операторы, которые позволяют базам испортится, сделают ровным счетом ничего чтобы это не повторилось в будущем. По крайней мере, подавляющее большинство. И уж точно у них не будет бекапа.

Uptime важнее косметической статистики.

Можно скопировать испорченную базу куда нибудь

Сообщение в дашборде это решает. Эппл так делает с Time Machine: если пользователи бекапят на non-compliant SMB сервер и sparse bundle портится — тайм машина уведомляет пользователя что она начинает бекап сначала чтоб исправить повреждения.

Пожалуйста, передайте эту идею команде