Подсистемы в логировании: зачем нужны и как ими пользоваться

Eduard Mishkurov

2 месяца назад

Подсистемы логирования C++ становятся необходимыми по мере роста проекта, хотя на старте о них почти не задумываются. Почти любой проект начинает с простого логирования. Несколько уровней — debug, info, warning, error — и этого хватает, чтобы понимать, что происходит. Пока код небольшой, лог читается как последовательный рассказ: сначала произошло это, потом это, потом ошибка.

Но по мере роста системы лог перестаёт быть линейным. В него начинают писать разные части приложения: сеть, кэш, фоновые задачи, работа с файлами, интеграции с внешними сервисами. И вот здесь возникает проблема, которая не сразу очевидна.

Сообщений становится много, но хуже всего не их количество. Хуже то, что они теряют структуру. В одном месте ты видишь retry сетевого запроса, рядом — очистку кэша, дальше — что-то про таймеры, потом снова сеть. Формально всё корректно, но читать такой поток становится тяжело.

Обычно на этом этапе пытаются “усилить” логирование. Добавляют уровни, пишут более подробные сообщения, иногда вводят отдельные каналы. Но это не решает главного — отсутствия смысловой группировки.

Лог остаётся плоским.

Почему уровни и каналы не спасают

Уровень отвечает на вопрос “насколько это важно”. Канал — “куда это отправить”. Но ни один из них не говорит “к какой части системы относится сообщение”.

Это ключевой момент.

Иногда возникает идея решить проблему через каналы. Например, завести отдельный канал на каждую подсистему и писать в разные файлы: сеть — в один, кэш — в другой, база — в третий. На первый взгляд это выглядит разумно.

На практике довольно быстро становится видно, что это не работает.

Во-первых, файлов становится слишком много. Вместо одного читаемого лога появляется набор разрозненных файлов, между которыми приходится переключаться.

Во-вторых, теряется важная вещь — контекст. Представим, что обрабатывается конкретный веб-запрос. Мы хотим понять, что происходило именно с ним: какие были сетевые вызовы, что происходило в кэше, были ли ретраи, как вело себя приложение в целом.

Если сеть и кэш пишут в разные файлы, картина распадается. Чтобы собрать её, приходится вручную синхронизировать несколько логов по времени, что неудобно и ненадёжно.

Подсистемы решают эту проблему иначе. Они не разрывают поток логов, а добавляют в него смысловую метку. В результате сообщения остаются в одном месте, но их можно выделить по принадлежности.

Подсистема как третье измерение

Подсистема добавляет в лог ещё одно измерение — смысловое.

В библиотеке logme это короткий тег, который сопровождает каждое сообщение и говорит, к какой части системы оно относится. Не “насколько важно” и не “куда писать”, а именно “кто это сделал”.

В коде это выглядит очень просто:

LOGME_SUBSYSTEM(SUBSID, "net");

void Connect()
{
  LogmeI("connecting to %s", host);
  ...
  LogmeW("retrying connection");
}

И в другом месте:

LOGME_SUBSYSTEM(SUBSID, "cache");

void Put(...)
{
  LogmeD("store item");
}

С точки зрения разработчика почти ничего не изменилось. Но теперь лог можно разрезать не только по уровню, но и по смыслу.

Иногда удобно указать подсистему явно, не полагаясь на контекст. Это может быть полезно в вспомогательных функциях или в местах, где код не привязан к одному модулю:

auto net = Logme::SID::Build("net");
auto cache = Logme::SID::Build("cache");

LogmeI(net, "request started");
LogmeD(cache, "cache lookup");
Такой вариант делает связь ещё более явной и даёт гибкость в нетипичных ситуациях.

Подсистемы логирования C++ на практике

Самый очевидный сценарий — отладка.

Когда возникает проблема, почти всегда она локализована в одной части системы. Но лог при этом содержит всё подряд. Без подсистем остаётся либо читать весь поток, либо пытаться угадывать по тексту сообщений, что относится к нужной области.

С подсистемами задача становится тривиальной. Можно оставить только нужные части системы — например, сеть и HTTP — и временно убрать всё остальное. Лог резко уменьшается, но при этом остаётся информативным.

Важно, что при этом сохраняются уровни. Ты видишь не только ошибки, но и обычные события, которые часто и дают понимание происходящего.

Есть и обратная ситуация. Некоторые части системы генерируют слишком много логов. Кэш, пул соединений, различные внутренние механизмы могут писать большое количество debug-сообщений. Полностью отключать debug не хочется — он нужен в других местах. Подсистема позволяет убрать шум локально, не влияя на остальную систему.

Управление без перезапуска

Когда система работает в production, логирование становится ещё более чувствительным инструментом. Перезапуск ради изменения конфигурации — это уже вмешательство.

Подсистемы позволяют менять видимость логов на лету. Можно в момент возникновения проблемы расширить логирование конкретной области, не затрагивая остальную систему. Это даёт возможность получать нужную информацию именно тогда, когда она появляется, а не пытаться воспроизвести её потом.

И здесь становится понятно, почему важно, чтобы подсистемы были частью самой модели логирования, а не внешним фильтром.

Параллель с kernel-разработкой

Похожая модель давно используется в kernel-разработке под Windows. В DbgPrintEx каждое сообщение имеет не только уровень, но и component ID, например DPFLTR_IHVDRIVER_ID.

Этот идентификатор не про важность и не про вывод. Он про принадлежность. Он говорит: “это сообщение относится к конкретному драйверу или модулю”. Уже внутри этого пространства можно регулировать уровни и детализацию.

Сначала ты отделяешь одну часть системы от другой, и только потом решаешь, сколько деталей тебе нужно.

Подсистемы в пользовательском коде выполняют ту же роль. Они дают тот самый уровень разделения, которого обычно не хватает, когда система становится сложной.

Ограничение в восемь символов — не проблема

В logme имя подсистемы ограничено восемью символами. Это не случайное ограничение, а часть дизайна: идентификатор упаковывается в фиксированный размер, что даёт быстрые сравнения и отсутствие лишних аллокаций.

На практике это означает, что подсистема — это не длинное описание, а короткий тег. Вместо database-cache-layer используются db, cache, net, auth.

Такой формат неожиданно удобен. Лог становится компактнее, а сами подсистемы легче воспринимаются и быстрее фильтруются.

Подсистемы логирования с++ не усложняют код

Добавление подсистем не превращает код в перегруженный метаданными. Обычно они задаются на уровне файла, класса или модуля и дальше используются автоматически.

Разработчик продолжает писать обычные лог-сообщения, не задумываясь о дополнительных параметрах. Подсистема становится частью контекста, так же как канал или уровень.

Это важный момент: инструмент не должен усложнять повседневную работу. Иначе им просто не будут пользоваться.

Итог

Подсистемы логирования C++ появляются не потому, что хочется добавить ещё одну “галочку” в логирование. Они появляются потому, что без них лог перестаёт выполнять свою основную задачу — помогать разбираться в системе.

Когда проект вырастает, одного измерения “важности” уже недостаточно. Нужна возможность видеть систему по частям, а не только целиком.

Подсистемы дают эту возможность. Они возвращают логам структуру, не усложняя код и не ломая существующую модель.

И это тот случай, когда небольшое изменение — короткий тег у каждого сообщения — даёт очень заметный эффект в реальной работе.

Дополнительную информацию на эту тему можно найти в статье Как сделать логи читаемыми: практические приёмы на примере logme