Статистика — сложная наука, кажущаяся чем–то таинственным и непонятным для нормального человека. Даже международный день статистики отмечается не каждый год, а раз в 5 лет, 20 октября. Нынешний год — как раз "праздничный". В честь этого "Деловой Петербург" побеседовал с руководителем Управления Федеральной службы государственной статистики по Санкт–Петербургу и Ленинградской области (Петростат) Александром Кукушкиным.
Проблемы интерпретации
Росстат — главная, но не единственная организация, занимающаяся государственной статистикой. Иногда это даже вызывает некоторую путаницу у стороннего наблюдателя. Как вы к этому относитесь? Должна ли быть монополия на статистику?
— Если под монополией понимаем, чтобы один орган занимался всей государственной статистикой, то я скорее положительно к этому отнесусь. Статистика, как и ряд других направлений деятельности государства, требует централизации, единых стандартов, методологии.
Сегодня есть Росстат и ещё 59 субъектов статистического учёта, например Росреестр, Росводресурсы, Банк России и даже ФСБ России. На Росстат приходится примерно две трети всех работ, определённых правительством России для формирования данных. Помимо этого, Росстат согласовывает методологию для других субъектов статучёта и утверждает формы наблюдения. А дальше ведомства автономны в формировании статпоказателей. Вместе с тем мы постоянно используем их данные, чтобы включать в свои сводные публикации. Потому что система показателей — многоуровневая. Один и тот же показатель участвует во многих расчётах. И если мы видим какие–то расхождения, то вместе разбираемся, но это происходит в рабочем порядке.
Естественно, возникает вопрос: не поощряет ли отсутствие конкуренции злоупотребления? Если всё в одних руках, то и манипулировать с данными проще...
— По рейтингу Счётной палаты Росстат занимает третье место среди федеральных органов исполнительной власти по уровню открытости. Мы следуем принципу прозрачности, нас можно и нужно контролировать со стороны: иметь возможность узнать, как показатели были сформированы. 16 сентября был впервые принят ГОСТ "Качество данных официального статистического учёта". В нём прописано, что к каждому показателю должен прилагаться паспорт с обязательным указанием источников, на основе которых этот показатель сформирован, используемая методика, периодичность расчёта и метрика качества. Качество — это пригодность статданных для принятия решений. Это то, для чего мы работаем. ГОСТом установлено несколько критериев качества: точность, достоверность, полнота, своевременность и интерпретируемость. Это как раз о том, чтобы люди могли легко понять, что собой представляет тот или иной показатель. Под каждый из них должна быть методология — понятная для нормального человека, не только для экономиста.
Что в знаменателе?
Средняя зарплата — статистический показатель, который всех очень волнует, и каждая публикация на эту тему вызывает бурную общественную реакцию. Как эти средние зарплаты считаются? И все ли области деятельности, отрасли экономики ваши подсчёты охватывают?
— Они охватывают все виды деятельности, но с разной периодичностью. И наблюдаются территориальными органами Росстата по организациям, кроме малых, ежемесячно. А например, обобщённые данные по денежному довольствию военнослужащих поступают ежегодно, и не к нам, а напрямую в центральный аппарат Росстата.
Получается, малый и микробизнес не учитывается?
— Как рассчитываются показатели по полному кругу респондентов? К показателям, сформированным по крупным и средним организациям, применяются коэффициенты досчёта. Основа для них — результаты выборочных наблюдений малых предприятий, которые проводятся ежеквартально и ежегодно. Под этот досчёт, естественно, есть методика.
Стоит напомнить, что показатели по зарплате тоже бывают разными — по полному кругу, по крупному и среднему бизнесу, по видам деятельности, по формам собственности. Как правило, мы все оперируем одной величиной — средней зарплатой по экономике в целом. Я считаю, она вполне достоверна как сумма зарплат и других выплат наёмным работникам, делённая на среднесписочную численность. Но, наверное, когда теоретики статистики, учёные думали над названием много лет назад, они не ожидали, что люди будут говорить: "Вот я, средний человек, вот моя зарплата, и она вообще не похожа на то, что вы там публикуете!" Очень важно понимать, говоря об интерпретации, что средняя зарплата — это не зарплата среднего человека.
Но ведь это естественно, что люди сравнивают всё со своим личным опытом. И когда видят несовпадения, их это раздражает. То же самое и с инфляцией происходит — разница между официальной и субъективно ощущаемой...
— Просто у каждого своя структура потребления. И та универсальная структура, утверждённая правительством, которую мы используем в расчётах, — она для кого–то ближе, для кого–то дальше. Но нам нужна именно она. Если это представить в виде графика с множеством точек, то нам нужно такую линию провести, чтобы суммарное число отклонений этой линии от каждой из точек было как можно меньше. И эта линия может даже ни по одной из точек не пройти. То есть, может быть, вообще не существует ни одного человека из 146 млн сограждан, которому эта единая структура потребления полностью бы соответствовала. И это нормально. А как иначе? С социально–экономическими явлениями всегда очень непросто.
Но все же хотят, чтобы всё было, во–первых, максимально точно, а во–вторых, совпадало с той реальностью, которую мы видим вокруг...
— Это понятно. Но представьте, что это вам надо рассчитать какой–нибудь показатель. Сразу же возникнет масса вопросов. Вот, например, возьмём уровень аварийности на дорогах. Как его рассчитать? Допустим, в числитель мы поставим количество ДТП. А что в знаменатель? Численность населения — один вариант. А может быть, лучше протяжённость автомобильных дорог, на которых эти ДТП происходят? Или количество автотранспорта? Идеально подошло бы суммарное время, проводимое автомобилями на дорогах. В авиации используется отношение числа аварий к общему налёту. Но у них легко это посчитать — достоверно известно, сколько каждый самолёт проводит в воздухе. А с автомобилями этого не сделаешь.
Или другой пример — плотность населения. Вроде бы здесь вообще всё просто. Делишь численность населения на площадь территории. А на какую именно площадь? Считая водоёмы или только сушу? Вот у нас есть площадь Ленинградской области — 83,9 тыс. км2, она в себя включает части Ладожского и Онежского озёр, Финского залива и других водоёмов, в сумме на них приходится 12,8% площади региона. Надо ли площадь акваторий учитывать при расчёте плотности населения? Элементарный вопрос, казалось бы, но он тоже требует подхода. То есть надо принять решение и прописать его в методологии.
В поисках медианы
Если вернуться к зарплатам, то вас как–то спрашивали депутаты ЗакСа, почему бы не публиковать медианную зарплату, ведь она более показательна, чем средняя. В чём здесь сложность?
— Я напомню, что медиана — это величина, которая делит ранжированный ряд пополам. Половина единиц этого ранжированного ряда имеет значение больше медианы, а половина — меньше. То есть, чтобы построить такой ряд в случае с зарплатами, нам нужно знать зарплату каждого человека. Но Росстат зарплату каждого человека не видит, только сводные данные по респондентам: сумму зарплат и численность работников. Кто видит? Видит ФНС и Соцфонд. Вот на основе данных Социального фонда и рассчитывается медианная зарплата по стране. И там появляется нюанс, который препятствует расчёту медианной зарплаты по регионам. Соцфонд фиксирует данные о зарплатах по юрлицам без учёта территориально обособленных подразделений. И, допустим, вся "Газпром нефть" будет относиться к Санкт–Петербургу. А это не так, потому что у неё есть подразделения. Поэтому медианная зарплата рассчитывается на федеральном уровне. В 2024 году в России средняя зарплата составила 89,1 тыс. рублей, а медианная — 56,4 тыс. рублей. При принятии решений надо учитывать оба показателя.
Мы мельком коснулись того, что данные малого бизнеса во многих показателях не учитываются. Но ведь в этой сфере занято огромное количество людей. Разве это не вносит искажений в общую картину?
— Когда написано "без учёта данных по субъектам малого предпринимательства", то речь о том, что конкретно для формирования этой величины данные по МСП не учитывались или они не рассчитывались. В макроэкономических показателях, безусловно, малый бизнес учитывается. Это касается почти всех отраслей. После того как собрали данные по крупным и средним, если не предусмотрено сплошное наблюдение, то выполняется досчёт, и эта информация тоже публикуется. Говорить, что мы малый бизнес не замечаем или не учитываем, — я с этим не соглашусь.
Сейчас существуют два вектора. Первый состоит в том, чтобы снижать нагрузку на малый бизнес. Второй — чтобы получать больше данных. Вскоре малый бизнес должен перейти на предоставление первичных данных не по отчётности, как сейчас, а по показателям. Когда будет введена в строй "Цифровая аналитическая платформа" (ГИС, разрабатываемая Росстатом и Минцифры России), представители малого бизнеса должны будут в личном кабинете заполнять отдельные показатели. Их будет меньше, чем для крупного бизнеса. Это вопрос ближайшего будущего.
Продолжая разговор про сложно учитываемые вещи, хочется вспомнить онлайн–торговлю, которая у нас бурно развивается. Как вы считаете её, насколько учитываете?
— В действующих формах статнаблюдения есть строка о продаже товаров через интернет. Кроме того, есть специальная форма статнаблюдения для маркетплейсов. Статистика по объёму и доле интернет–торговли формируется и по России, и по субъектам. Например, в 2024 году доля продаж через интернет в обороте розничной торговли в среднем по России составила 15,2%, по Москве — 45,1, по Санкт–Петербургу — 31,6%. Так что онлайн–торговлю мы видим и учитываем.
Ошибка на миллион
Точность статистики сильно зависит от качества первичных данных. Часто ли ваши респонденты допускают ошибки и что вы предпринимаете, чтобы это случалось реже?
— Да, такое случается. Часто респондент, желая дать нормальные данные, просто ошибается — например, в единицах измерения и вместо тысяч ставит миллионы или наоборот. Тогда мы фиксируем аномалию, отличающуюся от нормы на три порядка. Сопоставляем по респонденту первичные данные отчётного периода с данными предыдущих периодов. Сверяем со средним значением по этому виду деятельности или по этой группе организаций. Сравниваем динамику явления по одному респонденту со средней динамикой по совокупности респондентов. Если выявляем что–либо не вписывающееся в общую картину, то запрашиваем у респондента подтверждение. Нередко респонденты и сами сообщают о найденных ошибках, тогда мы корректируем данные. Чем раньше это происходит, тем лучше для всех.
И конечно, мы применяем штрафы. Для нас в КоАП РФ есть статья 13.19 о нарушениях при предоставлении первичных статданных. Наше управление уже несколько лет на первом месте по количеству таких дел среди всех территориальных органов. Но делаем мы это с единственной целью — повысить качество первичных данных и формируемой на их основе статинформации.
Государственная статистика во всём мире выступает не как контрольный или надзорный орган, а наоборот — как служба, куда респондент может без каких–либо опасений сообщить первичные данные. И они будут использованы только для того, чтобы сформировать обобщающие показатели. Если вверху бланка формы статнаблюдения написано "Конфиденциальность гарантируется получателем информации", значит эти данные находятся под защитой ст. 9 Федерального закона от 29.11.2007 № 282–ФЗ "Об официальном статистическом учёте и системе государственной статистики в Российской Федерации".
Разумеется, не могу не спросить про искусственный интеллект. Может ли он вам как–то пригодиться для анализа? И пытаетесь ли вы его уже как–то внедрять?
— Искусственный интеллект, безусловно, нужен, для него у нас много работы. Проводился эксперимент по обработке больших данных, состоявший в том, чтобы убрать человека из процесса регистрации цен. В стране есть множество фискальных данных, которые нужно правильно распознать и обработать. Мы участвовали в работе по разметке этих данных. Ведь один и тот же товар в разных организациях торговли может называться совершенно по–разному. И требуется также, чтобы в фискальных данных были все необходимые нам атрибуты: наименование, единица измерения, цена, количество, стоимость, признак применения скидки к товару (так как мы наблюдаем цены без учёта скидок). Для этого нужно, чтобы были единые требования к фискальным данным. Резюмируя, скажу, что в скором будущем практическое промышленное применение ИИ в госстатистике неизбежно.
Ничто не пугает
Бизнес активно применяет ИИ в том числе для решения проблемы кадрового дефицита. Для органов статистики, насколько я понимаю, кадровый голод — тоже суровая реальность?
— Кадровый дефицит сейчас испытывает большинство организаций, мы не исключение. И у нас есть свои особенности. Мы интересны тем, кто хочет работать на государство, кому важна возможность приносить пользу обществу. Тем, кому нравятся системы, нравится чувствовать себя частью чего–то большого, кто любит цифры, конечно. Важно желание анализировать данные, вникать в детали, их у нас очень много. А оборотная сторона — в том, что у нас нет больших зарплат, ДМС или каких–либо льгот.
Но вот весной этого года я выступал перед студентами РАНХиГС. Из зала человек в пятьдесят одна талантливая девушка с нашими ценностями проявила заинтересованность — и сейчас она у нас работает, продолжая учиться. Уверен, что в каждой случайно отобранной группе из 20 человек всегда есть хотя бы один наш потенциальный коллега. Человек, которому нужны мы и который нужен нам. Эти люди были, есть и будут, надо их просто найти. Поэтому, несмотря на сложности, я убеждён, что коллектив статистиков будет развиваться при условии, что мы будем активными, будем больше и чаще рассказывать о себе и делать это интересно, искренне и честно.
А вы сами почему в своё время пошли в статистику, что вас привлекло?
— Когда я учился в ФИНЭКе, полюбил статистику за её фундаментальность, системность и универсальность. Три года у меня была одна сплошная статистика в самых разных её вариантах: экономическая, социальная, финансов, бизнеса… А вот пиара профессии никакого не было. Наоборот, все боялись: что за статистика такая? Но зато вся кафедра состояла и состоит из людей, которые любят своё дело. И это чувствовалось во всём. Для меня это очень важно.
После того как ты закончил статистику, ты совершенно свободно обращаешься с любыми объёмами числовых данных, ничто не пугает. Я после вуза работал в коммерческой организации, которая разрабатывала и поддерживала свою ERP–систему. А я был специалистом по внедрению. Приходим командой в один крупный НИИ, моя задача — автоматизация учёта основных средств. А там десятки тысяч самых разных объектов. Я это всё вижу первый раз в жизни. Ну и ладно — я всё проранжировал, сгруппировал, рассчитал описательную статистику, изучил и составил для себя целостное впечатление об этом массиве. Мне всё это понятно стало очень скоро. Это один из важнейших эффектов и результатов статистического образования. Люди с правильной школой, если в них это вложили, потом приходят в любую отрасль, связанную с числовыми данными, и спокойно работают. И кстати, легко и быстро выявляют ошибки в больших объёмах данных, не прибегая ни к каким расчётам и инструментам, используя только собственные знания и навыки.

