Контур Компонентс создал решение для расчета показателей рынка труда на основе данных Пенсионного Фонда

Москва, 30 декабря 2020 года

Компания «Контур Компонентс» в 2020 году выполнила серию государственных контрактов в Росстат, в результате которых на платформе Contour BI было создано решение "Показатели рынка труда Российской Федерации".

В хранилище данных Contour DW были загружены деперсонифицированные административные данные Пенсионного Фонда РФ о выплатах заработной платы.

В массиве содержится более пяти миллиардов уникальных записей, это каждая выплата каждому работнику с 2017 года, сделанная каждым работодателем.

Также в систему были загружены деперсонифицированные списки всех работников и всех предприятий и индивидуальных предпринимателей с их основными характеристиками. На текущий момент это самый большой информационный ресурс, обрабатываемый Росстатом.

В Contour BI были рассчитаны 25 показателей рынка труда по методике Росстата. Это такие показатели как средняя заработная плата, медианная заработная плата, количество предприятий, фонды заработной платы предприятий, численность сотрудников предприятий, численность совместителей, число рабочих мест, а также сложные показатели, такие как средняя оплата труда по децильным группам, коэффициент дифференциации по среднемесячному размеру оплаты труда, децильный коэффициент дифференциации, коэффициент Джинни и другие.

Расчеты выполнялись с использованием OLAP сервера платформы Contour BI, многомерно, то есть все показатели были рассчитаны в нескольких разрезах, по каждой отрасли, региону, полу, возрасту работников. Был настроен комплект интерактивных информационных панелей для визуализации показателей в многомерных таблицах, графиках и диаграммах, картах.

Этот первый проект в РФ в новой отрасли статистики – статистики на основе административных данных. В классической статистике данные собираются методом выборочных или сплошных статистических наблюдений, а также переписей. Статистика на основе административных данных получается путем повторного использования учетных и мониторинговых данных, собираемых другими ведомствами в процессе выполнения имя своих функций.

Появление этого вида статистики стала возможным в результате развития информационных технологий.

Полученные результаты позволили выполнить другие проекты. В проекте "Миграция" были рассчитаны количество трудовых мигрантов в разрезе отраслей, регионов, стран происхождения, половозрастных групп, их средние и медианные заработные платы.

В дальнейшем данные Пенсионного Фонда были обогащены данными Статистического регистра Росстата, что позволило уточнить результаты расчетов показателей рынка труда в отраслевом и региональном разрезе.

Обновление данных и расчеты актуальных значений этих показателей в настоящее время выполняются регулярно.