Расчет численности офисного персонала методом КРА (на примере кадровой службы) (Продолжение)
Предлагаем вашему вниманию цикл статей, посвященных нормированию труда офисных работников. Автор статей Александр Кокоткин является опытнейшим специалистом-практиком в области нормирования труда. Свою трудовую деятельность он начинал в 1999 г. на Новолипецком металлургическом комбинате (г. Липецк, Россия). Затем в разные годы трудился в пищевой промышленности (производство мясных продуктов, кондитерская фабрика) и телекоммуникациях. В настоящее время работает экспертом в одном из крупнейших банков России ОАО «Банк Москвы».
А. Кокоткин поделится с читателями секретами своей работы. Читайте внимательно, ведь это – эксклюзивная информация!
(Продолжение. Начало см.: Нормирование и тарификация труда. – 2015. – № 4. – С. 43–50.)
В прошлом номере журнала мы начали изучение метода КРА и привели пример расчета численности работников кадровой службы. Мы рассмотрели первых 2 этапа, заключавшихся в выборе подразделения, определении его функций и составлении перечня факторов, влияющих на численность персонала. Сегодня мы приступаем к третьему этапу.
Этап 3. Сбор и определение пригодности исходных данных для применения корреляционно-регрессионного метода
После того как мы составили предварительный перечень факторов, влияющих на численность работников, мы должны собрать статистические данные по каждому фактору (произвести выборку значений). Определенного ограничения на размер выборки нет, но рекомендуется, чтобы она превышала число факторов, влияющих на численность, в 10 раз. Это правило высшей математики из раздела «Математическое моделирование».
В любом случае это рекомендация. Никто не мешает брать меньшую по размеру выборку. От размера выборки зависит только точность моделирования. Также не забываем про численность персонала каждого подразделения, попавшего в исследования. Данные должны быть за один и тот же период по всем подразделениям.
Результат этого этапа показан в табл. 3.
Таблица 3
Заполненная матрица исходных данных исследуемой функции
Для проверки применимости данной выборки сначала нам нужно проверить ее однородность. Однородность выборки означает, что все ее элементы подчинены одной математической модели (закону). Если же для описания выборки требуются несколько моделей, то выборка неоднородна.
Для проверки однородности выборки нам необходимо для каждого фактора рассчитать коэффициент вариации. Формула коэффициента вариации (Vσ) приведена ниже:
где σ – среднеквадратичное отклонение по выборочной совокупности, которое рассчитывается следующим образом:
В случае если выборка неоднородна, необходимо исключить из нее данные с максимальным отклонением от среднего арифметического. То есть если вы считаете, что какой-то показатель какого-то фактора необходимо исключить из выборки, то удалить нужно всю строку.
Непосредственно из опыта работы
От себя добавлю, что такое действие провожу редко, поскольку найти такое количество данных для выборки очень и очень проблематично. Фиксировать результаты работы у нас нелегко, и очень часто полученные данные берутся с потолка. А поскольку здесь работает принцип «при уменьшении объема выборки падает точность измерения», то приходится идти на всякие ухищрения. Например, при выполнении расчетов по HR-специалистам контрольный показатель коэффициента вариации был увеличен до того уровня, чтобы в выборку попало хотя бы по одному показателю из каждого направления деятельности HR-подразделений.
Все расчеты рекомендую выполнять с помощью MS Excel.
Следующим шагом будет расчет коэффициента корреляции по каждому фактору. Что же нам даст коэффициент корреляции? Коэффициент корреляции покажет нам взаимосвязь между численностью персонала и собственно выбранным фактором. Другими словами, изменение выбранного фактора приведет к изменению численности. Расчет коэффициента корреляции необходимо также провести по каждому фактору по отношению к численности. Я рассчитываю его с помощью функции «CORREL» в Excel. В явном виде формула расчета коэффициента корреляции (cxy) выглядит следующим образом:
Теперь мы должны определить, есть ли связь между фактором и численностью или нет. Для удобства интерпретации коэффициента можно применять вот такую таблицу (см. табл. 4):
Таблица 4
Интерпретация коэффициента корреляции
Непосредственно из опыта работы
На этапе интерпретации коэффициента корреляции может быть допущена самая большая ошибка. Дело в том, что когда к определению факторов привлекаешь экспертов со стороны подразделений, непосредственно выполняющих исследуемую функцию, то, как правило, они начинают включать в матрицу все мыслимые и немыслимые факторы. Конечно, бо′льшая часть из них отбрасывается на этапе получения статистики, но некоторые остаются. Может случиться, что один из них покажет высокий коэффициент корреляции, а это означает, что связь существует и данный фактор подлежит включению в модель. Но здравый смысл вам подсказывает, что эта связь случайна и никакими аргументами объяснить ее невозможно. Как поступать в этом случае? Все просто! Исключайте этот аргумент из выборки. Если же эксперты настаивают, то можно запросить у них дополнительную статистику за другие периоды и провести корреляционный анализ на новых данных. Уверен, что скачки коэффициента корреляции будут очень большими. Вот вам и аргумент для исключения!
Хочу еще раз обратить ваше внимание на объем выборки. Брать статистику за период, когда в подразделениях происходили какие-либо изменения, нет смысла. Лучше, если это период будет относительно спокойным, без всяких новшеств и оптимизаций. И, конечно, период лучше брать продолжительный.
После того как мы получили коэффициенты корреляции по каждому фактору, нам необходимо провести анализ на предмет выявления факторов, линейно зависимых друг от друга. Например, во время исследований в матрицу факторов попали несколько факторов, один из которых являлся суммой двух или нескольких факторов, также вошедших в матрицу исходных данных. Вроде бы такие случаи должны отсеиваться сразу на этапе экспертизы, но это только в идеале. На практике я очень часто сталкиваюсь с тем, что в матрицу исходных данных попадают в т.ч. и производные от какого-то основного фактора. Поэтому поступать нужно так. Если у вас коэффициент корреляции высок, но вы уверены, что факторы независимы друг от друга, то в качестве проверки возьмите дополнительную выборку данных. Если связь снижается, то фактор оставляем, если же увеличивается или постоянна, то однозначно исключаем.
Все результаты сравнения факторов между собой удобно показывать в корреляционной матрице (см. табл. 5).
Таблица 5
Заполненная матрица исходных данных исследуемой функции
Для удобства представления информации вы можете добавить в данную матрицу еще один столбец, который будет показывать коэффициент корреляции каждого фактора с численностью работников.
Выбираем из табл. 5 пары факторов, коэффициент корреляции которых превышает 0,7. Этот коэффициент называется парным коэффициентом корреляции. Начинаем анализировать каждую пару факторов. Один из них мы должны исключить. Смотрим, какой из пары фактор имеет наиболее высокую корреляцию с нашей численностью. Его оставляем. Если один из факторов входит в несколько пар, но оказывает наиболее высокое влияние на численность, однозначно его оставляем, а оставшиеся исключаем из нашей матрицы.
В итоге у нас с вами должна получиться матрица из нескольких факторов, имеющих максимальные коэффициенты корреляции, и собственно сама численность.
Для оставшихся независимых факторов устанавливается степень влияния каждого из них на значение численности. С этой целью по столбцу корреляции факторов с численностью вычисляются коэффициенты детерминации. Коэффициент детерминации равен квадрату парного коэффициента корреляции:
где i = 1;
j = 2, …m;
m – число факторов.
Коэффициенты детерминации располагаются в порядке убывания, и по полученным значениям строится график. Для определения факторов, максимально влияющих на значение численности, исследуется форма графика. Как правило, график имеет четкий разрыв между крутой частью кривой (здесь коэффициентом детерминации факторов с численностью свойственны большие значения) и плавно убывающей частью (здесь значения соответствующих коэффициентов почти равномерно уменьшаются). В регрессионное уравнение включаются факторы, коэффициенты детерминации которых лежат на крутой части построенного графика.
В результате корреляционного анализа определяется минимальный набор факторов, подлежащих включению в регрессионную модель.
Пример
Этап 3. Сбор и определение пригодности исходных данных для применения корреляционно-регрессионного метода
После того как был составлен перечень факторов, влияющих на численность (см.: Нормирование и тарификация труда, 2015, № 4, с. 49–50), он был направлен в региональные подразделения для подготовки статистических данных за полгода. Также регионам было предложено дополнить перечень факторов своими факторами, которые, на их взгляд, оказывают существенное влияние на численность HR-сотрудников.
После того как все данные были получены, проводилась оценка этой выборки на однородность, для чего были рассчитаны коэффициенты вариации по каждому фактору. Результаты сведены в табл. 6.
Таблица 6
Коэффициенты вариации значений потенциальных факторов
Коэффициент вариации значений численности (Количество работников ОРП/СРП регионального подразделения) равен 25 %.
Я говорил уже, что однородной можно считать такую выборку, коэффициент вариации которой не превышает 33 %. Как видно из табл. 6, однородной можно считать информацию только по 3 факторам: «Количество контрольных процедур, исполненных работниками ОРП/СРП регионального подразделения за период», «Количество наименований должностей в региональном подразделении», «Количество работников регионального подразделения на дату» – и собственно саму зависимую переменную «Количество работников ОРП/СРП регионального подразделения». Неоднородную информацию нужно было привести к однородной путем исключения максимальных и минимальных значений из совокупности выборки (случайных выбросов), т.е. надо исключить из дальнейшего исследования те территориальные управления, в статистических данных которых присутствуют выбросы. Однако в процессе исключения статистических данных с максимальными и минимальными значениями объем нашей выборки станет катастрофически убывать, а это в свою очередь скажется на точности данных. С другой стороны, факторы, по которым выборка была однородна, не отражали всю деятельность подразделений. Поэтому было принято решение об увеличении коэффициента вариации до того уровня, который бы позволил включить нам в выборку хотя бы по одному фактору в каждом направлении деятельности. Таким уровнем коэффициента вариации стал уровень в 61 %. Итоговая выборка включала в себя 12 факторов и статистику по 33 территориальным управлениям.
Следующий шаг – определение факторов, подлежащих включению в регрессионную модель. Для этого рассчитаем парные коэффициенты корреляции между численностью персонала и каждым фактором, а также коэффициенты корреляции между факторами, т.е. сравним факторы между собой. Результат сведем в таблицу «Корреляционная матрица исходных данных» (см. табл. 7).
Корреляционная матрица представляет собой таблицу, в строках и столбцах которой перечислены зависимая переменная («Количество работников ОРП/СРП регионального подразделения») и независимые переменные (факторы, влияющие на численность). На пересечении строк и столбцов находятся парные коэффициенты корреляции, которые определяют меру статистической взаимосвязи соответствующих величин (изменение значений из одного набора данных приводит к изменению значений из другого набора). Понятно, что для одного и того же набора значений парный коэффициент корреляции всегда будет равен 1, поэтому на главной диагонали матрицы стоят единицы. Корреляционная матрица симметрична относительно главной диагонали, поэтому значения в верхней части таблицы не указываются (они равны соответствующим значениям из нижней части).
Таблица 7
Корреляционная матрица исходных данных
Одним из условий отбора факторов для построения регрессионной модели является независимость факторов друг от друга, так как одновременное включение линейно зависимых факторов ухудшает характеристики регрессионной модели в целом и искажает значения коэффициентов регрессионного уравнения. Факторы считаются допустимыми ко включению в модель, если значения всех парных коэффициентов корреляции между ними не превосходят по модулю 0,7. В полученной матрице коэффициенты, не удовлетворяющие этому условию, выделены жирным шрифтом. Статистически сильно зависимыми являются 4 пары факторов (см. табл. 8).
Таблица 8
Пары статистически зависимых факторов
Далее из каждой пары коррелируемых факторов необходимо исключить фактор, имеющий меньший коэффициент корреляции со значением численности (значения коэффициентов корреляции соответствующих факторов с численностью приведены в первом столбце корреляционной матрицы) (см. табл. 9).
Таблица 9
Анализ пар статистически зависимых факторов
Как видно из табл. 9, в двух случаях коэффициенты корреляции каждого фактора из пары с численностью равны, т.е. нельзя сделать однозначный вывод о том, какой фактор подлежит исключению. В такой ситуации заключение делается по неосновным (вспомогательным) признакам, примером чего могут служить заключения по соответствующим факторам из табл. 9.
Таким образом, из 12 факторов, отобранных путем установления логической зависимости между численностью и факторами, к дальнейшему исследованию принимаются 8.
Следующим шагом является определение перечня факторов, максимально влияющих на численность. С этой целью для 8 независимых факторов необходимо вычислить коэффициенты детерминации каждого из них со значением численности. Коэффициент детерминации равен квадрату соответствующего парного коэффициента корреляции (см. табл. 10).
Таблица 10
Коэффициенты детерминации статистически независимых факторов
Для проведения дальнейшего отбора факторов для регрессионной модели необходимо построить график по расположенным в порядке убывания значениям коэффициентов детерминации. Включению в регрессионную модель подлежат факторы, значения коэффициентов детерминации которых будут лежать на крутой части графика.
На полученном графике наблюдаются 2 места четкого разрыва между крутой и плавно убывающей частями кривой (при значении коэффициента детерминации 0,160 и 0,090). В подобных ситуациях (когда мест разрыва больше одного) необходимо принять решение, какой разрыв будет взят в качестве отправной точки для дальнейшего анализа. В данной ситуации есть смысл рассматривать разрыв в точке 0,090 (фактор «Количество работников регионального подразделения, являющихся участниками ситемы МВО»), так как в этом случае факторами будет охвачено больше направлений деятельности HR. А это значит, что факторы, коэффициент детерминации которых меньше 0,09, отсекаются.
Таким образом, ко включению в регрессионную модель отобрано 6 факторов:
– количество работников регионального подразделения на дату;
– количество наименований должностей в региональном подразделении;
– количество работников регионального подразделения, прошедших внешнее обучение;
– количество работников регионального подразделения, которым осуществлены СТВ;
– количество работников регионального подразделения, являющихся участниками системы МВО;
– количество заявок на подбор, поступивших в ОРП/СРП регионального подразделения.
(Продолжение следует.)