ПРИМЕНЕНИЕ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ ДЛЯ АНАЛИЗА ПРОИЗВОДСТВЕННЫХ ПОКАЗАТЕЛЕЙ НА ПРЕДПРИЯТИЯХ
Харисова Алсу Фанисовна1, Бакуменко Людмила Петровна2 1Поволжский государственный технологический университет, магистрант 1 курса направления «Прикладная информатика» 2Поволжский государственный технологический университет, научный руководитель
Аннотация Рассматривается группировка производственных показателей строительных предприятий путем применения метода главных компонент.
APPLICATION OF PRINCIPAL COMPONENT ANALYSIS FOR THE PERFORMANCE INDICATORS IN ENTERPRISES
Kharisova Alsu Fanisovna1, Bakumenko Lyudmila Petrovna2 1Volga State University of Technology, graduate student of master course "Applied Informatics" 2Volga State University of Technology, scientific director
Abstract We consider the group of performance indicators of construction enterprises by applying the method of principal components.
Библиографическая ссылка на статью:
Харисова А.Ф., Бакуменко Л.П. Применение метода главных компонент для анализа производственных показателей на предприятиях // Экономика и менеджмент инновационных технологий. 2017. № 2 [Электронный ресурс]. URL: https://ekonomika.snauka.ru/2017/02/13907 (дата обращения: 12.04.2021).
Объектом исследования в данной работе является производственные показатели строительных компаний России [4].
В зависимости от конкретных задач, решаемых в экономике, или в другой сфере, используется один из методов факторного анализа.
Главными целями факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных, или как метод классификации.
В данной работе рассматривается трудоемкость единицы продукции и 13 производственных показателей по 53 предприятиям. А именно, х1 -удельный вес рабочих в составе ППП; х2 - удельный вес покупных изделий; х3 – коэффициент сменности оборудования; х4 – премии и вознаграждения на одного ребенка; х5 – удельный вес потерь от брака; х6 – фондоотдача; х7 – среднегодовая численность ППП; х8 – среднегодовая стоимость ОПФ; х9 – среднегодовой фонд заработной платы ППП; х10 – фондовооруженность труда; х11 – оборачиваемость нормируемых оборотных средств; х12 – оборачиваемость ненормируемых оборотных средств; х13 – непроизводственные расходы.
Для установления связи между трудоемкостью единицы продукции и производственными показателями предлагается использовать модели, построенные на основе главных компонент. Для реализации поставленной задачи был выбран метод главных компонент.
Метод главных компонент (разложение Карунена-Лоева, principal component analysis, PCA) является простейшим методом уменьшения размерности в данных. Идея метода заключается в поиске в исходном пространстве гиперплоскости заданной размерности с последующим проектированием выборки на данную гиперплоскость. При этом выбирается та гиперплоскость, ошибка проектирования данных на которую является минимальной в смысле суммы квадратов отклонений [1].
В качестве математического инструментария использован пакет Statistica. Statistica — это инструмент разработки пользовательских приложений в бизнесе, экономике, финансах, промышленности, медицине, страховании и других областях [2].
Сначала рассмотрим собственные значения исходных данных, которые представлены в таблице 1.
Таблица 1 – Собственные значения
Собственные значения (Книга2.sta) Выделение: Главные компоненты
Соб. зн.
% общей
Кумулятивн.
Кумулятивн.
1
4,086894
31,43764
4,006894
31,43764
2
2,492696
19,17459
6,579590
50,61223
3
1,768198
13,60152
8,347788
64,21375
4
1,026525
7,89634
9,374312
72,11009
Дисперсии, выделяемые факторами, названы собственными значениями. В третьей колонке для каждого фактора приводится процент от общей дисперсии. В соответствии с критерием Кайзера (Kaiser, 1960), необходимо оставить факторы с собственными значениями больше 1 [2]. Из таблицы 1 видно, что все значения больше единицы. Отсюда следует, что можно выделить четыре основных фактора.
Построим график каменистой осыпи, или собственных значений (рис. 1). Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем (Cattell, 1966). [3] По графику можно выделить четыре основных фактора. Осыпание наиболее существенно замедляется на 4 точке, следовательно, можно ограничиться 4 факторами.
Рисунок 1 – График каменистой осыпи
Определим факторные нагрузки, выделим переменные, которые коррелируют с главной компонентой от 0,7.
Таблица 2 – Факторные нагрузки (без вращения оси)
Фактор.нагрузки (без вращ.) (Таблица_данных1_(Восстановлен)) Выделение: Главные компоненты (Отмечены нагрузки >,700000)
Фактор 1
Фактор 2
Фактор 3
Фактор 4
х1
0,650273
-0,497327
0,445088
0,000543
х2
-0,064989
0,535127
0,571538
0,43425
х3
0,670449
-0,210036
-0,126827
0,010486
х4
0,635595
0,003085
-0,101005
-0,027959
х5
0,361793
-0,548121
-0,117123
-0,362264
х6
-0,347851
0,123075
0,755183
0,052948
х7
0,635541
0,651722
0,130384
-0,33006
х8
0,748499
0,510249
-0,059426
0,058335
х9
0,554844
0,643937
0,148617
-0,426983
х10
0,627764
0,021833
-0,436233
0,43693
х11
-0,609654
0,254227
-0,405016
-0,177943
х12
-0,461286
-0,167791
0,257895
-0,430679
х13
-0,551246
0,6374
-0,411906
-0,017531
Общ.дис.
4,086894
2,492696
1,768198
1,026525
Доля общ
0,314376
0,191746
0,136015
0,078963
Из таблицы 2 видно, что второй и четвертый фактор оказались не загруженными, следовательно, необходимо произвести вращение факторов (табл. 3).
Таблица 3 – Факторные нагрузки (после вращения)
Фактор.нагрузки (Варим. исх.) (Таблица_данных1) Выделение: Главные компоненты (Отмечены нагрузки >,700000)
Фактор 1
Фактор 2
Фактор 3
Фактор 4
х1
0,102537
0,923366
0,041689
-0,05863
х2
0,187883
-0,0391
-0,87689
0,00639
х3
0,231696
0,459897
0,281505
-0,40667
х4
0,373192
0,323958
0,187732
-0,36812
х5
-0,00176
0,468851
0,596014
0,03505
х6
-0,05484
0,121708
-0,63256
0,53972
х7
0,968062
0,048241
-0,06763
-0,10272
х8
0,74091
0,113601
-0,09607
-0,50642
х9
0,962087
0,01076
-0,0315
0,01371
х10
0,129635
0,146654
0,116189
-0,85086
х11
-0,15456
-0,73884
0,153041
0,19701
х12
-0,15352
-0,05434
0,087862
0,67727
х13
0,059724
-0,93079
-0,0982
0,02343
Общ.дис.
2,72131
2,857284
1,709616
2,0861
Доля общ
0,209332
0,219791
0,131509
0,16047
Цель вращения – получение простой структуры, при которой большинство наблюдений находится вблизи осей координат. При случайной конфигурации наблюдений невозможно получить простую структуру. Возможен выбор различный поворот оси. Выберем вращение квартимах исходный, то есть вращаемые нагрузки не нормализированы.
По-видимому, первый фактор более коррелирует с переменными, чем второй, третий и четвертый. Это следовало ожидать, потому что факторы выделяются последовательно и содержат все меньше и меньше общей дисперсии.
Факторы можно представить в виде трех ортогональных координатных осей. Если на этих осях отметить значения факторных нагрузок, соответствующих каждому из 13 нормированных показателей, то получим 13 точек, каждая из которых характеризует одну из строк матрицы . В результате имеем следующий график на рисунке 2.
Рисунок 2– Факторные нагрузки
В итоге получаем четыре главных компоненты. Первая главная компонента коррелирует со следующими показателями: Х7 – среднегодовая численность ППП, Х8 – среднегодовая стоимость ОПФ, Х9 – среднегодовой фонд заработной платы ППП. Поэтому данную компоненту назовем показатели ресурсов предприятия.
Вторая главная компонента коррелирует со следующими показателями: Х1 – удельный вес рабочих в составе ППП, Х11 – оборачиваемость нормируемых оборотных средств, Х13 – непроизводственные расходы. Поэтому данную компоненту назовем показатели трудовых затрат.
Третья главная компонента коррелирует со следующими показателями: Х2 – удельный вес покупных изделий. Поэтому данную компоненту назовем удельный вес покупных изделий.
Четвертая главная компонента коррелирует со следующими показателями: Х10 – фондовооруженность труда. Поэтому данную компоненту назовем фондовооруженность труда.
Рассчитаем коэффициент информативности главных компонент. Затем получаем таблицу 4 с факторными нагрузками.
Таблица 4 – Факторные нагрузки
Фактор 1
Фактор 2
Фактор 3
Фактор 4
Х1
0,173096
-0,004457
0,880747
0,010706
Х2
0,214858
0,452844
-0,29915
0,411206
Х3
0,357599
0,321999
-0,197624
0,379946
Х4
0,005037
0,446307
-0,612551
-0,043018
Х5
-0,045094
0,143003
0,6327
-0,53522
Х6
0,961173
0,062066
0,08063
0,142786
Х7
0,716604
0,126889
0,098267
0,5369
Х8
0,960981
0,022901
0,047158
0,025974
Х9
0,095264
0,145959
-0,129072
0,853658
Х10
-0,135797
-0,746241
-0,125739
-0,202198
Х11
-0,123634
-0,061093
-0,0806
-0,683681
Х12
0,068863
-0,925824
0,133994
-0,016684
Х13
0,090889
0,922452
-0,074967
0,059111
Коэф.инорм.
90,01549
49,8095
44,05693
33,86291
Как видно из таблицы 4, фактор 1 (показатели ресурсов предприятия) имеет наибольшую информативность, а значит, он оказывает наибольшее влияние на трудоемкость единицы продукции. Наименьшую информативность имеет составляющая фондовооруженность труда.
Таким образом, после сокращения размерности 13 переменных, характеризующих трудоемкость единицы продукции, наиболее значимыми факторами оказались: составляющая показатели ресурсов предприятия, составляющая показатели трудовых затрат, составляющая удельный вес покупных изделий и составляющая фондовооруженность труда.
Построим регрессию, где зависимыми переменными станут значения факторов. В качестве зависимой переменной укажем «Трудоемкость единицы продукции» (У), в качестве независимых – все остальные. Были получены результаты в виде «Итоговой таблицы регрессии» (Табл. 5). Все переменные в регрессионной модели значимы (p-уровень < 0.05 – подсвечены красным цветом).
Таблица 5 – Итоги регрессии факторного анализа
Итоги регрессии для зависимой переменной: y (факторный) R= ,79767179 R2= ,63628029 Скорректир. R2= ,60597031 F(4,48)=20,992 p<,00000
N=53
БЕТА
Стд.Ош.
B
Стд.Ош.
t(48)
p-уров.
Св.член
0,302453
0,009095
33,25452
0
f1
-0,401797
0,087049
-0,042383
0,009182
-4,61577
0,000029
f2
-0,349279
0,087049
-0,036843
0,009182
-4,01245
0,00021
f3
-0,357021
0,087049
-0,037659
0,009182
-4,10139
0,000158
f4
-0,474741
0,087049
-0,050077
0,009182
-5,45374
0,000002
Коэффициент детерминации показывает, какая доля дисперсии отклика объясняется влиянием предикторов в построенной модели. Чем ближе R2 к 1, тем лучше модель.
Гипотеза об отсутствии линейной связи отклоняется, т.к. в данном случае значение F-статистики = 20, 992 при уровне значимости p < 0,00000.
Итак, для данной модели в результате проведения множественной регрессии, зависимая переменная «Трудоемкость единицы продукции» представима как:
Итак, как видно из уравнения, такие факторы, как f3 и f4 оказывают отрицательное влияние на трудоемкость единицы продукции. Так при увеличении факторов f1 и f2 трудоемкость единицы продукции будет возрастет.
Выполним построение «Гистограммы остатков», которая представлена на рисунке 3.
Рисунок 3 – Гистограмма остатков
О нормальности остатков можно судить по вероятностному графику остатков, который представлен на рисунке 4.
Так как остатки достаточно хорошо ложатся на прямую, то можно говорить о том, что распределение близко к нормальному.
Таким образом можно сделать вывод, что основными факторами влияющими на трудоемкость единицы продукции У являются F1 - показатели ресурсов предприятия, F2 – показатели выполнения работ, F3 – удельный вес покупных изделий, F4 – фондовооруженность труда.
Библиографический список
Колемаев В. А. Эконометрика : учеб.для студентов вузов по специальности 061800 “Мат. методы в экономике” / В. А. Колемаев ; М-во образования РФ, Гос. ун-т упр. – М. : ИНФРА-М, 2014. – 160 с.
Крамер, Н.Ш., Путко, Б.А. Эконометрика: Учебник для вузов [Текст]/ Под рек.проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2012. – 311 с.
Эконометрика: учет./под ред.. И. И. Елисеевой. – М.: Проспект, 2009. – 228 с.