Объектом исследования в данной работе является производственные показатели строительных компаний России [4].
В зависимости от конкретных задач, решаемых в экономике, или в другой сфере, используется один из методов факторного анализа.
Главными целями факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных, или как метод классификации.
В данной работе рассматривается трудоемкость единицы продукции и 13 производственных показателей по 53 предприятиям. А именно, х1 -удельный вес рабочих в составе ППП; х2 - удельный вес покупных изделий; х3 – коэффициент сменности оборудования; х4 – премии и вознаграждения на одного ребенка; х5 – удельный вес потерь от брака; х6 – фондоотдача; х7 – среднегодовая численность ППП; х8 – среднегодовая стоимость ОПФ; х9 – среднегодовой фонд заработной платы ППП; х10 – фондовооруженность труда; х11 – оборачиваемость нормируемых оборотных средств; х12 – оборачиваемость ненормируемых оборотных средств; х13 – непроизводственные расходы.
Для установления связи между трудоемкостью единицы продукции и производственными показателями предлагается использовать модели, построенные на основе главных компонент. Для реализации поставленной задачи был выбран метод главных компонент.
Метод главных компонент (разложение Карунена-Лоева, principal component analysis, PCA) является простейшим методом уменьшения размерности в данных. Идея метода заключается в поиске в исходном пространстве гиперплоскости заданной размерности с последующим проектированием выборки на данную гиперплоскость. При этом выбирается та гиперплоскость, ошибка проектирования данных на которую является минимальной в смысле суммы квадратов отклонений [1].
В качестве математического инструментария использован пакет Statistica. Statistica — это инструмент разработки пользовательских приложений в бизнесе, экономике, финансах, промышленности, медицине, страховании и других областях [2].
Сначала рассмотрим собственные значения исходных данных, которые представлены в таблице 1.
Таблица 1 – Собственные значения
Собственные значения (Книга2.sta) Выделение: Главные компоненты |
||||
Соб. зн. |
% общей |
Кумулятивн. |
Кумулятивн. |
|
1 |
4,086894 |
31,43764 |
4,006894 |
31,43764 |
2 |
2,492696 |
19,17459 |
6,579590 |
50,61223 |
3 |
1,768198 |
13,60152 |
8,347788 |
64,21375 |
4 |
1,026525 |
7,89634 |
9,374312 |
72,11009 |
Дисперсии, выделяемые факторами, названы собственными значениями. В третьей колонке для каждого фактора приводится процент от общей дисперсии. В соответствии с критерием Кайзера (Kaiser, 1960), необходимо оставить факторы с собственными значениями больше 1 [2]. Из таблицы 1 видно, что все значения больше единицы. Отсюда следует, что можно выделить четыре основных фактора.
Построим график каменистой осыпи, или собственных значений (рис. 1). Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем (Cattell, 1966). [3] По графику можно выделить четыре основных фактора. Осыпание наиболее существенно замедляется на 4 точке, следовательно, можно ограничиться 4 факторами.
Рисунок 1 – График каменистой осыпи
Определим факторные нагрузки, выделим переменные, которые коррелируют с главной компонентой от 0,7.
Таблица 2 – Факторные нагрузки (без вращения оси)
Фактор.нагрузки (без вращ.) (Таблица_данных1_(Восстановлен)) Выделение: Главные компоненты (Отмечены нагрузки >,700000) |
||||
Фактор 1 |
Фактор 2 |
Фактор 3 |
Фактор 4 |
|
х1 |
0,650273 |
-0,497327 |
0,445088 |
0,000543 |
х2 |
-0,064989 |
0,535127 |
0,571538 |
0,43425 |
х3 |
0,670449 |
-0,210036 |
-0,126827 |
0,010486 |
х4 |
0,635595 |
0,003085 |
-0,101005 |
-0,027959 |
х5 |
0,361793 |
-0,548121 |
-0,117123 |
-0,362264 |
х6 |
-0,347851 |
0,123075 |
0,755183 |
0,052948 |
х7 |
0,635541 |
0,651722 |
0,130384 |
-0,33006 |
х8 |
0,748499 |
0,510249 |
-0,059426 |
0,058335 |
х9 |
0,554844 |
0,643937 |
0,148617 |
-0,426983 |
х10 |
0,627764 |
0,021833 |
-0,436233 |
0,43693 |
х11 |
-0,609654 |
0,254227 |
-0,405016 |
-0,177943 |
х12 |
-0,461286 |
-0,167791 |
0,257895 |
-0,430679 |
х13 |
-0,551246 |
0,6374 |
-0,411906 |
-0,017531 |
Общ.дис. |
4,086894 |
2,492696 |
1,768198 |
1,026525 |
Доля общ |
0,314376 |
0,191746 |
0,136015 |
0,078963 |
Из таблицы 2 видно, что второй и четвертый фактор оказались не загруженными, следовательно, необходимо произвести вращение факторов (табл. 3).
Таблица 3 – Факторные нагрузки (после вращения)
Фактор.нагрузки (Варим. исх.) (Таблица_данных1) Выделение: Главные компоненты (Отмечены нагрузки >,700000) |
||||
Фактор 1 |
Фактор 2 |
Фактор 3 |
Фактор 4 |
|
х1 |
0,102537 |
0,923366 |
0,041689 |
-0,05863 |
х2 |
0,187883 |
-0,0391 |
-0,87689 |
0,00639 |
х3 |
0,231696 |
0,459897 |
0,281505 |
-0,40667 |
х4 |
0,373192 |
0,323958 |
0,187732 |
-0,36812 |
х5 |
-0,00176 |
0,468851 |
0,596014 |
0,03505 |
х6 |
-0,05484 |
0,121708 |
-0,63256 |
0,53972 |
х7 |
0,968062 |
0,048241 |
-0,06763 |
-0,10272 |
х8 |
0,74091 |
0,113601 |
-0,09607 |
-0,50642 |
х9 |
0,962087 |
0,01076 |
-0,0315 |
0,01371 |
х10 |
0,129635 |
0,146654 |
0,116189 |
-0,85086 |
х11 |
-0,15456 |
-0,73884 |
0,153041 |
0,19701 |
х12 |
-0,15352 |
-0,05434 |
0,087862 |
0,67727 |
х13 |
0,059724 |
-0,93079 |
-0,0982 |
0,02343 |
Общ.дис. |
2,72131 |
2,857284 |
1,709616 |
2,0861 |
Доля общ |
0,209332 |
0,219791 |
0,131509 |
0,16047 |
Цель вращения – получение простой структуры, при которой большинство наблюдений находится вблизи осей координат. При случайной конфигурации наблюдений невозможно получить простую структуру. Возможен выбор различный поворот оси. Выберем вращение квартимах исходный, то есть вращаемые нагрузки не нормализированы.
По-видимому, первый фактор более коррелирует с переменными, чем второй, третий и четвертый. Это следовало ожидать, потому что факторы выделяются последовательно и содержат все меньше и меньше общей дисперсии.
Факторы можно представить в виде трех ортогональных координатных осей. Если на этих осях отметить значения факторных нагрузок, соответствующих каждому из 13 нормированных показателей, то получим 13 точек, каждая из которых характеризует одну из строк матрицы . В результате имеем следующий график на рисунке 2.
Рисунок 2– Факторные нагрузки
В итоге получаем четыре главных компоненты. Первая главная компонента коррелирует со следующими показателями: Х7 – среднегодовая численность ППП, Х8 – среднегодовая стоимость ОПФ, Х9 – среднегодовой фонд заработной платы ППП. Поэтому данную компоненту назовем показатели ресурсов предприятия.
Вторая главная компонента коррелирует со следующими показателями: Х1 – удельный вес рабочих в составе ППП, Х11 – оборачиваемость нормируемых оборотных средств, Х13 – непроизводственные расходы. Поэтому данную компоненту назовем показатели трудовых затрат.
Третья главная компонента коррелирует со следующими показателями: Х2 – удельный вес покупных изделий. Поэтому данную компоненту назовем удельный вес покупных изделий.
Четвертая главная компонента коррелирует со следующими показателями: Х10 – фондовооруженность труда. Поэтому данную компоненту назовем фондовооруженность труда.
Рассчитаем коэффициент информативности главных компонент. Затем получаем таблицу 4 с факторными нагрузками.
Таблица 4 – Факторные нагрузки
Фактор 1 |
Фактор 2 |
Фактор 3 |
Фактор 4 |
|
Х1 |
0,173096 |
-0,004457 |
0,880747 |
0,010706 |
Х2 |
0,214858 |
0,452844 |
-0,29915 |
0,411206 |
Х3 |
0,357599 |
0,321999 |
-0,197624 |
0,379946 |
Х4 |
0,005037 |
0,446307 |
-0,612551 |
-0,043018 |
Х5 |
-0,045094 |
0,143003 |
0,6327 |
-0,53522 |
Х6 |
0,961173 |
0,062066 |
0,08063 |
0,142786 |
Х7 |
0,716604 |
0,126889 |
0,098267 |
0,5369 |
Х8 |
0,960981 |
0,022901 |
0,047158 |
0,025974 |
Х9 |
0,095264 |
0,145959 |
-0,129072 |
0,853658 |
Х10 |
-0,135797 |
-0,746241 |
-0,125739 |
-0,202198 |
Х11 |
-0,123634 |
-0,061093 |
-0,0806 |
-0,683681 |
Х12 |
0,068863 |
-0,925824 |
0,133994 |
-0,016684 |
Х13 |
0,090889 |
0,922452 |
-0,074967 |
0,059111 |
Коэф.инорм. |
90,01549 |
49,8095 |
44,05693 |
33,86291 |
Как видно из таблицы 4, фактор 1 (показатели ресурсов предприятия) имеет наибольшую информативность, а значит, он оказывает наибольшее влияние на трудоемкость единицы продукции. Наименьшую информативность имеет составляющая фондовооруженность труда.
Таким образом, после сокращения размерности 13 переменных, характеризующих трудоемкость единицы продукции, наиболее значимыми факторами оказались: составляющая показатели ресурсов предприятия, составляющая показатели трудовых затрат, составляющая удельный вес покупных изделий и составляющая фондовооруженность труда.
Построим регрессию, где зависимыми переменными станут значения факторов. В качестве зависимой переменной укажем «Трудоемкость единицы продукции» (У), в качестве независимых – все остальные. Были получены результаты в виде «Итоговой таблицы регрессии» (Табл. 5). Все переменные в регрессионной модели значимы (p-уровень < 0.05 – подсвечены красным цветом).
Таблица 5 – Итоги регрессии факторного анализа
Итоги регрессии для зависимой переменной: y (факторный) R= ,79767179 R2= ,63628029 Скорректир. R2= ,60597031 F(4,48)=20,992 p<,00000 |
||||||
N=53 |
БЕТА |
Стд.Ош. |
B |
Стд.Ош. |
t(48) |
p-уров. |
Св.член |
0,302453 |
0,009095 |
33,25452 |
0 |
||
f1 |
-0,401797 |
0,087049 |
-0,042383 |
0,009182 |
-4,61577 |
0,000029 |
f2 |
-0,349279 |
0,087049 |
-0,036843 |
0,009182 |
-4,01245 |
0,00021 |
f3 |
-0,357021 |
0,087049 |
-0,037659 |
0,009182 |
-4,10139 |
0,000158 |
f4 |
-0,474741 |
0,087049 |
-0,050077 |
0,009182 |
-5,45374 |
0,000002 |
Коэффициент детерминации показывает, какая доля дисперсии отклика объясняется влиянием предикторов в построенной модели. Чем ближе R2 к 1, тем лучше модель.
Гипотеза об отсутствии линейной связи отклоняется, т.к. в данном случае значение F-статистики = 20, 992 при уровне значимости p < 0,00000.
Итак, для данной модели в результате проведения множественной регрессии, зависимая переменная «Трудоемкость единицы продукции» представима как:
Итак, как видно из уравнения, такие факторы, как f3 и f4 оказывают отрицательное влияние на трудоемкость единицы продукции. Так при увеличении факторов f1 и f2 трудоемкость единицы продукции будет возрастет.
Выполним построение «Гистограммы остатков», которая представлена на рисунке 3.
Рисунок 3 – Гистограмма остатков
О нормальности остатков можно судить по вероятностному графику остатков, который представлен на рисунке 4.
Рисунок 4 – Нормальный вероятностный график остатков
Так как остатки достаточно хорошо ложатся на прямую, то можно говорить о том, что распределение близко к нормальному.
Таким образом можно сделать вывод, что основными факторами влияющими на трудоемкость единицы продукции У являются F1 - показатели ресурсов предприятия, F2 – показатели выполнения работ, F3 – удельный вес покупных изделий, F4 – фондовооруженность труда.
Библиографический список
- Колемаев В. А. Эконометрика : учеб.для студентов вузов по специальности 061800 “Мат. методы в экономике” / В. А. Колемаев ; М-во образования РФ, Гос. ун-т упр. – М. : ИНФРА-М, 2014. – 160 с.
- Крамер, Н.Ш., Путко, Б.А. Эконометрика: Учебник для вузов [Текст]/ Под рек.проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2012. – 311 с.
- Эконометрика: учет./под ред.. И. И. Елисеевой. – М.: Проспект, 2009. – 228 с.
- ЕМИСС государственная статистика [Электронный ресурс]. – Режим доступа: http://www.url: https://fedstat.ru/
Количество просмотров публикации: Please wait