УДК 669.713

ПРИМЕНЕНИЕ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ ДЛЯ АНАЛИЗА ПРОИЗВОДСТВЕННЫХ ПОКАЗАТЕЛЕЙ НА ПРЕДПРИЯТИЯХ

Харисова Алсу Фанисовна1, Бакуменко Людмила Петровна2
1Поволжский государственный технологический университет, магистрант 1 курса направления «Прикладная информатика»
2Поволжский государственный технологический университет, научный руководитель

Аннотация
Рассматривается группировка производственных показателей строительных предприятий путем применения метода главных компонент.

Ключевые слова: метод главных компонет, трудоемкость единицы продукции, фактор, факторный анализ


APPLICATION OF PRINCIPAL COMPONENT ANALYSIS FOR THE PERFORMANCE INDICATORS IN ENTERPRISES

Kharisova Alsu Fanisovna1, Bakumenko Lyudmila Petrovna2
1Volga State University of Technology, graduate student of master course "Applied Informatics"
2Volga State University of Technology, scientific director

Abstract
We consider the group of performance indicators of construction enterprises by applying the method of principal components.

Keywords: factor, factor analysis, labor input per unit of output, principal component analysis


Библиографическая ссылка на статью:
Харисова А.Ф., Бакуменко Л.П. Применение метода главных компонент для анализа производственных показателей на предприятиях // Экономика и менеджмент инновационных технологий. 2017. № 2 [Электронный ресурс]. URL: http://ekonomika.snauka.ru/2017/02/13907 (дата обращения: 29.09.2017).

Объектом исследования в данной работе является производственные показатели строительных компаний России [4].

В зависимости от конкретных задач, решаемых в экономике, или в другой сфере, используется один из методов факторного анализа.

Главными целями факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных, или как метод классификации.

В данной работе рассматривается трудоемкость единицы продукции и 13 производственных показателей по 53 предприятиям. А именно, х1 -удельный вес рабочих в составе ППП; х2 -  удельный вес покупных изделий; х3 – коэффициент сменности оборудования; х4 – премии и вознаграждения на одного ребенка; х5 – удельный вес потерь от брака; х6 – фондоотдача; х7 – среднегодовая численность ППП; х8 – среднегодовая стоимость ОПФ; х9 – среднегодовой фонд заработной платы ППП; х10 – фондовооруженность труда; х11 – оборачиваемость нормируемых оборотных средств; х12 – оборачиваемость ненормируемых оборотных средств; х13 – непроизводственные расходы.

Для установления связи между трудоемкостью единицы продукции и производственными показателями предлагается использовать модели, построенные на основе главных компонент. Для реализации поставленной задачи был  выбран метод главных компонент.

Метод главных компонент (разложение Карунена-Лоева, principal component analysis, PCA) является простейшим методом уменьшения размерности в данных. Идея метода заключается в поиске в исходном пространстве гиперплоскости заданной размерности с последующим проектированием выборки на данную гиперплоскость. При этом выбирается та гиперплоскость, ошибка проектирования данных на которую является минимальной в смысле суммы квадратов отклонений  [1].

В качестве математического инструментария использован пакет Statistica.  Statistica — это инструмент разработки пользовательских приложений в бизнесе, экономике, финансах, промышленности, медицине, страховании и других областях [2].

Сначала рассмотрим собственные значения исходных данных, которые представлены в таблице 1.

Таблица 1 – Собственные значения

Собственные значения (Книга2.sta) Выделение: Главные компоненты

Соб. зн.

% общей

Кумулятивн.

Кумулятивн.

1

4,086894

31,43764

4,006894

31,43764

2

2,492696

19,17459

6,579590

50,61223

3

1,768198

13,60152

8,347788

64,21375

4

1,026525

7,89634

9,374312

72,11009

Дисперсии, выделяемые факторами, названы собственными значениями. В третьей колонке для каждого фактора приводится процент от общей дисперсии.  В соответствии с критерием Кайзера (Kaiser, 1960), необходимо оставить факторы с собственными значениями больше 1 [2]. Из таблицы 1 видно, что все значения больше единицы. Отсюда следует,  что можно выделить четыре основных фактора.

Построим график каменистой осыпи, или собственных значений (рис. 1). Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем (Cattell, 1966). [3] По графику можно выделить четыре основных фактора. Осыпание наиболее существенно замедляется на 4 точке, следовательно, можно ограничиться 4 факторами.

График каменистой осыпи

Рисунок 1 – График каменистой осыпи

Определим факторные нагрузки, выделим переменные, которые коррелируют с главной компонентой от 0,7.

Таблица 2 – Факторные нагрузки (без вращения оси)

Фактор.нагрузки (без вращ.) (Таблица_данных1_(Восстановлен)) Выделение: Главные компоненты (Отмечены нагрузки >,700000)

 

Фактор 1

Фактор 2

Фактор 3

Фактор 4

х1

0,650273

-0,497327

0,445088

0,000543

х2

-0,064989

0,535127

0,571538

0,43425

х3

0,670449

-0,210036

-0,126827

0,010486

х4

0,635595

0,003085

-0,101005

-0,027959

х5

0,361793

-0,548121

-0,117123

-0,362264

х6

-0,347851

0,123075

0,755183

0,052948

х7

0,635541

0,651722

0,130384

-0,33006

х8

0,748499

0,510249

-0,059426

0,058335

х9

0,554844

0,643937

0,148617

-0,426983

х10

0,627764

0,021833

-0,436233

0,43693

х11

-0,609654

0,254227

-0,405016

-0,177943

х12

-0,461286

-0,167791

0,257895

-0,430679

х13

-0,551246

0,6374

-0,411906

-0,017531

Общ.дис.

4,086894

2,492696

1,768198

1,026525

Доля общ

0,314376

0,191746

0,136015

0,078963

Из таблицы 2 видно, что второй и четвертый фактор оказались не загруженными, следовательно, необходимо произвести вращение факторов (табл. 3).

Таблица 3 – Факторные нагрузки (после вращения)

Фактор.нагрузки (Варим. исх.) (Таблица_данных1) Выделение: Главные компоненты (Отмечены нагрузки >,700000)

 

Фактор 1

Фактор 2

Фактор 3

Фактор 4

х1

0,102537

0,923366

0,041689

-0,05863

х2

0,187883

-0,0391

-0,87689

0,00639

х3

0,231696

0,459897

0,281505

-0,40667

х4

0,373192

0,323958

0,187732

-0,36812

х5

-0,00176

0,468851

0,596014

0,03505

х6

-0,05484

0,121708

-0,63256

0,53972

х7

0,968062

0,048241

-0,06763

-0,10272

х8

0,74091

0,113601

-0,09607

-0,50642

х9

0,962087

0,01076

-0,0315

0,01371

х10

0,129635

0,146654

0,116189

-0,85086

х11

-0,15456

-0,73884

0,153041

0,19701

х12

-0,15352

-0,05434

0,087862

0,67727

х13

0,059724

-0,93079

-0,0982

0,02343

Общ.дис.

2,72131

2,857284

1,709616

2,0861

Доля общ

0,209332

0,219791

0,131509

0,16047

Цель вращения – получение простой структуры, при которой большинство наблюдений находится вблизи осей координат. При случайной конфигурации наблюдений невозможно получить простую структуру. Возможен выбор различный поворот оси. Выберем вращение квартимах исходный, то есть вращаемые нагрузки не нормализированы.

По-видимому, первый фактор более коррелирует с переменными, чем второй, третий и четвертый. Это следовало ожидать, потому что факторы выделяются последовательно и содержат все меньше и меньше общей дисперсии.

Факторы можно представить в виде трех ортогональных координатных осей. Если на этих осях отметить значения факторных нагрузок, соответствующих каждому из 13 нормированных показателей, то получим 13 точек, каждая из которых характеризует одну из строк матрицы . В результате имеем следующий график на  рисунке 2.

Рисунок 2– Факторные нагрузки

В итоге получаем четыре главных компоненты. Первая главная компонента коррелирует со следующими показателями: Х7 – среднегодовая численность ППП, Х8 – среднегодовая стоимость ОПФ,  Х9 – среднегодовой фонд заработной платы ППП. Поэтому данную компоненту назовем показатели ресурсов предприятия.

Вторая главная компонента коррелирует со следующими показателями: Х1 – удельный вес рабочих в составе ППП, Х11 – оборачиваемость нормируемых оборотных средств, Х13 – непроизводственные расходы. Поэтому данную компоненту назовем показатели трудовых затрат.

Третья главная компонента коррелирует со следующими показателями: Х2 – удельный вес покупных изделий. Поэтому данную компоненту назовем удельный вес покупных изделий.

Четвертая главная компонента коррелирует со следующими показателями: Х10 – фондовооруженность труда. Поэтому данную компоненту назовем фондовооруженность труда.

Рассчитаем коэффициент информативности главных компонент. Затем получаем таблицу 4 с факторными нагрузками.

Таблица 4 – Факторные нагрузки

Фактор 1

Фактор 2

Фактор 3

Фактор 4

Х1

0,173096

-0,004457

0,880747

0,010706

Х2

0,214858

0,452844

-0,29915

0,411206

Х3

0,357599

0,321999

-0,197624

0,379946

Х4

0,005037

0,446307

-0,612551

-0,043018

Х5

-0,045094

0,143003

0,6327

-0,53522

Х6

0,961173

0,062066

0,08063

0,142786

Х7

0,716604

0,126889

0,098267

0,5369

Х8

0,960981

0,022901

0,047158

0,025974

Х9

0,095264

0,145959

-0,129072

0,853658

Х10

-0,135797

-0,746241

-0,125739

-0,202198

Х11

-0,123634

-0,061093

-0,0806

-0,683681

Х12

0,068863

-0,925824

0,133994

-0,016684

Х13

0,090889

0,922452

-0,074967

0,059111

Коэф.инорм.

90,01549

49,8095

44,05693

33,86291

Как видно из таблицы 4, фактор 1 (показатели ресурсов предприятия) имеет наибольшую информативность, а значит, он оказывает наибольшее влияние на трудоемкость единицы продукции. Наименьшую информативность имеет составляющая  фондовооруженность труда.

Таким образом, после сокращения размерности 13 переменных, характеризующих трудоемкость единицы продукции, наиболее значимыми факторами оказались: составляющая показатели ресурсов предприятия, составляющая показатели трудовых затрат, составляющая удельный вес покупных изделий и составляющая фондовооруженность труда.

Построим регрессию, где зависимыми переменными станут значения факторов. В качестве зависимой переменной укажем «Трудоемкость единицы продукции» (У), в качестве независимых – все остальные. Были получены результаты в виде «Итоговой таблицы регрессии» (Табл. 5). Все переменные в регрессионной модели значимы (p-уровень < 0.05 – подсвечены красным цветом).

Таблица 5 – Итоги регрессии факторного анализа

Итоги регрессии для зависимой переменной: y (факторный) R= ,79767179 R2= ,63628029 Скорректир. R2= ,60597031 F(4,48)=20,992 p<,00000

N=53

БЕТА

Стд.Ош.

B

Стд.Ош.

t(48)

p-уров.

Св.член

0,302453

0,009095

33,25452

0

f1

-0,401797

0,087049

-0,042383

0,009182

-4,61577

0,000029

f2

-0,349279

0,087049

-0,036843

0,009182

-4,01245

0,00021

f3

-0,357021

0,087049

-0,037659

0,009182

-4,10139

0,000158

f4

-0,474741

0,087049

-0,050077

0,009182

-5,45374

0,000002

Коэффициент детерминации показывает, какая доля дисперсии отклика объясняется влиянием предикторов в построенной модели. Чем ближе R2 к 1, тем лучше модель.

Гипотеза об отсутствии линейной связи отклоняется, т.к. в данном случае значение F-статистики = 20, 992 при уровне значимости p < 0,00000.

Итак, для данной модели в результате проведения множественной регрессии, зависимая переменная  «Трудоемкость единицы продукции» представима как:

Итак, как видно из уравнения, такие факторы, как f3 и f4 оказывают отрицательное влияние на трудоемкость единицы продукции. Так при увеличении факторов f1 и f2 трудоемкость единицы продукции будет возрастет.

Выполним построение «Гистограммы остатков», которая представлена на рисунке 3.

Рисунок  3 – Гистограмма остатков

О нормальности остатков можно судить по вероятностному графику остатков, который представлен на рисунке 4.

Рисунок 4 – Нормальный вероятностный график остатков

Так как остатки достаточно хорошо ложатся на прямую, то можно говорить о том, что распределение близко к нормальному.

Таким образом можно сделать вывод, что основными факторами влияющими на трудоемкость единицы продукции У являются F1 -  показатели ресурсов предприятия, F2 – показатели выполнения работ, F3 – удельный вес покупных изделий, F4 – фондовооруженность труда.


Библиографический список
  1. Колемаев В. А.  Эконометрика : учеб.для студентов вузов по специальности 061800 “Мат. методы в экономике” / В. А. Колемаев ; М-во образования РФ, Гос. ун-т упр. – М. : ИНФРА-М, 2014. – 160 с.
  2. Крамер, Н.Ш., Путко, Б.А. Эконометрика: Учебник для вузов [Текст]/ Под рек.проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2012. – 311 с.
  3. Эконометрика: учет./под ред.. И. И. Елисеевой. – М.: Проспект, 2009. – 228 с.
  4. ЕМИСС государственная статистика [Электронный ресурс]. – Режим доступа: http://www.url: https://fedstat.ru/


Все статьи автора «Харисова Алсу Фанисовна»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: