Научный руководитель: Бакуменко Людмила Петровна
Поволжский государственный технологический университет, доктор экономических наук
Уровень здоровья населения относится к числу наиболее значимых направлений исследования в социальной статистике. Это важный показатель, который требует особо четкого внимания.
Для того чтобы понять настоящую ситуацию в этой сфере, необходим ежегодный мониторинг данной области. Но так как простого сбора данных недостаточно, то нужен их анализ, а также установление различных взаимосвязей и выявление факторов, влияющих на те или иные показатели.
Таким образом, уровень заболеваемости является одной из основных социальных проблем, которая главным образом влияет в целом на число населения.
Для анализа и обработки огромного количества регистрируемых признаков, необходимо воспользоваться удобным и четким методом главных компонент, он предполагает уменьшение размерности информации.
Ниже приведены факторы, которые влияют на заболеваемость девочек 14-16 лет. Проанализируем данные Минздрава России за 2016 год.
x1 - группа заболеваний, вызываемых паразитами, а также инфекционные заболевания, чел.;
x2 - болезни системы крови, кроветворных органов и иммунного механизма, чел.;
x3 - нарушения пищевого поведения и нарушения углеводного обмена, чел.;
x4 - расстройства поведения и душевные расстройства, чел.;
x5 - нервные заболевания, чел.;
x6 - глазные заболевания, чел.;
x7 - ушные заболевания, чел.;
x8 - болезни системы кровообращения, чел.;
x9 - заболевания органов дыхания, чел.;
x10 - болезни органов пищеварения, чел.;
x11 - кожные заболевания, чел.;
x12 - болезни мочеполовой системы, чел.;
x13 - последствия внешних причин (травмы), чел.;
Проанализируем данные Минздрава России за 2016 год. Для этого необходимо сформировать главные компоненты путем выделения наиболее значимых факторов и построить уравнения регрессии на главных компонентах. Метод главных компонент необходимо применить к исходным данным, реализуемым в прикладной программе STATISTICA с помощью пакета «Факторный анализ» (Многомерный разведочный анализ). Полученные собственные значения отражены в таблице 1.
Таблица 1 – Собственные значения
Собственные значения (Болезни) Выделение: Главные компоненты |
||||
Соб. зн. |
% общей |
Кумулятивн. |
Кумулятивн. |
|
1 |
8,876633 |
68,28179 |
8,876633 |
68,28179 |
2 |
1,03573 |
7,96715 |
9,912363 |
76,24894 |
С помощью МГК было выделено всего 2 фактора. В данном случае 68,28% общей дисперсии объясняется первым фактором, 7,97% – вторым фактором, Вместе все факторы объясняют 76% дисперсии.
Далее необходимо оценить значения факторных нагрузок и вычислить коэффициенты информативности для случая с двумя факторами. Главная компонента считается информативной, если коэффициент достаточно высокий Ки ≥ 0,65 ÷ 0,95. Исходя из условия информативности, только первые два фактора являются информативными, поэтому необходимо использовать вращения для факторных нагрузок. В результате после применения вращения «Варимакс исходных», получаем более высокие коэффициенты информативности у первого и второго факторов, это представлено в таблице 2.
Таблица 2 – Факторные нагрузки при варимакс исходных
Фактор.нагрузки (Варим. исх.) (Болезни) Выделение: Главные компоненты (Отмечены нагрузки >,700000) |
||||
Фактор |
Фактор |
|||
x1 |
0,904066 |
0,120476 |
||
x2 |
0,684492 |
-0,001361 |
||
x3 |
0,79719 |
-0,200618 |
||
x4 |
0,064959 |
0,872487 |
||
x5 |
0,759767 |
0,157583 |
||
x6 |
0,94566 |
0,072741 |
||
x7 |
0,949151 |
0,033646 |
||
x8 |
0,269178 |
0,453512 |
||
x9 |
0,939623 |
0,075214 |
||
x10 |
0,959531 |
0,138622 |
||
x11 |
0,964464 |
0,136059 |
||
x12 |
0,940053 |
0,078066 |
||
x13 |
0,906053 |
-0,032905 |
||
Общ.дис. |
8,808875 |
1,103488 |
||
Доля общ |
0,677606 |
0,084884 |
При варимакс исходных коэффициенты информативности получаются достаточно хорошими для двух факторов, поэтому нет необходимости уменьшать количество факторов.
Переменные, которые вошли в каждую главную компоненту.
К первой компоненте относятся: x1 - группа заболеваний, вызываемых паразитами, а также инфекционные заболевания.; x3 - нарушения пищевого поведения и нарушения углеводного обмена; x5 - нервные заболевания, чел; x6 - глазные заболевания; x7 - ушные заболевания; x9 - заболевания органов дыхания; x10 - болезни органов пищеварения; x11 - кожные заболевания; x12 - болезни мочеполовой системы; x13 - последствия внешних причин (травмы).
Ко второй компоненте относится x4 - расстройства поведения и душевные расстройства, чел.;
Далее необходимо определить степень влияния каждого фактора на результативный признак y - число заболеваний, зарегистрированных у девочек 14-16 лет. Выведенная пошаговая регрессия с исключением представлена в таблице 3.
Таблица 3 – Итоги множественной регрессии
Итоги регрессии для зависимой переменной: y (Таблица данных64) R= ,98278067 R2= ,96585785 Скорректир. R2= ,96545618 F(1,85)=2404,6 p |
||||||
БЕТА |
Стд.Ош. |
B |
Стд.Ош. |
t(85) |
p-уров. |
|
Св.член |
53096,1 |
918,1463 |
57,8297 |
0 |
||
ФАКТОР1 |
-0,982781 |
0,020042 |
-45283,8 |
923,4689 |
-49,0366 |
0 |
Отсюда следует, что значимым является только первый фактор. Полученное уравнение регресии имеет вид:
.gif)
Коэффициент детерминации R2 =0,97 показывает, что 97% вариации результативного признака объясняется включенной в модель переменной (фактор 1), остальные 3% вариации объясняется неучтёнными в модели факторами.
Модель можно считать значимой, так как фактическое значение F- критерия Фишера превышает критическое при заданных степенях свободы и уровне значимости 97%.
Каждый коэффициент также можно считать значимым, так как критическое значение t-критерия Стьюдента меньше каждого фактического значения.
По вероятностному графику, который изображен на рисунке 1, видно, что значения остатков распределены достаточно равномерно и хорошо ложатся на график нормальных остатков.
Рисунок 1 Нормальный вероятностный график
Коэффициенты уравнения показывают, насколько изменится значение результативного признака при изменении величины факторного на 1 единицу. С уменьшением показателя f1 на 1 единицу значение результативного признака уменьшится на 45283,8 ед. Влияние показателя f2 оказалось незначительным и не вошло в окончательное уравнение.
Из уравнения видно, что первый фактор наиболее часто встречается как заболевание, зарегистрированное у девочек 14-16 лет.
Можно сделать вывод, что в ходе данной работы были выделены две главные компоненты, что облегчило дальнейшую работу с моделью. Затем с помощью пошаговой регрессии с исключением были выделены наиболее существенные факторы и объяснено их влияние на результативный признак.
Библиографический список
- Алексеев А.Р. Экономическая статистика: учебник для вузов / [Алексеев А.Р., Воробьев А.Н., Громыко Г.Л., и др.]; под ред. Ю.Н. Иванова. – М.: ИНФРА-М, 2014. – 734 с.
- Бабешко Л.О. Основы эконометрического моделирования : учеб. пособие / Л. О. Бабешко. – Изд. 4-е. – М.: КомКнига, 2013. – 428 с.
- Дианов М.А., Никитина С.Ю. Здравоохранение в России. 2015: Стат.сб./Росстат. – М., З–46 2015. – 174 с.
- Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2013. – 311 с.
- Костромин А.В., Кундакчян Р.М. Эконометрика. Учебное пособие / Издательство: Кнорус, 2015 г., – 228с.
- Статистический сборник «Регионы России. Социально экономические показатели», 2013. Федеральная Служба Государственной Статистики.
- Статистические методы прогнозирования, Дуброва Т.А., 2015.
Количество просмотров публикации: Please wait