ИССЛЕДОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДЛЯ ФОРМИРОВАНИЯ КРАТКОСРОЧНОГО ПРОГНОЗА В ПРОГРАММНОЙ СРЕДЕ STATISTICA

Николаев Сергей Валерьевич1, Пронина Ольга Юрьевна2, Баженов Руслан Иванович3
1Приамурский государственный университет им.Шолом-Алейхема, студент
2Приамурский государственный университет им.Шолом-Алейхема, студент
3Приамурский государственный университет им.Шолом-Алейхема, к.п.н., доцент, зав.кафедрой информатики и вычислительной техники

Аннотация
Цель данной статьи с помощью нескольких видов интеллектуального анализа программного пакета Statistica сформировать краткосрочный прогноз продаж фирмы ООО «НОРД», показать применение методов и сравнить их результаты.

Ключевые слова: временные ряды, данные, интеллектуальный анализ, краткосрочный прогноз, модель АРПСС, нейронные сети


STUDY MINING TECHNIQUES TO FORM A SHORT-TERM FORECAST IN THE SOFTWARE STATISTICA

Nikolaev Sergey Valerievich1, Pronina Olga Yurievna2, Bazhenov Ruslan Ivanovich3
1Sholom-Aleichem Priamursky State University, student
2Sholom-Aleichem Priamursky State University, student
3Sholom-Aleichem Priamursky State University, candidate of pedagogical sciences, associate professor, Head of the Department of Computer Science

Abstract
The purpose of this article with a few types of mining statistics software package to generate short-term forecast of sales of the company "NORD", show the application of methods and compare their results.

Keywords: intelligent analysis of data, neural networks, short-term forecast, Statistica, the model ARIMA, time series


Библиографическая ссылка на статью:
Николаев С.В., Пронина О.Ю., Баженов Р.И. Исследование методов интеллектуального анализа для формирования краткосрочного прогноза в программной среде Statistica // Экономика и менеджмент инновационных технологий. 2015. № 7 [Электронный ресурс]. URL: https://ekonomika.snauka.ru/2015/07/9500 (дата обращения: 11.03.2024).

С развитием современных технологий, в том числе и глобальной сети интернет, все больше и больше информации становится доступной как частному пользователю, так и различным компаниям, фирмам. Более того, накопленная отчетность и другая информация в фирмах содержит в себе большое количество ценной информации, но из-за больших объемов, обработать ее может только ЭВМ и при наличии специализированных программ. Именно с ростом большого объема информации стали особо актуальны различные статистические программы, способные выполнять широкий круг задач. Программный пакет Statistica является одним из них.

Для использования программного пакета Statistica нет необходимости знать сложные методы анализа в деталях, хотя иметь некоторый фундамент математических знаний все же нужно. С помощью программы Statistica можно использовать весь потенциал данных методов для, анализа и интерпретации данных [1, 2].

О статистическом анализе данных в своих работах пишут В.П. Боровиков, И.П.Боровиков, а также А.А.Халафян, о возможностях инструмента data miner в своей статье описывает П.С. Большаков. [1,2,3] Для программы Statistica разработчиками написано полное электронное руководство [4,5]. Различные авторы занимались проблемами анализа. А.А. Попов провел факторный анализ экономики региона с использованием программной системы SPSS [6,7]. Особенности моделирования латентных изменений с помощью AMOS SPSS рассмотрел Р.И.Остапенко [8,9]. А.А.Серов исследовал скоринг экспериментальных данных с применением прогнозных моделей в среде пакета SPSS [10]. Cущность, преимущества и недостатки кластерного анализа показал С.А.Суслов [11,12]. Р.И.Баженов и др. изучали возможности применения различных видов анализа [13-20].

Цель данной статьи на основе имеющихся данных провести анализ продаж и спрогнозировать дальнейший объем продаж на кратковременный период, используя инструменты программной среды Statistica. Провести сравнение результатов используемых методов.

В качестве исходных данных были взяты данные о продажах за 2014 г. фирмы ООО «НОРД». Выгрузка данных представлена в формате Ms Excel. Часть данных приведена на рис. 1.

Рисунок 1 — Исходные данные

Перед загрузкой данных в программную среду Statistica необходимо привести их к нужному формату. Так как мы собираемся проводить анализ временных рядов, то для работы необходимо создать сводную таблицу, которая будет отображать продажи в каждый момент времени. В нашем случае, в качестве единицы временного периода будет взят день. Отсортируем данные по датам продаж. Форматированные данные приведены ниже на рис. 2.

Рисунок 2 — Отформатированные исходные данные

Statistica предусматривает работу с файлами MS Excel, отсюда, перенос данных из Excel в Statistica не вызывает затруднений. Данные в программе Statistica представлены на рис. 3.

Рисунок 3 — Экспортированные данные

Отобразим графически данные для анализа. Для этого воспользуемся построением двумерных графиков в программе Statistica («Графика» à «2М Графики» à «Линейные графики» (для переменных)). Результат представлен на рис. 4.


Рисунок 4 — График исходных данных

На графике видно, что присутствуют большие скачки объема продаж, что, несомненно, повлияет на наш прогноз. Для этого преобразуем имеющийся временной ряд с помощью методов сезонной композиции. Данный анализ расположен: «Анализ» à «Углубленные методы анализа» à «Временные ряды и прогнозирование». Далее необходимо выбрать «Сезонная декомпозиция» (Census1). В появившихся настройках анализа добавим компонент скользящего среднего, в качестве переменной выберем наш временной ряд. Все настройки анализа представлены на рис. 5.


Рисунок 5 — Настройки сезонной декомпозиции

Выполнив анализ, необходимо перейти к вкладке прогноз, где на основе проведенного анализа отобразим график с преобразованным, временным рядом (на рис. 6 пунктирная, красная линия). Именно преобразованный ряд будет использоваться для анализа АРПСС (ARIMA).

Рисунок 6 — График со скользящей средней

Краткосрочный прогноз. Модель АРПСС (ARIMA)

Для построения краткосрочно анализа с помощью АРПСС выберем данный анализ во вкладках «Анализ» à «Углубленные методы анализа» à «Временные ряды и прогнозирование». Необходимо выбрать «АРПСС и автокорреляционные функции». Для анализа необходимо задать параметры, приведенные на рис.7.

Рисунок 7 — Параметры прогноза

В графическом виде результат анализа будет выглядеть следующим образом (рис.8). Красной пунктирной линией показан краткосрочный прогноз. Зеленными пунктирными линиями ограничен доверительный коридор, который расширяется, при увеличении периода прогнозирования.

Рисунок 8 — График краткосрочного прогноза

Прогнозирование с помощью нейронных сетей

Одним из способов прогнозирования временного ряда можно рассмотреть нейронные сети. Нейронные сети избавляют нас от необходимости придерживаться определенной сезонной или трендовой модели.

Проблемами использования нейронных сетей затрагивалась в различных исследованиях. В.Ю.Осипов показал применение рекуррентной нейронной сети с двумя сигнальными системами [21,22]. В.Г.Манжула и др. [23-25] изучали нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных. Качество восстановления образов искусственной нейронной сетью Хопфилда рассмотрели И.В.Колбасина, Е.Д.Старовойт и С.С.Бежитский [26]. В.А.Седов и Н.А.Седова моделировали расхождения судов в зоне чрезмерного сближения нейронными сетями [27, 28]. Использованием нейронных сетей для оценки уровня заболоченности территории на основе данных дистанционного зондирования занимались А.Д.Варламов и Р.В.Шарапов [30, 31]. Р.И.Баженов и др. [32-35] применили нейронные сети в распознавании образов, прогнозировании.

Для использования нейронных сетей необходимо воспользоваться вкладкой «Анализ» à «Нейронные сети». В появившемся диалоговом окне устанавливаем тип задачи: Временные ряды, в качестве инструмента: Мастер решений (рис. 9).

Рисунок 9 — Настройка нейронных сетей

В качестве переменной выбираем наш ряд. После нажатия кнопки «ОК», необходимо ввести еще ряд настроек. Окна с настройками представлены ниже (рис. 10, 11, 12).

Рисунок 10 — Настройка нейронных сетей с помощью мастер решений (1)

Рисунок 11 — Настройка нейронных сетей с помощью мастер решений (2)

Рисунок 12 — Настройка нейронных сетей с помощью мастер решений (3)

В следующем этапе предстоит выбрать нейронные сети, наиболее подходящие (рис.13). На вкладке «Быстрый» необходимо выбрать опцию «Итоги моделей». Появившуюся таблицу отсортируем по «Тест. производительности» по возрастанию, выберем три сети с наименьшим показателем, запомним их номера (рис.14).

Рисунок 13 — Результаты по поиску нейронных сетей

Рисунок 14 — Сортировка и поиск необходимый нейронных сетей

Во вкладке «дополнительно» выбираем функцию «проекция временного ряда». Выбираем наши нейронные сети из списка, нажав на кнопку «Выбрать модели» (рис. 15).

Рисунок 15 — Список выбранных нейронных сетей

Для графического отображения прогнозирования необходимо нажать кнопку «График временного ряда» (рис. 16).


Рисунок 16 — График временного ряда выбранных нейронных сетей

Судя по графику, две сети плохо реагируют на данные и скорее всего не справляются с поставленной задачей, поэтому для сравнения будут браться результаты нейронной сети №57, отображенной красной линией на графике.

Сравнение двух методов. Анализ полученных результатов

Для сравнения проанализируем результаты двух методов (рис. 17,18).


Рисунок 17 — Данные с результатом прогноза нейронных сетей

Рисунок 18 — Данные с результатом прогноза АРПСС (ARIMA)

Для наглядности объединим данные в одну таблицу. Посчитаем разницу между прогнозом АРПСС и нейронной сетью. Так же определим рамки допустимых значений с помощью доверительного коридора АРПСС. Результат отображен на рис. 19.

Рисунок 19 – Итоговое сравнение результатов прогноза

Отметим, что средняя разница в числах равно 2445.65, однако и отметим, что данное отклонение находится в пределах доверительного коридора АРПСС(ARIMA).

При всем при этом необходимо понимать, что прогнозирование не способно решить все возможные проблемы, а наиболее эффективно в комплексе с другими анализами. Так же прогнозирование не учитывает резкого изменения факторов, которые особенно сильно влияют на прогноз. Проведенное исследование может быть использовано в при обучении методам интеллектуального анализа студентов различных направлений [36-38].


Библиографический список
  1. Боровиков В.П., Боровиков И.П. STATISTICA статистический анализ и обработка данных в среде Windows. М.: Филинъ, 1997.
  2. Халафян А.А. STATISTICA 6. Статистический анализ данных. Учебник. М.: Бином, 2007. 512 с.
  3. Большаков П.С. Возможности Statistica Data Miner. URL: http://images.nature.web.ru/nature/2003/04/11/0001193684/04.pdf
  4. STATISTICA (Версия 6.1). Электронное руководство.
  5. Попов А.А. Основы проведения факторного анализа социально-экономического развития региона с использованием программного комплекса SPSS (на примере Алтайского края) // Вестник Российского экономического университета им. Г.В. Плеханова. 2010. № 5. С. 81-88.
  6. Попов А.А. Проведение факторного анализа экономики региона с использованием программной системы SPSS // В мире научных открытий. 2010. № 2-1. С. 120-124.
  7. Остапенко Р.И. Особенности моделирования латентных изменений с помощью AMOS SPSS // Перспективы науки и образования. 2014. № 1 (7). С. 89-95.
  8. Остапенко Р.И. Особенности анализа лонгитюдных данных в психолого-педагогических исследованиях с помощью AMOS SPSS // Современные научные исследования и инновации. 2014. № 4 (36). С. 74.
  9. Серов А.А. Скоринг экспериментальных данных с применением прогнозных моделей в среде пакета SPSS // Традиции и новации в профессиональной подготовке и деятельности педагога. Материалы Всероссийской научно-практической конференции преподавателей и студентов. Ответственный редактор В.П.Анисимов. Тверь: Тверской государственный университет, 2013. С. 53-54.
  10. Суслов С.А. Кластерный анализ: сущность, преимущества и недостатки // Вестник НГИЭИ. 2010. Т. 1. № 1. С. 51-57.
  11. Демин Л.А., Суслов С.А., Экономико-математические методы моделирования экономических систем: учебно-методическое пособие./Л. А. Демин. Княгинино: Нижегородский государственный инженерно экономический институт, 2006. 56 с.
  12. Муллинов Д.О., Баженов Р.И. Разработка в среде EVIEWS регрессионной модели рынка гаражных помещений г. Биробиджана //Nauka-Rastudent.ru. 2015. № 1 (13). С. 43.
  13. Лагунова А.А., Баженов Р.И. Разработка в среде GRETL регрессионной модели рынка вторичного жилья г. Биробиджана // Nauka-Rastudent.ru. 2015. № 1 (13). С. 40.
  14. Пронина О.Ю., Баженов Р.И. Исследование методов регрессионного анализа программной среды EVIEWS // Nauka-Rastudent.ru. 2015. № 1 (13). С. 45.
  15. Баженов Р.И., Векслер В.А., Гринкруг Л.С. RFM-анализ клиентской базы в прикладном решении 1С:Предприятие 8.3 // Информатизация и связь. 2014. № 2. С. 51-54.
  16. Пивенко К.А., Баженов Р.И. Построение регрессионной модели в среде GRETL на примере рынка поддержанных автомобилей г. Биробиджана и г. Хабаровска // Экономика и менеджмент инновационных технологий. 2015. № 4-1 (43). С. 72-80.
  17. Эм А.А., Баженов Р.И. Разработка в среде EVIEWS регрессионной модели реализации продукции компании по производству резинометаллических изделий // Экономика и менеджмент инновационных технологий. 2015. № 4-2 (43). С. 58-709.
  18. Муллинов Д.О., Винокуров А.С., Баженов Р.И. Разработка в среде SPSS регрессионной модели рынка автомобилей // Nauka-Rastudent.ru. 2015. № 6 (18). С. 24.
  19. Широкова Н.А., Баженов Р.И. Применение корреляционного анализа для исследования данных спортивных показателей студентов в среде SPSS // Nauka-Rastudent.ru. 2015. № 6 (18). С. 25.
  20. Осипов В.Ю. Рекуррентная нейронная сеть с двумя сигнальными системами // Информационно-управляющие системы. 2013. № 4 (65). С. 8-15.
  21. Осипов В.Ю. Нейронная сеть с прошедшим, настоящим и будущим временем // Информационно-управляющие системы. 2011. № 4. С. 30-33.
  22. Манжула В.Г., Федяшов Д.С. Нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных // Фундаментальные исследования. 2011. № 4. С. 108-114.
  23. Манжула В.Г. Оценка интегральной избыточности в процессе синтеза микроэлектронных систем // Современные проблемы науки и образования. 2011. № 4. С. 33.
  24. Манжула В.Г. Информационная поддержка синтеза схемотехнически интегрированных принципиальных электрических схем // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Информатика. Телекоммуникации. Управление. 2012. Т. 2. № 145. С. 144-150.
  25. Колбасина И.В., Старовойт Е.Д., Бежитский С.С. О качестве восстановления образов искусственной нейронной сетью Хопфилда // Решетневские чтения. 2013. Т. 2. № 17. С. 26-27.
  26. Седов В.А., Седова Н.А. Моделирование расхождения судов в зоне чрезмерного сближения нейронными сетями // Научные проблемы транспорта Сибири и Дальнего Востока. 2014. № 3. С. 102-105.
  27. Седов В.А., Седова Н.А. Гибридная система управления судном // Научно-технический вестник Поволжья. 2013. № 2. С. 204-207.
  28. Варламов А.Д., Шарапов Р.В. Использование нейронных сетей в задачах мониторинга экзогенных процессов дистанционными методами // Геоинформатика. 2014. № 4. С. 62-68.
  29. Варламов А.Д., Шарапов Р.В. Использование нейронных сетей для оценки уровня заболоченности территории на основе данных дистанционного зондирования // Нейрокомпьютеры: разработка, применение. 2015. № 3. С. 29-33.
  30. Варламов А.Д. Использование априорной информации о месторасположении объектов лица для оценки его биометрических признаков нейронной сетью // Нейрокомпьютеры: разработка, применение. 2015. № 3. С. 34-38.
  31. Николаев С.В., Баженов Р.И. Распознавание образов с помощью нейронных сетей в среде MATLABR2009B // Nauka-Rastudent.ru. 2015. № 1 (13). С. 44.
  32. Ступников А.В., Баженов Р.И. Прогнозирование цены легковых автомобилей с помощью нейронных сетей в среде Neural Network Wizard // Современная техника и технологии. 2015. № 7 [Электронный ресурс]. URL: http://technology.snauka.ru/2015/07/7462 (дата обращения: 01.07.2015).
  33. Баженов Р.И. Информационная безопасность и защита информации: практикум. Биробиджан: Изд-во ГОУВПО «ДВГСГА», 2011. 140 с.
  34. Баженов Р.И. Интеллектуальные информационные технологии. Биробиджан: ПГУ им. Шолом-Алейхема, 2011. 176 с.
  35. Баженов Р.И. О применении балльно-рейтинговой системы для оценивания курсовых работ по дисциплине «Интеллектуальные системы и технологии» // Приволжский научный вестник. 2014. № 5 (33). С. 135-138.
  36. Баженов Р.И. Проектирование методики обучения дисциплины «Интеллектуальные системы и технологии» // Современные научные исследования и инновации. 2014. № 5-2 (37). С. 48.
  37. Баженов Р.И. Проектирование методики обучения дисциплины «Информационные технологии в менеджменте» // Современная педагогика. 2014. № 8 (21). С. 24-31.


Все статьи автора «Баженов Руслан Иванович»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: