ИНТЕЛЛЕКТУАЛЬНАЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ СИСТЕМА ДЛЯ РЕАЛИЗАЦИИ МЕТОДА СИНТЕЗА ОПТИМАЛЬНОГО ПЛАНА НАЛОГОВЫХ ПРОВЕРОК

Бирюков Александр Николаевич
Стерлитамакский филиал Башкирский государственный университет
доктор экономических наук, доцент, профессор кафедры экономической теории и анализа

Аннотация
Вопросы, рассматриваемые в публикации, возникли в связи с объективной необходимостью проведения исследований, направленных на повышение эффективности работы налоговых органов.
Государство не может тратить большие средства на сбор налогов, поэтому сама структура налогов и государственная система налогового администрирования, обеспечивающие их сбор, должны при минимальных затратах обеспечивать высокую эффективность работы, которая невозможна без хорошей информационно-аналитической системы поддержки принимаемых решений.
В настоящее время существует мощный математический инструментарий (универсальный аппроксиматор) – нейронные сети.
Предложенный системно – информационный подход создал методологическую основу новой компьютерной технологии и способность интеллектуальной нейросетевой модели извлекать новые знания о кластере налогоплательщиков для налогового администрирования.

Ключевые слова: база данных деклараций, налогоплательщик, нейросетевая модель, система налогового администрирования, экспертная система

Библиографическая ссылка на статью:
Бирюков А.Н. Интеллектуальная информационно-аналитическая система для реализации метода синтеза оптимального плана налоговых проверок // Экономика и менеджмент инновационных технологий. 2017. № 9 [Электронный ресурс]. URL: https://ekonomika.snauka.ru/2017/09/15244 (дата обращения: 30.06.2025).

На макроуровне налоговое администрирование – это крупномасштабный процесс обеспечения устойчивого функционирования совокупного налогового механизма в ходе прогнозирования, регулирования и контроля за налоговыми поступлениями в бюджет, объединяющий правовые основы налогообложения, достижения финансовой науки и экономической практики.
Актуальной проблемой остается совершенствование технологии налогового администрирования. Современная деятельность налогоплательщиков в условиях кризиса российской экономики характеризуется неопределенностью внешней и внутренней среды. Результатом этих тенденций является разброс выходных параметров экономической деятельности организаций, что во многих случаях предопределяет высокий риск неэффективности налоговых проверок. Поэтому переход к математической формализации этапов принятия решений наталкивается на ряд трудностей, связанных с проблемой моделирования плохо формализуемых систем. Одна из таких трудностей в обратных задачах восстановления зависимостей (интерпретации), которые относятся к классу некорректных (или плохо определенных) – это обеспечение устойчивости решения в сложных условиях моделирования.
Объектом исследования в статье являются применение новых информационных технологий и математических методов в аспекте модернизации налогового администрирования на основе нейросетевого моделирования.

1. Комбинированный системно-синергетический-информационный подход к исследованию сложных математико-информационных систем

1.1.Условия моделирования

Прежде всего, поясним смысл термина «математико-информационная система». В самом общем виде нейросетевая модель может быть записана в виде:
; (1)
где – вектор выходных (расчетных) величин; – вектор входных сигналов нейросети (объединяющих переменных или факторов); W – матрица синаптических весов связей между нейронами; , – пространства вещественных чисел; n, m – размерность векторов входа и выхода сети; F() – оператор нейросетевого отображения пространства в пространстве (рис. 1) [7].
Поскольку нейросеть отображает пространство одних функций в пространстве других функций, то нейросетевая модель – это математическая модель, заданная сложной композицией ряда операторов суммирования сигналов с синаптическими весами, нелинейного отображения результатов весового суммирования с помощью активационных функций, градиентного поиска при нахождении весов W в процессе обучения и др.
Следовательно, нейросетевая модель (НСМ) как инструмент отображения, по сути математическая интеллектуальная (обучаемая) модель [6].
С другой стороны, в НСМ согласно системе правил, предписанных программой для компьютера, происходит извлечение информации из данных, структурирование и ее дальнейшее преобразование. В этом смысле НСМ – это информационная система, состоящая из модулей преобразования информации. В нейроэмуляторах (программах) – это программные модули. В нейросетях типа реальных микросхем блоки – это выделенные электронные модули, содержащие нейросетевой блок (нейроплаты), выполняющие типовые нейрооперации.

Рис.1. Отображение входной области (шара ) в выходной диапазон .

Поэтому в общем случае, т.е. без конкретизации контекста рассмотрения задачи, НСМ – это «математико-информационная система», причем довольно сложная (не по количеству модулей в ней, а по характеру связей между ними)[8].
Для выработки управленческих решений в процессах налогового администрирования необходимы модели аппроксимации, кластеризации и ранжирования налогоплательщиков по показателям их финансового состояния.
Построение таких моделей является непростым делом, поскольку условия моделирования очень сложные:
– моделируемая система характеризуется наличием в базе данных сильного «зашумления» и даже сознательных искажений («приписок») в силу субъективных тенденций планирования и отчетности, т.е. стремления налогоплательщиков понизить налогооблагаемую базу;
– моделируемые системы налогового администрирования относятся к классу трудно формализуемых, особенно на этапе спецификации переменных и принятия решений с использованием моделей;
– моделируемая система, как впрочем, большинство экономических систем, отличается дефицитом наблюдений в базе данных, которые обновляются лишь в отчетные периоды (один раз в квартал), заметим, что для применяемого в работе инструментария – нейронных сетей это наиболее осложняющее обстоятельство;
– существенное влияние на деятельность систем налогового администрирования оказывают случайное (неконтролируемое) изменение внутренней структуры моделируемой системы, а также законодательства за период формирования базы данных;
– существует сильная зависимость показателей деятельности налогоплательщиков от случайных воздействий внешней экономической, политической и социальной среды.
Перечисленные условия потребовали комбинированного системного – синергетического – информационного подхода к разработке математических моделей с привнесением новой технологии в разработке алгоритма отдельных вычислительных операций с применением нейросетевого моделирования [1, 2].
Детализируем сущность разработанных подходов.

1.2. Методические основы разработки системы налогового администрирования и место в ней гибридной нейросетевой модели

Под внутренней структурой, или просто структурой системы мы будем понимать для простоты организацию системы, т.е. пространственное расположение элементов, систему отношений элементов, совокупность устойчивых межэлементных связей, внутреннее устройство, закон взаимодействия [9].
Под пространственной организацией понимается морфологический анализ базы данных деклараций (БДД) с образованием исходного однородного кластера в рамках налоговой инспекции. Эти границы очерчены требованием синтеза оптимального плана выездных проверок на уровне налоговых инспекций, т.е. по территориальному принципу.
В рассматриваемой системы налогового администрирования (СНА), показанной на рис.2, наименьший структурный элемент-фрагмент налоговой декларации, содержит весь набор компонентов вектора входных факторов согласно принятой спецификации переменных и взаимно однозначно соответствующее этим переменным значение выходной случайной величины Y.
При переходе от традиционной системы налогового контроля и управления (СНКУ) с электронной системой обработки данных (ЭОД) к новой, структурный элемент проходит эволюцию в системе, степень открытости которой возрастает. Связь между элементами (в информационном аспекте, т.е. в процессе порождения новых знаний) становиться все более сложной и жесткой по мере усовершенствования информационной модели в системе налогового контроля и управления (СНКУ) в ходе научного исследования. В пределе, когда степень открытости достигает максимального значения (соответственно, адекватность математической модели достигнет требуемого уровня), поведение всех структурных элементов в алгоритме обучения нейросети – «ядро системы» – будет близким к детерминированному. Реально указанный предел недостижим, ибо сама природа системы налогового администрирования (СНА) стохастическая.
Отметим, что в кибернетике одной из важнейших задач оптимизации системы является достижение максимальной организованности при заданной сложности либо уменьшение сложности при данном уровне организованности.
В новой технологии налогового контроля, планирования и управления имеет место первый случай: из заданного количества элементов построить оптимальную систему, т.е. достичь максимальной организованности.
Структурные закономерности и свойства системы
При формулировке понятия «система», интегративные ее свойства обусловлены не только свойствами самих структурных элементов системы, но и зависят от взаимодействия внутренних элементов системы, так и внешней среды.
В этом смысле «внешний мир» формирует свойство системы. В самом деле, если во «внешнем мире» исчезает «потребитель» информации о каком-нибудь свойстве системы, то исчезает и само свойство системы, так как в отношении этого свойства система окажется изолированной (закрытой) и по закономерности возрастания энтропии в замкнутой системе в ней возникают процессы, дезорганизующие структуры, ответственные за данные свойства[10].
С другой стороны, появление у системы некоторого нового свойства порождает информацию о свойстве, и, если во внешней среде имеется «потребитель» этой информации, в нашем случае экспертная система налогового администрирования (ЭСНА) (на рис.2), который способен воспринимать ее и тем самым взаимодействовать с системой, то по этому свойству система окажется открытой. Тогда закон убывания энтропии начнет преобладать над законом роста энтропии, и это свойство разовьется до некоторого оптимального уровня, которое определяется числовым значением степени открытости системы.
В системе налогового контроля и управления (СНКУ) упомянуто первое новое свойство – это способность интеллектуальной нейросетевой модели (НСМ) извлекать новые знания об усредненной «производственной функции» кластера налогоплательщиков из преднамеренно искаженных данных налоговых деклараций и на основе этих знаний идентифицировать нарушения налогового законодательства. Второе свойство – это оптимальным образом с заданной доверительной вероятностью производить отбор налогоплательщиков для выездных проверок.
Рассмотрим теперь вопрос о взаимосвязи новых свойств и структуры системы. Известно [3, 4], что свойства системы порождаются структурными закономерностями системы. Следовательно, в системе образуются только такие структурные закономерности, которые через порождаемые свойства системы имеют внешнего потребителя. Структурные закономерности системы – это наиболее общие закономерности, которые порождают свойство системы как целого, т.е. свойства, по которым внешняя среда выделяет систему среди других.
Переработка информации приводит к сравнению и оценке действительного и желаемого «эталонного» состояния системы, описанного производственной функцией (1), в результате чего появляется новая информация, необходимая для выполнения управленческого акта, ведущего к полезному конечному результату в процессе управления. Команда управления требует ее исполнения, т.е. осуществления управленческих воздействий. Обычно в системах команды управления должны быть преобразованы в вещественно-энергетическое, финансовое или какое-то иное воздействие на объект управления , где g – номер предприятия – налогоплательщика.
В рассматриваемой системе налогового администрирования (СНА) мы определили границу системы на выходе блока экспертной системы налогового
администрирования (ЭСНА), принимающая управленческие решения о налоговых проверках на базе синтезированного оптимального плана выездных проверок, а также по налоговому планированию и регулированию. Эти решения и есть управляющие воздействия на субъекты налогообложения. Они возможны, в частности, в виде:
– реализации выездной проверки на данном субъекте;
– отправка «профилактического» уведомления о нарушении;
– предоставление налоговых льгот либо, наоборот, наложение санкций и др.;
– включения синтезированного плана выездных проверок в план работы системы налогового планирования (СНП).
Для этой цели исполнительный орган – лицо, принимающее решения (ЛПР), разрабатывающий управляющие воздействия на объекты управления (вещественно-энергетические, финансовые или информационные), должен располагать необходимыми законодательными ресурсами.
Именно в этом проявляется единство информационных и вещественно-энергетических процессов при управлении и возможна состоятельная постановка задачи оптимального управления, а именно: выработать такие управления, которые приводили бы к максимальной ожидаемой сумме доначислений при ограничениях на затраты на контролеобеспечивающие ресурсы.

2. Описание работы структурно-функциональной схемы системы налогового администрирования

Вначале укажем назначение всех подсистем и блоков, а затем опишем их работу во взаимодействии.
Цель функционирования системы налогового администрирования (СНА) – порождение интегративного эффекта – объективной классификации совокупности субъектов налогообложения на «нарушителей» и «не нарушителей» налогового законодательства, их ранжирование и синтез на этой основе управляющих воздействий и , где N₂ – количество субъектов, подвергаемых процедуре выездных проверок и штрафных санкций; N₃=N₁-N₂– количество субъектов, подвергнутых профилактическим воздействиям. Другими словами, синергетический эффект в СНА состоит в восстановлении по совокупности исходных данных деклараций примерно однородных кластеров налогоплательщиков « обобщенной производственной функции» и, затем на ее основе, выявление среди субъектов налогообложения нарушителей налогового законодательства.
Опишем структурные связи и назначения над- и подсистем рассматриваемой интеллектуальной информационно-аналитической системы поддержки принятий решений по налоговому администрированию (ИСНА) (рис.2), а затем детализируем работу ее подсистем и блоков. На рисунке сплошными линиями показаны блоки алгоритмов, а пунктирными линиями – их условное объединение в подсистемы.
Потребителями структурированной информации, порождаемой на выходе ИСНА, является соответствующие экспертные системы подсистем налогового контроля, налогового планирования и налогового регулирования, которые входят в состав системы налогового администрирования (СНА):

Рис. 2. Структурно-функциональная схема интеллектуальной информационно- аналитической системы поддержки принятия

ЭСНП – экспертная система налогового планирования;
ЭСНР – экспертная система налогового регулирования;
ЭСНК – экспертная система налогового контроля.

В структуре ИСНА на рис.2, подсистему, ЭСНК обслуживают все подсистемы ИСНА: ВОПФ, ОПП, СПВП, где введены обозначения:

ВОПФ – подсистема восстановления «обобщенной производственной функции» кластера налогоплательщиков на основе данных деклараций с помощью нейросетевых моделей;
ОПП – подсистема обобщенного перекрестного подтверждения, т.е. финишной (интегральной) проверки адекватности гибридной нейросетевой модели (ГНСМ) на байесовском ансамбле нейросетей;
СПВП – подсистема синтеза планов выездных налоговых проверок.

Подсистемы ЭСНП и ЭСНР обслуживает одна подсистема – ВОПФ.
Надсистемой для ИСНА является система электронной обработки данных (ЭОД) [2,4], действующая в настоящее время в Федеральной налоговой службе РФ.
Назначением ИСНА в целом является порождение объективной и хорошо структурированной информации об экономических закономерностях, скрытых в зашумленных данных, для решения прикладных задач в подсистемах ЭСНП, ЭСНР, ЭСНК налоговых систем бюджетных уровней.
Отметим, что в статье исследованы не все функции подсистем налогового администрирования (планирования, контроля, регулирования) и не с одинаковой степенью детализации. Основное внимание уделено подсистеме налогового контроля.
В ИСНА также входят:

ОУ – объект управления, который включает в себя совокупность субъектов налогообложения, т.е. предприятий – налогоплательщиков
М – монитор системы ЭОД, который служит для сбора, хранения и структурирования информации о налогоплательщика с целью контроля и управления.
И – интерфейс, который служит для формирования потока данных Ω₁ , т.е. совокупности деклараций о налогоплательщиках.

В подсистему ВОПФ входят подсистемы ниже следующего уровня:

БДД – база данных деклараций для множества за некоторый ретроспективный отрезок времени , включая СУБД – систему управления базой данных.
БАН – подсистема построения байесовского ансамбля нейросетей, которая предназначена для восстановления нелинейной многомерной «обобщенной производственной функции» скрытой в данных, и порождения отклонений , где g – номер предприятия – налогоплательщика, между расчетными и декларированными данными.
АБАН – подсистема регуляризации и оценки адекватности нейросетевой модели на байесовском отфильтрованном ансамбле нейросетей. Эта подсистема включает в себя блоки 0АВ₁,…, 0АВ_Q оценки апостериорной вероятности гипотез-нейросетей и блок фильтрации этих нейросетей, т.е. сужение априорного ансамбля.
ОПП – подсистема обобщенного перекрестного подтверждения, которая служит для финишной (интегральной) оценки адекватности комплексной модели.

Блоки СЛП₁, …, СЛП_Q, входящие в подсистему ОПП, служат для синтеза локальных (для каждой q-ой нейросети в отфильтрованном ансамбле) планов выездных налоговых проверок.
Логический блок «Проверка ОПП» служит для оценки условия взаимного подтверждения синтезированных локальных планов выездных проверок.
СПВП – подсистема синтеза единого плана выездных проверок Θ^*, усредненного на отфильтрованном и прошедшем ОПП байесовском ансамбле нейросетей.
В подсистему СПВП входят блоки:

УОБА – блок усреднения отклонений на отфильтрованном и прошедшем процедуру ОПП байесовском ансамбле.
ПЗР – блок проверки соответствия усредненных отклонений нормальному закону распределения плотности вероятности.
ОВО – блок оценки вероятности в критерии ранжирования налогоплательщиков Ψ_g по (2) на основе функции Лапласа:

(2)
где =– значение верхней границы доверительного интервала для отклонения (=), т.е. в записи отклонения фиксируется номер налогоплательщика g и момент наблюдения t); – вероятность события, что ожидаемое значение отклонение δ_g моделируемой случайной величины Y будет больше выборочного среднего с учетом его смещения на полуширину доверительного интервала для {_g}; t₀ – момент времени, соответствующий последним данным декларации при ранжировании налогоплательщиков; M_g – экспертно задаваемый коэффициент масштаба g –го налогоплательщика.

ОФР – блок оценки фрактальной размерности временного ряда остатков в критерии ранжирования налогоплательщиков Ψ_g .
ДВВ – блок данных внешних ведомств, который служит для сбора дополнительной информации о налогоплательщиках (от таможенной службы, транспортных ведомств, администраций регионов и муниципальных образований, правоохранительных органов и др.). Эти дополнительные данные могут быть использованы в ЭСНК лицом, принимающим решения (ЛПР), для цензурирования синтезированных планов выездных проверок Θ^*, а также цензурирования вектора регулирующих (управляющих) воздействий , прикладываемых к ОУ.

Схема рис.2 уже дает достаточно подробное представление о прикладных аспектах, разработанных в работе подходов, методов, алгоритмов. Остается дополнить описание схемы взаимодействием подсистем и блоков при обработке информации.
Поток данных деклараций Ω₁ совокупности налогоплательщиков  извлекается из интерфейса ЭОД и подается в подсистему БДД в исходном (не связанным с форматом конкретного программного продукта) формате.
В БДД в зависимости от используемого для построения нейросетей программного продукта (NeuroSolutions, BrainMaker Pro, MATLAB и др.) с помощью СУБД формируется поток данных Ω₂ в формате, требуемом в данном программном продукте. Например, в программном продукте Neuro Solutions – это таблица, вектор – строки которой образуют кортежи, соответствующие данному наблюдению с текущим сквозным номером i:
(3)
В кортежах вектор входных факторов,  измеренный в момент времени t для предприятия – налогоплательщика с номером g взаимно однозначно соответствует значению выходного показателя y_g,t, для простоты изложения принятого скалярным. В работе использовались данные панельного типа [5], в которых кортежи упорядочены как по времени, так и по номеру. Следовательно, каждому фиксированному предприятию (g=const) соответствуютТ временных отсчета ().
В подсистеме БАН согласно методу вложенных математических моделей (МВММ), с помощью совокупности алгоритмов (I.1 – I.7 из рис.3) предпроцессорной обработки «сырых» данных, подступающих из БДД, строятся вспомогательные вложенные нейросетевые субмодели ВММ₁, …, ВММ_q, …, ВММ_Q соответственно для каждой q-ой априорной нейросети – гипотезы  байесовского ансамбля. В основных нейросетевых моделях НСМ₁, …, НСМ_q, …, НСМ_Q ансамбля реализуется байесовская регуляризация обучения сетей в соответствии с приближенным методом байесовской регуляризации (алгоритмы II.1 – II.6 из рис.3).
При этом в соответствии с общесистемной фоновой закономерностью полезным сигналом, отраженным от фона, является относительное отклонение {δ}, вычисленные по (4):
, (4)
и с выходов сетей ансамбля подаются в блоки оценки апостериорной вероятности 0АВ₁, …, 0АВ_Q. Здесь вычисляются вероятности , где - число хорошо объясненных точек множества N данных в q-ой сети ансамбля. Затем в блоке фильтрации байесовских гипотез (ФБГ) осуществляется отсев (фильтрация) нейросетей – гипотез с неприемлемым качеством объяснения данных на уровне заданного параметра ξ.
В блоке ФБГ хранятся необходимые выходные величины уже отфильтрованного ансамбля нейросетей, в частности оценки апостериорных вероятностей, параметры регуляризации ξ, отклонений ; . Здесь и далее звездочки над величинами соответствуют отфильтрованному ансамблю.
Отклонения  извлекаются из блока ФБГ и подаются в подсистему ОПП. Здесь в блоках СЛП₁, …, СЛП_q, …, СЛП_Q* производится синтез локальных планов выездных налоговых проверок. Термин «локальных» здесь означает, что план синтезируется для каждой отдельной q-ой нейросети – гипотезы, прошедшей процедуру фильтрации.
В блоке «Проверка ОПП» сравниваются локальные планы и степень совпадения в них множества налогоплательщиков, отобранных для первоочередной выездной налоговой проверки, т.е. реализуется процедура ОПП по финишному критерию P^GCV .

Рис 3. Логическая схема модифицированного метода вложения математических моделей (МВММ)

Сети, прошедшие процедуру ОПП, используются далее в подсистеме СПВП для получения, усредненного на ансамбле нейросетей рабочего плана выездных проверок. В блоке УОБА отклонения  усредняются на отфильтрованном и прошедшем процедуру ОПП байесовском ансамбле нейросетей.
Полученное множество отклонений  сортируется с образованием временных рядов  для каждого фиксированного налогоплательщика. В блоке ПЗР проверяется непротиворечие закона распределения плотности вероятности отклонений  нормальному закону.
В случае неподтверждения этой гипотезы в блоке ОВО производится оценка вероятности , используемой в критерии отбора Ψ (2).
В случае подтверждения гипотезы о нормальности распределения в блоке ОФР производится оценка фрактальной размерности D^-1 временных рядов .
Затем по (2) вычисляются ранги {Ψ_g} налогоплательщиков и синтезируется усредненный оптимальный план Θ^* выездных налоговых проверок.
Таким образом, в экспертную систему налогового контроля (ЭСНК) итоги переработки исходной сырой информации  о налогоплательщиках поступают уже в глубоко структурированном и обобщенном виде оптимального плана выездных проверок Θ^*. Остается в ЭСНК подвергнуть синтезированный план Θ^* цензурированию для выработки управляющих воздействий  прикладываемых к ОУ.

Библиографический список

Методологические основы разработки нейросетевых моделей экономических объектов в условиях неопределенности / А.Н. Бирюков [и др.]. – М.: Издательский дом «Экономическая газета», 2012. – 494 с.
Бирюков А.Н. Теоретические основы разработки нейросетевых моделей в системе налогового администрирования. – Уфа: Академия наук РБ, Издательство «Гилем», 2011. – 380 с.
Бирюков А.Н. Байесовская регуляризация нейросетевых моделей ранжирования и кластеризации экономических объектов. – Уфа: Академия наук РБ, Издательство «Гилем», 2011. – 292 с.
Бирюков А.Н. Бюджетно − налоговое администрирование: нейросетевые методы исследований. – Стерлитамак: РИО Стерлитамакский филиал БашГУ, 2014. – 152 с.
Модернизация налогового контроля (модели и методы): Монография/ (Под ред. А.Н.Романова). – М.: Вузовский учебник, 2010. – 320 с.
Хайкин С. Нейронные сети: полный курс = Neural Networks: A Comprehensive Foundation. 2-е изд. М –.: Вильямс, 2006. – 1104 с.
Эндрю А. М. Искусственный интеллект / Под ред. Поспелова Д.А. – М.: Мир, 1985. – 264 с.
Ясницкий, Л. Н. Интеллектуальные системы.– М.: Издательство «Лаборатория знаний», 2016 . – 221 с.
Hayes-Roth F., Jacobstein N. The State of Enowledge-Based Systems. Communications of the АСМ, March, 1994, v.37, n.3, рр.27-39.
Zimmermann H.-J. Fuzzy Set Theory and its Applications. 3rd ed.- Dordrecht: Kluwer Academic Publishers. – 1996. 315p.

Все статьи автора «Бирюков Александр Николаевич»

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться:

Авторам

О журнале

ИНТЕЛЛЕКТУАЛЬНАЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ СИСТЕМА ДЛЯ РЕАЛИЗАЦИИ МЕТОДА СИНТЕЗА ОПТИМАЛЬНОГО ПЛАНА НАЛОГОВЫХ ПРОВЕРОК

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий