Математические методы прогнозирования в бизнесе. Классификация методов и моделей прогнозирования

Размещено на http://www.allbest.ru/

План

Введение

1. Сущность и классификация методов экономическо-математического прогнозирования

1.1 Основные методы экономическо-математического прогнозирования

1.2 Основные идеи технологии сценарных экспертных прогнозов

2. Применение информационных технологий в экономико-математическом прогнозировании

Заключение

Список использованной литературы

Введение

Экономическая система в нашей стране, сложившаяся к концу 80-х годов, характеризовалась относительно высокой материалоемкостью и фондоемкостью производства, низкими темпами развития научно-технического прогресса, значительной разбалансированностью хозяйства. Возникшие проблемы, связанные с низкой производительностью труда, технической к технологической отсталостью, ухудшением окружающей среды, низким уровнем промышленной продукции и структурными диспропорциями, должны были решить экономические реформы.

В течение нескольких лет экономических реформ удалось решить только ряд тактических задач, в частности, добиться улучшения соотношения между денежным спросом населения и предложением потребительских товаров. Но это было достигнуто не за счет увеличения выпуска последних, а вследствие снижения реальных доходов основной части населения.

Современное социально-экономическое положение Российской Федерации характеризуется острым структурным кризисом, обусловившим резкое падение уровня жизни. Этот кризис выражается в том числе в снижении выпуска товаров производственного и потребительского назначения, а в целом ряде случаев, в прекращении производственно-хозяйственной деятельности промышленных предприятий. Как следствие создавшегося положения - снижение расходов на социальные нужды. Другим важным аспектом кризисной ситуации является потеря не только международных, но и внутренних региональных рынков сбыта продукции для отечественных товаропроизводителей.

Падение внутреннего производства, естественно, предопределяет необходимость широкого импорта товаров производственного, и особенно, потребительского назначения, в частности, такой важной позиции как продовольствие. В свою очередь, расширение объемов импорта требует стимулирования экспорта для приобретения иностранной валюты. Но так как на международные рынки отечественная продукция в настоящее время не имеет выхода (по различным причинам - низкое качество, неконкурентоспособность и т. д.), то экспортируется сырье - нефть, газ, руды, древесина, что крайне отрицательно сказывается на общем состоянии экономики страны.

Возникшие проблемы не могут быть решены даже при снижении темпов инфляционного процесса. Более того, инвестиции малыми долями во многие отрасли промышленного производства абсолютно неэффективны при отсутствии четкого, реального планирования и прогнозирования экономических процессов.

Эффективность же экономических исследований и прогнозов в настоящее время во многом зависит от того, как полно и точно отражены в них характерные черты экономических процессов. При этом наиболее значительное влияние на надежность и достоверность исследований оказывают показатели, характеризующие увеличение сложности, скорости протекания, неопределенности и возможного количества альтернатив реализации экономических процессов.

Готовить и принимать управленческие решения на современном этапе приходится в условиях высокой степени динамического изменения экономических процессов, резко возросшей их сложности, недетерминированности и нелинейности. При этом, разрабатывая прогнозные варианты развития экономических процессов, необходимо учитывать комплексность, системность, многофакторность и многовариантность их дальнейшего развития.

Цель работы - исследование сущности, классификации и инструментов экономико-математических методов прогнозирования.

1) изучить сущность и классификация методов экономическо-математического прогнозирования

2) рассмотреть применение информационных технологий в экономико-математическом прогнозировании

1. Сущность и классификация методов экономическо-математического прогнозирования

1.1 Основные методы экономическо-математического прогнозирования

Кратко рассмотрим различные методы прогнозирования (предсказания, экстраполяции), используемые в социально-экономической области. По вопросам прогнозирования имеется большое число публикаций. Как часть эконометрики существует научная и учебная дисциплина "Математические методы прогнозирования". Ее целью является разработка, изучение и применение современных математических методов эконометрического (в частности, статистического, экспертного, комбинированного) прогнозирования социально-экономических явлений и процессов, причем методы должны быть проработаны до уровня, позволяющего их использовать в практической деятельности экономиста, инженера и менеджера.

К основным задачам этой дисциплины относятся разработка, изучение и применение современных математико-статистических методов прогнозирования (в том числе непараметрических методов наименьших квадратов с оцениванием точности прогноза, адаптивных методов, методов авторегрессии и др.), развитие теории и практики экспертных методов прогнозирования, в том числе методов анализа экспертных оценок на основе статистики нечисловых данных, методов прогнозирования в условиях риска и комбинированных методов прогнозирования с использованием совместно экономико-математических и эконометрических (как статистических, так и экспертных) моделей. Теоретической основой методов прогнозирования являются математические дисциплины (прежде всего, теория вероятностей и математическая статистика, дискретная математика, исследование операций), а также экономическая теория, экономическая статистика, менеджмент, социология, политология и другие социально-экономические науки .

Как общепринято со времен основоположника научного менеджмента Анри Файоля, прогнозирование и планирование - основа работы менеджера. Сущность эконометрического прогнозирования состоит в описании и анализе будущего развития, в отличие от планирования, при котором директивным образом задается будущее движение. Например, вывод прогнозиста может состоять в том, что за час мы сможем отойти пешком от точки А не более чем на 5 км, а указание плановика - в том, что через час необходимо быть в точке Б. Ясно, что если расстояние между А и Б не более 5 км, то план реален (осуществим), а если более 10 км - не может быть осуществлен в заданных условиях. Необходимо либо отказаться от нереального плана, либо перейти на иные условия его реализации, например, двигаться не пешком, а на автомашине. Рассмотренный пример демонстрирует возможности и ограниченность методов прогнозирования. А именно, эти методы могут быть успешно применены при условии некоторой стабильности развития ситуации и отказывают при резких изменениях .

Один из вариантов применения методов прогнозирования - выявление необходимости изменений путем "приведения к абсурду". Например, если население Земли каждые 50 лет будет увеличиваться вдвое, то нетрудно подсчитать, через сколько лет на каждый квадратный метр поверхности Земли будет приходиться по 10000 человек. Из такого прогноза следует, что закономерности роста численности населения должны измениться.

Учет нежелательных тенденций, выявленных при прогнозировании, позволяет принять необходимые меры для их предупреждения, а тем самым помешать осуществлению прогноза.

Есть и самоосуществляющиеся прогнозы. Например, если в вечерней телевизионной передаче будет сделан прогноз о скором банкротстве определенного банка, то наутро многие вкладчики этого банка пожелают получить свои деньги, у входа в банк соберется толпа, а банковские операции придется остановить. Такую ситуацию журналисты описывают словами: "Банк лопнул". Обычно для этого достаточно, чтобы в один "прекрасный" (для банка) момент вкладчики пожелали изъять заметную долю (скажем, 30%) средств с депозитных счетов.

Прогнозирование - частный вид моделирования как основы познания и управления.

Роль прогнозирования в управлении страной, отраслью, регионом, предприятием очевидна. Необходимы учет СТЭП-факторов (социальных, технологических, экономических, политических), факторов конкурентного окружения и научно-технического прогресса, а также прогнозирование расходов и доходов предприятий и общества в целом (в соответствии с жизненным циклом продукции - во времени и по 11-и стадиям международного стандарта ИСО 9004). Проблемы внедрения и практического использования математических методов эконометрического прогнозирования связаны прежде всего с отсутствием в нашей стране достаточно обширного опыта подобных исследований, поскольку в течение десятилетий планированию отдавался приоритет перед прогнозированием.

Статистические методы прогнозирования. Простейшие методы восстановления используемых для прогнозирования зависимостей исходят из заданного временного ряда, т.е. функции, определенной в конечном числе точек на оси времени. Временной ряд при этом часто рассматривается в рамках вероятностной модели, вводятся иные факторы (независимые переменные), помимо времени, например, объем денежной массы (агрегат М2). Временной ряд может быть многомерным, т.е. число откликов (зависимых переменных) может быть больше одного. Основные решаемые задачи - интерполяция и экстраполяция. Метод наименьших квадратов в простейшем случае (линейная функция от одного фактора) был разработан К. Гауссом более двух столетий назад, в 1794-1795 гг. Могут оказаться полезными предварительные преобразования переменных .

Опыт прогнозирования индекса инфляции и стоимости потребительской корзины накоплен в Институте высоких статистических технологий и эконометрики. При этом оказалось полезным преобразование (логарифмирование) переменной - текущего индекса инфляции. Характерно, что при стабильности условий точность прогнозирования оказывалась достаточно удовлетворительной - 10-15 %. Однако спрогнозированное на осень 1996 г. значительное повышение уровня цен не осуществилось. Дело в том, что руководство страны перешло к стратегии сдерживания роста потребительских цен путем массовой невыплаты зарплаты и пенсий. Условия изменились - и статистический прогноз оказался непригодным. Влияние решений руководства Москвы проявилось также в том, что в ноябре 1995 г. (перед парламентскими выборами) цены в Москве упали в среднем на 9,5%, хотя обычно для ноября характерен более быстрый рост цен, чем в другие месяцы года, кроме декабря и января .

Наиболее часто используется метод наименьших квадратов при нескольких факторах. Метод наименьших модулей и другие методы экстраполяции применяются реже, хотя их статистические свойства зачастую лучше. Большую роль играет традиция и общий невысокий уровень знаний об эконометрических методах прогнозирования.

Оценивание точности прогноза - необходимая часть процедуры квалифицированного прогнозирования. При этом обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для него (на основе Центральной Предельной Теоремы теории вероятностей). Так, нами предложены и изучены методы доверительного оценивания точки наложения (встречи) двух временных рядов и их применения для оценки динамики технического уровня собственной продукции и продукции конкурентов, представленной на мировом рынке.

Применяются также эвристические приемы, не основанные на какой-либо теории: метод скользящих средних, метод экспоненциального сглаживания.

Адаптивные методы прогнозирования позволяют оперативно корректировать прогнозы при появлении новых точек. Речь идет об адаптивных методах оценивания параметров моделей и об адаптивных методах непараметрического оценивания. Отметим, что с развитием вычислительных мощностей компьютеров проблема сокращения объемов вычисления теряет свое значение.

Многомерная регрессия, в том числе с использованием непараметрических оценок плотности распределения - основной на настоящий момент эконометрический аппарат прогнозирования. Подчеркнем, что нереалистическое предположение о нормальности погрешностей измерений и отклонений от линии (поверхности) регрессии использовать не обязательно. Однако для отказа от предположения нормальности необходимо опереться на иной математический аппарат, основанный на многомерной центральной предельной теореме теории вероятностей и эконометрической технологии линеаризации. Он позволяет проводить точечное и интервальное оценивание параметров, проверять значимость их отличия от 0 в непараметрической постановке, строить доверительные границы для прогноза .

Весьма важна проблема проверки адекватности модели, а также проблема отбора факторов. Дело в том, что априорный список факторов, оказывающих влияние на отклик, обычно весьма обширен, желательно его сократить, и крупное направление современных эконометрических исследований посвящено методам отбора "информативного множества признаков". Однако эта проблема пока еще окончательно не решена. Проявляются необычные эффекты. Так, установлено, что обычно используемые оценки степени полинома имеют геометрическое распределение. Перспективны непараметрические методы оценивания плотности вероятности и их применения для восстановления регрессионной зависимости произвольного вида. Наиболее общие постановки в этой области получены с помощью подходов статистики нечисловых данных.

К современным статистическим методам прогнозирования относятся также модели авторегрессии, модель Бокса-Дженкинса, системы эконометрических уравнений, основанные как на параметрических, так и на непараметрических подходах.

Для установления возможности применения асимптотических результатов при конечных (т.н. "малых") объемах выборок полезны компьютерные статистические технологии. Они позволяют также строить различные имитационные модели. Отметим полезность методов размножения данных (бутстреп-методов). Системы прогнозирования с интенсивным использованием компьютеров объединяют различные методы прогнозирования в рамках единого автоматизированного рабочего места прогнозиста.

Прогнозирование на основе данных, имеющих нечисловую природу, в частности, прогнозирование качественных признаков основано на результатах статистики нечисловых данных. Весьма перспективными для прогнозирования представляются регрессионный анализ на основе интервальных данных, включающий, в частности, определение и расчет нотны и рационального объема выборки, а также регрессионный анализ нечетких данных. Общая постановка регрессионного анализа в рамках статистики нечисловых данных и ее частные случаи - дисперсионный анализ и дискриминантный анализ (распознавание образов с учителем), давая единый подход к формально различным методам, полезна при программной реализации современных статистических методов прогнозирования.

Экспертные методы прогнозирования. Необходимость и общее представление о применении экспертных методов прогнозирования при принятии решений на различных уровнях управления - на уровне страны, отрасли, региона, предприятия. Отметим большое практическое значение экспертиз при сравнении и выборе инвестиционных и инновационных проектов, при управлении проектами, экологических экспертиз. Роли лиц, принимающих решения (ЛПР), и специалистов (экспертов) в процедурах принятия решений, критерии принятия решений и место экспертных оценок в процедурах принятие решений рассмотрены выше. В качестве примеров конкретных экспертных процедур, широко используемых при прогнозировании, укажем метод Дельфи и метод сценариев. На их основе формируются конкретные процедуры подготовки и принятия решений с использованием методов экспертных оценок, например, процедуры распределения финансирования научно-исследовательских работ (на основе балльных оценок или парных сравнений), технико-экономического анализа, кабинетных маркетинговых исследований (противопоставляемых "полевым" выборочным исследованиям), оценки, сравнения и выбора инвестиционных проектов .

В соотнесении с задачами прогнозирования напомним о некоторых аспектах планирования и организации экспертного исследования. Должны быть сформированы Рабочая группа и экспертная комиссия. Весьма ответственными этапами являются формирование целей экспертного исследования (сбор информации для ЛПР и/или подготовка проекта решения для ЛПР и др.) и формирование состава экспертной комиссии (методы списков (реестров), "снежного кома", самооценки, взаимооценки) с предварительным решением проблемы априорных предпочтений экспертов. Различные варианты организации экспертного исследования, различающиеся по числу туров (один, несколько, не фиксировано), порядку вовлечения экспертов (одновременно, последовательно), способу учета мнений (с весами, без весов), организации общения экспертов (без общения, заочное, очное с ограничениями ("мозговой штурм") или без ограничений) позволяют учесть специфику конкретного экспертного исследования. Компьютерное обеспечение деятельности экспертов и Рабочей группы, экономические вопросы проведения экспертного исследования важны для успешного проведения экспертного исследования .

Экспертные оценки могут быть получены в различных математических формах. Наиболее часто используются количественные или качественные (порядковые, номинальные) признаки, бинарные отношения (ранжировки, разбиения, толерантности), интервалы, нечеткие множества, результаты парных сравнений, тексты и др. Основные понятия (репрезентативной) теории измерений: основные типы шкал, допустимые преобразования, адекватные выводы и др. - важны применительно к экспертному оцениванию. Необходимо использовать средние величины, соответствующие основным шкалам измерения. Применительно к различным видам рейтингов репрезентативная теория измерений позволяет выяснить степень их адекватности прогностической ситуации, предложить наиболее полезные для целей прогнозирования.

Например, анализ рейтингов политиков по степени их влиятельности, публиковавшийся одной из известных центральных газет, показал, что из-за неадекватности используемого математического аппарата лишь первые 10 мест, возможно, имеют некоторое отношение к реальности (они не меняются при переходе к другому способу анализа данных, т.е. не зависят от субъективизма членов Рабочей группы), остальные - "информационный шум", попытки опираться на них при прогностическом анализе могут привести лишь к ошибкам. Что же касается начального участка рейтинга этой газеты, то он также может быть подвергнут сомнению, но по более глубоким причинам, например, связанным с составом экспертной комиссии .

Основными процедурами обработки прогностических экспертных оценок являются проверка согласованности, кластер-анализ и нахождение группового мнения.

Проверка согласованности мнений экспертов, выраженных ранжировками, проводится с помощью коэффициентов ранговой корреляции Кендалла и Спирмена, коэффициента ранговой конкордации Кендалла и Бэбингтона Смита. Используются параметрические модели парных сравнений - Терстоуна, Бредли-Терри-Льюса - и непараметрические модели теории люсианов (о люсианах) .

При отсутствии согласованности разбиение мнений экспертов на группы сходных между собой проводят методом ближайшего соседа или другими методами кластерного анализа (автоматического построения классификаций, распознавания образов без учителя). Классификация люсианов осуществляется на основе вероятностно-статистической модели.

Используют различные методы построения итогового мнения комиссии экспертов. Своей простотой выделяется метод средних рангов. Компьютерное моделирование позволило установить ряд свойств медианы Кемени, часто рекомендуемой для использования в качестве итогового (обобщенного, среднего) мнения комиссии экспертов. Интерпретация закона больших чисел для нечисловых данных в терминах теории экспертного опроса такова: итоговое мнение устойчиво, т.е. мало меняется при изменении состава экспертной комиссии, и при росте числа экспертов приближается к "истине". При этом в соответствии с принятым подходом предполагается, что ответы экспертов можно рассматривать как результаты измерений с ошибками, все они - независимые одинаково распределенные случайные элементы, вероятность принятия определенного значения убывает по мере удаления от некоторого центра - "истины", а общее число экспертов достаточно велико.

Проблемы применения методов прогнозирования в условиях риска. Многочисленны примеры ситуаций, связанных с социальными, технологическими, экономическими, политическими, экологическими и другими рисками. Именно в таких ситуациях обычно и необходимо прогнозирование. Известны различные виды критериев, используемых в теории принятия решений в условиях неопределенности (риска). Из-за противоречивости решений, получаемых по различным критериям, очевидна необходимость применения оценок экспертов.

В конкретных задачах прогнозирования необходимо провести классификацию рисков, поставить задачу оценивания конкретного риска, провести структуризацию риска, в частности, построить деревья причин (ы другой терминологии, деревья отказов) и деревья последствий (деревья событий). Центральной задачей является построение групповых и обобщенных показателей, например, показателей конкурентоспособности и качества. Риски необходимо учитывать при прогнозировании экономических последствий принимаемых решений, поведения потребителей и конкурентного окружения, внешнеэкономических условий и макроэкономического развития России, экологического состояния окружающей среды, безопасности технологий, экологической опасности промышленных и иных объектов. Метод сценариев незаменим применительно к анализу технических, экономических и социальных последствий аварий .

Имеется некоторая специфика применения методов прогнозирования в ситуациях, связанных с риском. Велика роль функции потерь и методов ее оценивания, в том числе в экономических терминах. В конкретных областях используют вероятностный анализ безопасности (для атомной энергетики) и другие специальные методы.

Современные компьютерные технологии прогнозирования. Перспективны интерактивные методы прогнозирования с использованием баз эконометрических данных, имитационных (в том числе на основе применения метода Монте-Карло, т.е. метода статистических испытаний) и экономико-математических динамических моделей, сочетающих экспертные, статистические и моделирующие блоки. Обратим внимание на сходство и различие методов экспертных оценок и экспертных систем. Можно сказать, что экспертная система моделирует поведение эксперта путем формализации его знаний по специальной технологии. Но интуицию "живого эксперта" нельзя заложить в ЭВМ, а при формализации мнений эксперта (фактически - при его допросе) наряду с уточнением одних его представлений происходит и огрубление других. Другими словами, при использовании экспертных оценок непосредственно обращаются к опыту и интуиции высококвалифицированных специалистов, а при применении экспертных систем имеют дело с компьютерными алгоритмами расчетов и выводов, при создании которых когда-то давно привлекались эксперты как источник данных и типовых заключений .

Обратим внимание на возможность использования в прогнозировании производственных функций, статистически описывающих связь выпуска с факторами производства, на различные способы учета научно-технического прогресса, в частности, на основе анализа трендов и с помощью экспертного выявления точек роста. Примеры экономических прогнозов всех видов имеются в литературе. К настоящему времени разработаны компьютерные системы и программные средства комбинированных методов прогнозирования.

экономический математический прогноз информационный

1. 2 Основные идеи технологии сценарных экспертных прогнозов

Как уже отмечалось социально-экономическое прогнозирование, как и любое прогнозирование вообще, может быть успешным лишь при некоторой стабильности условий. Однако решения органов власти, отдельных лиц, иные события меняют условия, и события развиваются по-иному, чем ранее предполагалось. Объективно имеются точки выбора (фуркации), после которых рассматриваемое прогнозистами развитие может пойти по одному из нескольких возможных путей (эти пути и называют обычно сценариями). Выбор может делаться на разных уровнях - конкретной личностью (перейти на другую работу или остаться), менеджером (выпускать ту или иную марку продукции), конкурентами (сотрудничество или борьба), властными структурами (выбор той или иной системы налогообложения), населением страны (выбор президента), "международным сообществом" (вводить или нет санкции против России).

Рассмотрим пример. Вполне очевидно, что после первого тура президентских выборов 1996 г. о дальнейшем развитии социально-экономических событий можно было говорить лишь в терминах сценариев: если победит Б.Н. Ельцин, то будет то-то и то-то, если победит Г.А. Зюганов, то события пойдут так-то и так-то.

Например, работа имела целью прогноз динамики валового внутреннего продукта (ВВП) на 9 лет (1999-2007). При ее проведении было ясно, что за это время произойдут различные политические события, в частности, по крайней мере два цикла парламентских и президентских выборов (при условии сохранения нынешней политической структуры), результаты которых нельзя предсказать однозначно. Поэтому прогноз динамики ВВП мог быть сделан лишь по отдельности для каждого сценария из некоторой гаммы, охватывающей возможные пути социально-экономической динамики России .

Метод сценариев необходим не только в социально-экономической области. Например, при разработке методологического, программного и информационного обеспечения анализа риска химико-технологических проектов необходимо составить детальный каталог сценариев аварий, связанных с утечками токсических химических веществ. Каждый из таких сценариев описывает аварию своего типа, со своим индивидуальным происхождением, развитием, техническими, экономическими и социальными последствиями, возможностями предупреждения.

Таким образом, метод сценариев - это метод декомпозиции (разделения на части) задачи прогнозирования, предусматривающий выделение набора отдельных вариантов развития событий (сценариев), в совокупности охватывающих все возможные варианты развития. При этом каждый отдельный сценарий должен допускать возможность достаточно точного прогнозирования, а общее число сценариев должно быть обозримо.

Возможность подобной декомпозиции не очевидна. При применении метода сценариев необходимо осуществить два этапа исследования:

Построение исчерпывающего, но обозримого набора сценариев;

Прогнозирование в рамках каждого конкретного сценария с целью получения ответов на интересующие исследователя вопросы.

Каждый из этих этапов лишь частично формализуем. Существенная часть рассуждений проводится на качественном уровне, как это принято в общественно-экономических и гуманитарных науках. Одна из причин заключается в том, что стремление к излишней формализации и математизации приводит к искусственному внесению определенности там, где ее нет по существу, либо к использованию громоздкого математического аппарата. Так, рассуждения на словесном уровне считаются доказательными в большинстве ситуаций принятия решений, в то время как попытка уточнить смысл используемых слов с помощью, например, теории нечетких множеств приводит к весьма громоздким математическим моделям и расчетам.

Для построения исчерпывающего, но обозримого набора сценариев необходимо предварительно проанализировать динамику социально-экономического развития рассматриваемого экономического агента и его окружения. Корни будущего - в настоящем и прошлом, причем зачастую - в весьма далеком прошлом. Кроме макроэкономических и микроэкономических характеристик, известных лишь с погрешностями, которые нельзя считать случайными или малыми, необходимо учитывать состояние и динамику отечественного массового сознания, политических, в то числе внешнеполитических реалий, поскольку на обычно рассматриваемом интервале времени (до 10 лет) экономика зачастую следует за политикой, а не наоборот.

Так, например, к началу 1985 г. экономика СССР находилась в достаточно стабильном состоянии с ежегодным ростом в среднем 3-5%. Если бы руководство страны находилось в руках иных людей, то развитие продолжалось бы в прежних условиях и к концу тысячелетия ВВП СССР увеличился бы на 50% и составил бы примерно 150 % от уровня 1985 г. Реально же из-за политических причин ВВП России за эти 15 лет упал примерно в 2 раза, т.е. составил около 50 % по сравнению с 1985 г., или в 3 раза меньше, чем можно было бы ожидать из чисто экономических причин при сохранении стабильных условий 1985 г. .

Набор сценариев должен быть обозрим. Приходится исключать различные маловероятные события - прилет инопланетян, падение астероида, массовые эпидемии ранее неизвестных болезней, и т.д.

Само по себе создание набора сценариев - предмет экспертного исследования, проводимого в соответствии с описанной выше методологией. Кроме того, эксперты могут оценить вероятности реализации того или иного сценария. Ясно, что эти оценки не являются надежными.

Часто используют упрощенный подход к прогнозированию методом сценариев. А именно, формулируют три сценария - оптимистический, вероятный и пессимистический. При этом для каждого из сценариев достаточно произвольно выбирают значения параметров, описывающих производственно-экономическую ситуацию (по-английски - case). Цель такого подхода - рассчитать интервалы разброса для характеристик и "коридоры" для временных рядов, интересующих исследователя (и заказчика исследования). Например, прогнозируют финансовый поток (по-английски - cash flow) и чистую текущую стоимость (по-английски - net present value или NPV) инвестиционного проекта.

Ясно, что такой упрощенный подход не может дать максимального или минимального значения характеристики, он дает лишь представление о порядке количественной меры разброса. Однако его развитие приводит к байесовской постановке в теории принятия решений. Например, если сценарий описывается элементом конечномерного евклидова пространства, то любое вероятностное распределение на множестве исходных параметров преобразуется в распределение интересующих исследователя характеристик. Расчеты могут быть проведены с помощью современных информационных технологий метода статистических испытаний. Надо в соответствии с заданным распределением на множестве параметров выбирать с помощью датчика псевдослучайных чисел конкретный вектор параметров и рассчитывать для него итоговые характеристики. В результате получится эмпирическое распределение на множестве итоговых характеристик, которое можно разными способами анализировать, находить оценку математического ожидания, разброса и др. Остается только неясным, как задавать распределение на множестве параметров. Естественно, для этого можно использовать экспертов .

Прогнозирование в рамках каждого конкретного сценария с целью получения ответов на интересующие исследователя вопросы также осуществляется в соответствии с описанной выше методологией прогнозирования. При стабильных условиях могут быть применены статистические методы прогнозирования временных рядов. Однако этому обычно предшествует анализ с помощью экспертов, причем зачастую прогнозирование на словесном уровне является достаточным (для получения интересующих исследователя и ЛПР выводов) и не требующим количественного уточнения.

Вопрос об использовании результатов прогнозирования относится не к эконометрике, а к смежной науке - теории принятия решений. Как известно, при принятии решений на основе анализа ситуации, в том числе результатов прогнозных исследований, можно исходить из различных критериев. Так, можно ориентироваться на то, что ситуация сложится наихудшим, или наилучшим, или средним (в каком-либо смысле) образом. Можно попытаться наметить мероприятия, обеспечивающие минимально допустимые полезные результаты при любом варианте развития ситуации, и т.д.

Итак, рассмотрена концепция современной методики экспертного оценивания методом сценариев. Она использовалась, например, для прогнозирования социально-экономического развития России.

2. Применение информационных технологий в экономико-математическом пр о гнозировании

До появления современных ИТ не было широких возможностей использовать эффективные экономико-математические модели непосредственно в процессе экономической деятельности. Кроме того, применение имевшихся моделей прогнозирования в аналитических целях не выдвигало столь высоких требований к их информационному обеспечению.

Основы технологий прогнозирования

При построении прогнозирующей системы «с нуля» необходимо разрешить целый ряд организационных и методологических вопросов. К первым можно отнести:

Обучение пользователей методам анализа и интерпретации результатов прогнозов;

Определение направлений движения прогнозной информации внутри предприятия, на уровне его подразделений и отдельных сотрудников, а также структуры коммуникаций с деловыми партнерами и органами власти;

Определение сроков и периодичности проведения процедур прогнозирования;

Разработку принципов увязки прогноза с перспективным планированием и порядок отбора вариантов полученных результатов при составлении плана развития предприятия .

Методологическими проблемами построения подсистемы прогнозирования являются:

Разработка внутренней структуры и механизма ее функционирования;

Организация информационного обеспечения;

Разработка математического обеспечения.

Первая проблема наиболее сложна, так как для ее решения необходимо построить комплекс моделей прогнозирования, сферой приложения которых является система взаимосвязанных показателей. Проблема систематизации и оценки методов прогнозирования выступает здесь как одна из центральных, так как для выбора конкретного метода необходимо проводить их сравнительный анализ. Вариант классификации методов прогнозирования, учитывающий особенности системы знаний, которая лежит в основе каждой группы, укрупненно может быть представлен следующим образом: методы экспертных оценок; методы логического моделирования; математические методы.

Каждая группа пригодна для решения определенного круга задач. Поэтому практика выдвигает следующие требования к используемым методам: они должны быть ориентированы на конкретный объект прогнозирования, должны опираться на количественную меру адекватности, быть дифференцированными по точности оценок и горизонту прогнозирования.

Основные задачи, возникающие в процессе создания прогнозирующей системы, подразделяются на:

Построение системы прогнозируемых процессов и показателей;

Разработку аппарата экономического и математического анализа прогнозируемых процессов и показателей;

Конкретизацию метода экспертных оценок, выделение показателей для экспертизы и получение экспертных оценок некоторых прогнозируемых процессов и показателей;

Прогнозирование показателей и процессов с указанием доверительных интервалов и точностей;

Разработку методик интерпретации и анализа полученных результатов.

Отдельного внимания заслуживают работы по информационному и математическому обеспечению прогнозирующей системы. Процесс создания математического обеспечения можно представить в виде следующих этапов:

Разработка методики структурной идентификации объекта прогнозирования;

Разработка методов параметрической идентификации объекта прогнозирования;

Разработка методов прогнозирования тенденций;

Разработка методов прогнозирования гармонических составляющих процессов;

Разработка методов оценки характеристик случайных составляющих процессов;

Создание комплексных моделей для прогнозирования показателей, образующих взаимосвязанную систему .

Создание прогнозирующей системы требует комплексного подхода к решению проблемы ее информационного обеспечения, под которым обычно понимается совокупность исходных данных, используемых для получения прогнозов, а также методов, способов и средств, обеспечивающих сбор, накопление, хранение, поиск и передачу данных в процессе функционирования прогнозирующей системы и ее взаимодействия с другими системами управления предприятием.

Информационное обеспечение системы обычно включает:

Информационный фонд (базу данных);

Источники формирования информационного фонда, потоки и способы поступления данных;

Методы накопления, хранения, обновления и поиска данных, образующих информационный фонд;

Методы, принципы и правила циркуляции данных в системе;

Методы обеспечения достоверности данных на всех этапах их сбора и обработки;

Методы информационного анализа и синтеза;

Способы однозначного формализованного описания экономических данных .

Таким образом, для реализации процесса прогнозирования требуются следующие основные компоненты:

Источники внутренней информации, которая основывается на системах управленческого и бухгалтерского учета;

Источники внешней информации;

Специализированное программное обеспечение, реализующее алгоритмы прогнозирования и анализ результатов.

Учитывая важность решения задачи прогнозирования для субъектов рынка, целесообразно проверку качества предлагаемых методов и алгоритмов, а также технологий в целом осуществлять по специально подобранным (тестовым) исходным данным. Аналогичный путь верификации достаточно давно используется при оценке адекватности математических инструментов, предназначенных для нелинейной оптимизации, например с помощью функций Розенброка и Пауэла .

Подтверждение (или верификация) качества и работоспособности технологии прогнозирования осуществляется обычно сравнением априорно известных модельных данных с их прогнозируемыми значениями и оценкой статистических характеристик точности прогнозов. Рассмотрим этот прием в ситуации, когда модели процессов представляют собой аддитивную совокупность тренда Tt, сезонной (гармонической) и случайной составляющих.

В настоящее время распространение получили самые различные программные средства, обеспечивающие в той или иной мере сбор и аналитическую обработку информации. Одни их них, например MS Excel, оснащены встроенными статистическими функциями и средствами программирования. Другие же, особенно недорогие программы бухгалтерского и управленческого учета, такими возможностями не обладают или аналитические возможности реализованы в них недостаточно, а иногда и некорректно. Впрочем, это присуще, к сожалению, и некоторым более мощным и многофункциональным системам управления предприятием. Такое положение объясняется, по всей видимости, неглубоким анализом со стороны разработчиков свойств выбранных ими алгоритмов прогнозирования и их некритическим применением. Например, судя по доступным источникам, часто в основе прогнозирующих алгоритмов используется экспоненциальное сглаживание нулевого порядка. Однако данный подход правомочен только при отсутствии тенденции изучаемого процесса. На самом же деле экономические процессы являются нестационарными, и прогнозирование подразумевает использование более сложных моделей, чем модели с постоянным трендом.

Интересно в ракурсе рассматриваемой темы проследить путь развития отечественных автоматизированных банковских систем. Первые банковские системы основывались на жесткой технологии, постоянно требуя внесения изменений или дополнительного программного обеспечения. Это побудило разработчиков финансового программного обеспечения, следуя принципам открытости, масштабируемости и гибкости, использовать промышленные СУБД. Однако сами по себе эти СУБД оказались непригодны к решению аналитических задач высокого уровня, к которым относится проблема прогнозирования. Для этого пришлось использовать дополнительно технологии хранилищ данных и оперативной аналитической обработки, обеспечивших работу систем поддержки принятия решений финансово-кредитных учреждений и составления прогнозов. Такой же подход используется и в комплексных системах управления предприятиями.

Другим направлением современного прикладного использования методов прогнозирования на основе ИТ является решение широкого круга маркетинговых задач. Иллюстрацией может служить программное обеспечение SAS Churn Management Solution for Telecommunications. Оно предназначено для телекоммуникационных операторов и позволяет, как утверждается его разработчиками, строить прогностические модели и с их помощью оценивать вероятность оттока отдельных категорий клиентов. Основу этого программного обеспечения составляет сервер распределенной базы данных Scalable Performance Data Server, средства для построения и администрирования хранилищ и витрин данных, инструментарий интеллектуального анализа данных Enterprise Miner, система поддержки принятия решений SAS/MDDB Server, а также вспомогательные средства.

Для обеспечения конкурентоспособности новомодных CRM-систем в список их расширенных возможностей, так же как и для автоматизированных банковских систем, включены функции отчетности, использующие технологии OLAP и позволяющие в определенной степени осуществлять прогнозирование результатов маркетинга, продаж и обслуживания клиентов.

Существует достаточно много специализированных программных продуктов, обеспечивающих статистическую обработку численных данных, включая отдельные элементы прогнозирования. К таким продуктам относятся SPSS, Statistica и др. Эти средства имеют как достоинства, так и недостатки, существенно ограничивающие сферу их практического применения. Здесь необходимо отметить, что оценка приспособленности специализированных математических и статистических программных средств для решения задач прогнозирования обычными пользователями, не имеющими специальной подготовки, требует отдельного серьезного исследования и обсуждения .

Однако решение задач прогнозирования для потребителей из малого и среднего бизнеса с помощью мощных и дорогостоящих информационных систем и технологий практически невозможно в первую очередь по финансовым соображениям. Поэтому весьма перспективным направлением является развитие аналитических возможностей существующих и широко распространенных недорогих систем бухгалтерского и управленческого учета. Разрабатываемые дополнительные отчеты, основанные на конкретных бизнес-процессах и содержащие необходимую аналитическую информацию для конкретного пользователя, имеют высокое отношение «эффективность - стоимость».

Некоторыми разработчиками программного обеспечения создаются целые линейки аналитических средств. Например, корпорация «Парус» предлагает для широкого круга пользователей из малого и среднего бизнеса решения «Парус-Аналитика» и «Триумф-Аналитика». Более сложные задачи аналитической обработки прогнозной информации интегрированы в систему «Парус» в виде так называемого ситуационного центра. По словам Дмитрия Сударева, менеджера по развитию тиражных решений, было принято решение разработать и внедрить программные продукты, позволяющие перейти от простого учета фактов в деятельности предприятия к анализу информации. При этом был запланирован переход от автоматизации работы бухгалтеров и менеджеров среднего звена к обработке информации для высшего менеджмента. С учетом возможного круга потребителей «Парус-Аналитика» и «Триумф-Аналитика» особых требований к программно-аппаратному окружению не предъявляют, однако решение «Триумф-Аналитика» реализовано на базе MS SQL Server, что обеспечивает ему более широкие возможности по прогнозированию исследуемых процессов, в частности, учитывается гармоническая составляющая прогнозов .

Ценность прогноза многократно увеличивается, когда он непосредственно используется при управлении предприятием. Поэтому важным направлением является интеграция прогнозирующих систем с такими системами, как «Касатка», MS Project Expert и др. Например, программное обеспечение «Касатка» компании SBI позиционируется как автоматизированное рабочее место руководителя и специалистов отдела маркетинга и предназначено для разработки комплексов менеджмента, маркетинга и стратегического планирования. Такое целевое назначение предопределяет необходимость выявления долгосрочных тенденций и их учета при планировании. Горизонт прогнозирования при этом определяется исходя из соответствующих целей организации.

Заключение

Таким образом, к настоящему времени проведено достаточно много исследований и получены впечатляющие практические решения проблемы прогнозирования в науке, технике, экономике, демографии и других областях. Внимание к этой проблеме обусловлено в том числе масштабами современной экономики, потребностями производства, динамикой развития общества, необходимостью совершенствования планирования на всех уровнях управления, а также накопленным опытом. Прогнозирование - один из решающих элементов эффективной организации управления отдельными хозяйствующими субъектами и экономическими сообществами вследствие того, что качество принимаемых решений в большой степени определяется качеством прогнозирования их последствий. Поэтому решения, принимаемые сегодня, должны опираться на достоверные оценки возможного развития изучаемых явлений и событий в будущем.

Совершенствование прогнозирования многими специалистами видится в развитии соответствующих информационных технологий. Необходимость их применения обусловлена рядом причин, в числе которых: рост объемов информации; сложность алгоритмов расчета и интерпретации результатов; высокие требования к качеству прогнозов; необходимость использования результатов прогнозирования для решения задач планирования и управления.

Периодически появляются сведения о положительных результатах, достигнутых той или иной компанией. В ряде публикаций отмечается, что успешная оценка тенденций рыночной ситуации, спроса на товары или услуги, а также иных экономических процессов и характеристик позволяет получить существенный прирост прибыли, улучшить другие экономические показатели. Механизм успеха на первый взгляд прост и понятен: предполагая, что произойдет в будущем, можно своевременно предпринять эффективные меры, используя позитивные тенденции и компенсируя отрицательные процессы и явления.

Точность, достоверность и оперативность, впрочем, как и иные составляющие качества прогнозирования, обеспечиваются рядом факторов, среди которых необходимо выделить: программное обеспечение, в основе которого лежат адекватные реальности экономико-математические модели;n полноту охвата и надежность источников исходной информации, на которой основана работа алгоритмов прогнозирования; оперативность обработки внутрифирменной и внешней информации; умение критически анализировать прогнозные оценки; своевременность внесения необходимых изменений в методическое и информационное обеспечение прогнозирования.

В основе специального программного обеспечения лежат тщательно подобранные модели, методы и методики. Их реализация крайне важна для получения качественных прогнозов при решении задач текущего и стратегического планирования. Анализ сложившейся ситуации показывает, что трудности при внедрении ИТ, обеспечивающих прогнозирование экономических процессов, носят не только технический или методический, но и организационно-психологический характер. Потребители результатов подчас не понимают принципов используемых моделей, их формализацию и объективно существующие ограничения. Это, как правило, порождает недоверие к полученным результатам. Другая группа проблем внедрения связана с тем, что прогнозирующие модели нередко носят замкнутый, автономный характер и поэтому их обобщение с целью развития и взаимной адаптации затруднительно. Следовательно, компромиссным решением может оказаться поэтапный подход с выделением главных аналитических задач.

Однако готовых тиражируемых или корпоративных решений, обеспечивающих прогнозирование для малых и средних экономических субъектов на системном уровне с высоким качеством и доступных им по цене, практически нет. В настоящее время автоматизированные системы управления предприятием ограничиваются в основном элементарными задачами учета и контроля.

Список использованной литературы

1. Айвазян С.А. Основы эконометрики. М.: ЮНИТИ, 2011. - 432с.

2. Арженовский С.В., Федосова О.Н. Эконометрика. Ростов на Дону: РГЭУ, 2012. - 202с.

3. Бородич С.А. Эконометрика. Мн.: Новое знание, 2015. - 408с.

4. Владимирова Л.П. Прогнозирование и планирование в условиях рынка. М.: Дашков и К., 2013. -- 308с.

5. Доугерти К. Введение в эконометрику. / Пер с англ. - М.: Инфра-М, 2011. - 402с.

6. Ежеманская С.Н. Эконометрика. Ростов на Дону: Феникс, 2013. - 160с.

7. Кремер Н.Ш., Путко Б.А. Эконометрика. М.: ЮНИТИ, 2015. - 311с.

8. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика: начальный курс. М.: Дело, 2011. - 400с.

9. Новиков А.И. Эконометрика. М.: Инфра-М, 2013. - 306с.

10. Орлов А.И. Эконометрика. М.: Экзамен, 2014. - 576с.

11. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика. М.: Экзамен, 2013. - 512с.

12. Эконометрика. / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2012. - 344с.

Размещено на Allbest.ru

Математик Константин Воронцов о применении задач машинного обучения в бизнесе, композициях адаптивных моделей и усовершенствовании качества данных

Десять лет назад одна крупная розничная сеть объявила тендер на решение задачи прогнозирования объемов продаж в своей сети. Задачи прогнозирования решают почти все крупные ретейлы, потому что это им необходимо для планирования закупок. Конкурсные условия ставились следующим образом: нам давались данные за два года - это ежедневные продажи примерно 12 000 товаров в одном из магазинов сети, тендер был закрытым, кроме нас на него позвали еще шесть компаний. Среди них были очень крупные вендоры аналитических решений для ретейла. Мы, конечно, оценивали наши шансы выиграть в этом тендере как небольшие.

Условием ставилось составить прогноз продаж на две недели, которые следовали непосредственно за теми двумя годами, по которым были данные. Организаторы конкурса предложили свой функционал качества, по которому мерилось качество прогнозов. Этот функционал был немного нестандартным. Организаторы решили учесть, что в этом функционале складывается большое количество товаров и нехорошо, когда вы складываете штуки с килограммами, поэтому это была сумма по всем товарам, а в знаменатель им пришлось поставить саму прогнозируемую величину. Это был не очень понятный ход, так обычно не делают. Мы предупредили организаторов конкурса, что функционал немного странный, другие участники конкурса их тоже об этом предупреждали, но тем не менее в этом решении тоже была своя логика, и конкурс состоялся при таких условиях.

Обычно прогноз потребительского спроса - точнее, объемов продаж - делается методами прогнозирования, которые очень давно известны в статистике. В целом они основаны на методе наименьших квадратов, где в функционале есть суммы по товарам, суммы по моментам времени и квадрат разности прогноза алгоритма и реального объема продаж для этого товара в этот день. Так обычно устроен функционал, и во всех стандартных решениях минимизация такого функционала позволяет настраивать алгоритм прогнозирования.

Есть много простых, быстро работающих, тоже давно известных, еще с 1960-х годов, методов, которыми мы начали пользоваться, для того чтобы решить задачу прогнозирования. Это методы экспоненциально скользящего среднего, модели Брауна, Тейла - Вейджа, Хольта - Винтерса и так далее. Некоторые из них учитывают сезонность. Сезонность не надо понимать как зима - лето, а скорее как будни - выходные, то есть недельная сезонность. Многие товары действительно продаются по будням и выходным по-разному. Мы сразу поняли, что наши крупные конкуренты в этом тендере будут использовать стандартные подходы: они будут использовать метод наименьших квадратов, потому что у них есть готовые решения, и довольно трудоемкие вычислительные методы вроде нейронных сетей или же авторегрессии. И мы решили пойти другим путем и использовать простые методы с пониманием того, что у каждого товара много своих особенностей. Есть много моделей, но неизвестно, какая модель для каждого товара будет наилучшей. Более того, мы даже предположили, что товар время от времени переключает свою модель и его сначала, может быть, лучше прогнозировать одной моделью, а потом в какой-то момент другая модель начнет работать лучше. Поэтому мы сделали адаптивную композицию простых адаптивных моделей. В каждый момент времени мы выбираем ту модель, которая в последнее время работала лучше, давала более точные прогнозы, переключаемся на нее, и именно она дает прогнозы. Первое решение, которое было сделано, - пользоваться композицией простых моделей, вместо того чтобы строить что-то более сложное.

Второе решение заключалось в том, что мы осознали, что функционал нестандартен, и, как учили на первом курсе физтеха, мы взяли этот функционал, продифференцировали по параметрам модели, приравняли нулю производные и получили некую систему уравнений, из которой вывели новый метод. В принципе это работа для математика на один вечер, но мы догадывались, что наши конкуренты так поступать не будут, потому что у них есть готовые решения, они в них сильно верят. Как оказалось, мы действительно не прогадали.

Еще одна особенность этой задачи - то, что были большие интервалы неслучайного отсутствия спроса. Представьте себе: товар продается стабильно ежедневно, и вдруг вы видите, что две недели этого товара нет вообще. Это, конечно, связано не с тем, что спрос отсутствует, а с тем, что товар просто не привезли, его не было на полках, не было на складе. Такие интервалы отсутствия спроса мы просто вырезали из обучающих данных, чтобы они не повлияли на результат.

Настал день, когда мы показывали наше решение организаторам конкурса. Мы знали, что перед нами выступал один из наших крупных конкурентов, и, когда организаторы спросили: «А сколько часов вычисляет ваша модель?», мы удивились и сказали: «Вы разве не поняли, что мы только что на моем ноутбуке за одну минуту и восемь секунд не только подсчитали все прогнозы, но и обучили нашу модель на двухлетнем интервале?» Это было, конечно, шоком. В итоге наша модель оказалась не только самой точной, но еще и самой быстрой. Мы показали, что все прогнозы по всей сети можно считать буквально за два часа, ночью, на старом сервере и что даже никакого нового оборудования закупать не надо.

Это не только история успеха, но еще и очень поучительная история: во-первых, не надо бояться применять нестандартные методы, и если задача поставлена нестандартно, то только математик может быстро найти решение - хорошо, когда удается быстро, иногда это не удается, конечно; во-вторых, этот случай придал нам сил выйти на рынок с собственными решениями - не надо бояться того, что на рынке есть сильные конкуренты. Был еще один момент поучительности. Когда я сам занимался отбором моделей для этой задачи, то сначала мы ввели целых тридцать разных моделей, и из них так адаптивно, как я рассказал, каждый день для каждого товара выбиралась оптимальная модель.

В принципе это чревато таким явлением, как переобучение, то есть мы могли хорошо, точно подогнаться под обучающие данные и плохо прогнозировать на новых тестовых данных. Я знал об этом явлении, что явление связано с тем, что модель может быть избыточно сложной, тогда и возникает эффект переобучения. Мне казалось, что выбор из тридцати моделей - это не настолько сложно, здесь не должно быть переобучения. Мое удивление было очень сильным, когда я провел эксперимент, сравнил обучение с контрольным и понял, что переобучение просто огромно и мы теряем десятки процентов точности на этом эффекте. Я только собирался еще и еще вводить новые модели, но этот эксперимент показал, что решение надо, наоборот, упрощать и тридцать моделей - это много. Следующим шоком для меня было, когда оказалось, что оптимальное число моделей - шесть, то есть нельзя было строить более сложное решение, чем из шести моделей.

Тогда чисто теоретически эта задача поставила меня в тупик, а решение удалось найти только тогда, когда я работал над докторской диссертацией и уже серьезно исследовал явление переобучения в рамках комбинаторной теории переобучения. Оказалось, что если вы выбираете из моделей и у вас есть одна модель хорошая, а все остальные - плохие, то вы эту хорошую модель, как правило, и будете выбирать. Вы не будете переобучаться, вы будете иметь это одно хорошее решение. Если у вас есть много моделей, но они похожи друг на друга, вы тоже не будете переобучаться, потому что эффективная сложность совокупности таких похожих друг на друга моделей невелика, переобучение тоже низкое. А если получится так, что ваши модели существенно различны и примерно все при этом одинаково плохие, то переобучение может быть очень велико, и эффект переобучения чудовищно растет по мере роста числа моделей. Это была ровно та ситуация, с которой мы столкнулись в этом тендере. А вот объяснить ее теоретически удалось лишь несколько лет спустя.

Была еще одна поучительная история. Тогда же, на этом тендере, презентуя свое решение организаторам конкурса, мы объяснили: «Мы считаем, что ваш функционал неправильно устроен, так делать нельзя. То, что прогнозируемая величина в знаменателе, - это, конечно, нехорошо. То, что ваш функционал выражает квадрат разности ошибок…» Что такое квадрат рублей, например? Это не имеет экономического смысла. Мы предложили оптимизировать функционалы, выражающие потери компании от неточности прогнозов, и показали, как такой функционал должен быть устроен, и показали, что мы готовы оптимизировать такие нестандартные функционалы, тем самым повышать прибыль компании - ровно то, что было нужно для бизнеса. Когда мы начали уже реально работать над проектом, то оказалось, что у компании те самые данные, которые нужны для построения такого функционала, очень грязные. Для части товаров такие данные вообще отсутствовали, для части товаров эти данные были неточны, потому что менеджеры до сих пор не были заинтересованы в том, чтобы такие данные проверялись, контролировались. Это же не бухгалтерия, это какая-то вспомогательная информация. Может быть, она кому-то когда-то понадобится, может быть, нет.

В результате оказалось, что данные грязные, и нужно было усовершенствовать бизнес-процессы и работать над улучшением качества данных. Это то, что бизнес не понимал в тот момент. Когда мы пришли со своим решением и осознали, что борьба за качество и чистоту данных - важная часть бизнеса, мы еще помогли нашим партнерам это осознать и кое-что улучшить внутри бизнес-процессов. Такая поучительная история о связи бизнеса и науки, о том, что наука может дать бизнесу нестандартные решения. Иногда это совсем несложно, но и, наоборот, в процессе поиска этих решений на основе реальных кейсов мы можем получить обратную связь для науки, мы можем столкнуться с какими-то неразрешенными теоретическими вопросами и двинуть теорию вперед.

доктор физико-математических наук, профессор факультета компьютерных наук НИУ ВШЭ

Приложение 1. МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА И ПРОГНОЗИРОВАНИЯ В БИЗНЕСЕ

4. Математический инструментарий прогнозирования

Математические методы и модели, используемые в задачах стохастического анализа и прогнозирования в бизнесе, могут относиться к самым различным разделам математики: к регрессионному анализу, анализу временных рядов, формированию и оцениванию экспертных мнений, имитационному моделированию, системам одновременных уравнений, дискриминантному анализу, логит- и пробит-моделям, аппарату логических решающих функций, дисперсионному или ковариационному анализу, анализу ранговых корреляций и таблиц сопряженности и т. д. Однако все они объединены тем, что представляют собой различные подходы к решению центральной проблемы многомерного статистического анализа и эконометрики – проблемы статистического исследования зависимостей , которая, как раз, и является базовой проблемой статистического анализа и прогнозирования в бизнесе (ее общая формулировка была приведена в п. 2).

В п. 1 уже было замечено, что среди p + k + l + m компонент анализируемого многомерного признака могут быть как количественные, так и ординальные и номинальные переменные. Упомянутые выше подходы к решению центральной проблемы многомерного статистического анализа формировались именно с учетом природы исследуемых переменных. Соответствующая специализация этих подходов отражена в табл. 4. В ней же даны ссылки на литературные источники, в которых можно найти достаточно полное описание этих подходов.

Таблица 4.

Природа результирующих показателей

Природа объясняющих переменных

Название обслуживающих разделов многомерного статистического анализа

Литературные источники

Количественная

Количественная

Регрессионный анализ и системы одновременных уравнений

Количественная

Единственная количественная переменная, интерпретируемая как «время»

Анализ временных рядов

Количественная

Неколичественная (ординальные или номинальные переменные)

Дисперсионный анализ

Количественная

Ковариационный анализ, модели типологической регрессии

Неколичественная (ординальные переменные)

Неколичественная (ординальные и номинальные переменные)

Анализ ранговых корреляций и таблиц сопряженности

Неколичественная (номинальные переменные)

Количественная

Дискриминантный анализ, логит- и пробит-модели, кластер-анализ, таксономия, расщепление смесей распределений

Смешанная (количественные и неколичественные переменные)

Смешанная (количественные и неколичественные переменные)

Аппарат логических решающих функций, Data Mining

Тем не менее, практика статистического анализа и прогнозирования в бизнесе свидетельствует о том, что во всем спектре их математического инструментария бесспорное лидерство (по распространенности и актуальности) принадлежит трем разделам:
- регрессионному анализу;
-
анализу временных рядов;
-
механизму формирования и статистического анализа экспертных оценок.

Кратко остановимся на каждом из этих разделов.

Регрессионный анализ

Как и прежде, будем описывать функционирование исследуемого реального объекта (фирмы, компании, процесса производства или дистрибуции продукции и т. п.) набором переменных и (их содержательный смысл описан в п. 2). Введем ряд определений и понятий, используемых в регрессионном анализе.

Результирующие (зависимые, эндогенные) переменные. Переменная , характеризующая результат или эффективность функционирования анализируемой системы, называется результирующей (зависимой, эндогенной). Ее значения формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов, часть из которых поддается регистрации и, в определенной степени, управлению и планированию (эту часть принято называть объясняющими переменными, см. ниже). В регрессионном анализе результирующая переменная выступает в роли функции, значения которой определяются (правда, с некоторой случайной погрешностью) значениями упомянутых выше объясняющих переменных, выступающих в роли аргументов. Поэтому по природе своей результирующая переменная всегда стохастична (случайна). В общем случае обычно анализируется поведение сразу нескольких результирующих переменных .

Объясняющие (предикторные, экзогенные) переменные . Переменные (или признаки), поддающиеся регистрации, описывающие условия функционирования изучаемой реальной экономической системы и в существенной мере определяющие процесс формирования значений результирующих переменных, называются объясняющими. Как правило, часть из них поддается хотя бы частичному регулированию и управлению. Значения ряда объясняющих переменных могут задаваться как бы «извне» анализируемой системы. В этом случае их принято называть экзогенными. В регрессионном анализе они играют роль аргументов той функции, в качестве которой рассматривается анализируемый результирующий показатель . По своей природе объясняющие переменные могут быть как случайными, так и неслучайными.

Регрессионные остатки – это латентные (т. е. скрытые, не поддающиеся непосредственному измерению) случайные компоненты, отражающие влияние соответственно на не учтенных в составе факторов, а также случайные ошибки в измерении анализируемых результирующих переменных. Они, вообще говоря, тоже могут зависеть от , т. е. в общем случае .

Общая схема взаимодействия переменных в регрессионном анализе изображена на рисунке.




Рисунок . Общая схема взаимодействия переменных в регрессионном анализе.

Функция регрессии по . Функция называется функцией регрессии по (или просто – регрессией по ), если она описывает изменение условного среднего значения результирующей переменной (при условии, что значения объясняющих переменных зафиксированы на уровнях ) в зависимости от изменения значений объясняющих переменных. Соответственно математически это определение может быть записано в виде

где символ означает операцию теоретического усреднения значений (т. е. – это математическое ожидание случайной величины , а , или просто – это условное математическое ожидание случайной величины , вычисленное при условии, что значения объясняющих переменных зафиксированы на уровне ).

Если мы анализируем одновременно результирующих переменных , то следует рассмотреть соответственно функций регрессий или, что то же, одну векторнозначную функцию

. (11)

Тогда модель регрессии по может быть записана в виде

, (12)

причем, из определения следует, что всегда]

(12’)

(тождественный знак равенства в (12’) означает, что оно справедливо при любых значениях ; вектор-столбец из нулей в правой части имеет размерность ).

задача регрессионного анализа в самом общем виде может быть сформулирована следующим образом:

по результатам измерений

исследуемых переменных на объектах (системах, процессах) анализируемой совокупности построить такую (векторнозначную) функцию (11), которая позволила бы наилучшим (в определенном смысле) образом восстанавливать значения результирующих (прогнозируемых) переменных по заданным значениям объясняющих (экзогенных) переменных .

З а м е ч а н и е 1. Наиболее распространенными являются линейные модели регрессии, т. е. модели, в которых функции регрессии имеют линейный вид:

З а м е ч а н и е 2. Существует по меньшей мере два варианта интерпретации введенных в п. 2 «поведенческих», «статусных» и «внешних» переменных, соответственно, и в рамках описанной модели регрессии (12)–(12’). В первом варианте все три типа переменных и относят к объясняющим переменным и строят регрессию по . В другом варианте переменные и интерпретируют как условия проведения наблюдений и тогда отдельно для каждого фиксированного сочетания этих условий строят регрессионную модель вида (12) (в рамках линейной модели (12 ’’) это будет означать, что сами коэффициенты регрессии зависят от и , т. е. определяются как функции от и ).

Анализ временных рядов

Всякий статистический анализ и прогноз основывается на исходных статистических данных. Их основные типы были представлены в п. 1. При этом, если процесс регистрации данных происходит во времени , и само время фиксируется наряду со значениями анализируемых характеристик , то говорят о статистическом анализе так называемых панельных данных . Если зафиксировать номер переменной и номер статистически обследуемого объекта , то расположенную в хронологическом порядке последовательность значений

называют одномерным временным рядом . Если же одновременно рассматривать одномерных временных рядов вида (13), т. е. исследовать закономерности во взаимосвязанном поведении временных рядов (13) для , характеризующих динамику переменных, измеренных на каком-то одном ( -м) объекте , то тогда говорят о статистическом анализе многомерного временного ряда . По существу, все задачи, связанные с анализом экономической динамики и прогнозом, предусматривают использование в качестве своей статистической базы временных рядов тех или иных показателей.

Как правило, в задачах бизнес-прогнозирования рассматриваются лишь дискретные (по времени наблюдения ) одномерные временные ряды для равноотстоящих моментов наблюдения , т. е. где – заданный временной такт (минута, час, сутки, неделя, месяц, квартал, год и т. п.). В этих случаях исследуемый временной ряд нам будет удобнее представлять в виде

где – значение анализируемого показателя, зарегистрированное в -м такте времени .

Говоря об использовании аппарата анализа временных рядов в проблеме прогнозирования, мы имеем в виду кратко - и среднесрочный прогноз , поскольку построение долгосрочного прогноза подразумевает обязательное использование методов организации и статистического анализа специальных экспертных оценок .

Генезис наблюдений, образующих временной ряд . Речь идет о структуре и классификации основных факторов, под воздействием которых формируются значения элементов временного ряда. Целесообразно выделить следующие 4 типа таких факторов.

(А) Долговременные , формирующие общую (в длительной перспективе) тенденцию в изменении анализируемого признака . Обычно эта тенденция описывается с помощью той или иной неслучайной функции f тр (t), как правило, монотонной. Эту функцию называют функцией тренда или просто трендом .

(Б) Сезонные , формирующие периодически повторяющиеся в определенное время года колебания анализируемого признака. Условимся обозначать результат действия сезонных факторов с помощью неслучайной функции . Поскольку эта функция должна быть периодической (с периодами, кратными сезонам, т. е. кварталам), в ее аналитическом выражении участвуют гармоники (тригонометрические функции), периодичность которых, как правило, обусловлена содержательной сущностью задачи.

(В) Циклические (конъюнктурные ), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов экономической, демографической или астрофизической природы (волны Кондратьева, демографические «ямы», циклы солнечной активности и т. п.). Результат действия циклических факторов будем обозначать с помощью неслучайной функции .

(Г) Случайные (нерегулярные), не поддающиеся учету и регистрации. Их воздействие на формирование значений временного ряда как раз и обусловливает стохастическую природу элементов , а следовательно, и необходимость интерпретации как наблюдений, произведенных над случайными величинами соответственно . Будем обозначать результат воздействия случайных факторов с помощью случайных величин («остатков», «ошибок») . Конечно, вовсе не обязательно, чтобы в процессе формирования значений всякого временного ряда участвовали одновременно факторы всех четырех типов. В одних случаях значения временного ряда могут формироваться под воздействием факторов (А), (Б) и (Г), в других – под воздействием факторов (А), (В) и (Г) и, наконец, – исключительно под воздействием одних только случайных факторов (Г). Однако во всех случаях предполагается непременное участие случайных (эволюционных ) факторов (Г). Кроме того, как правило, принимается (в качестве гипотезы) аддитивная структурная схема влияния факторов (А), (Б), (В) и (Г) на формирование значений , которая означает правомерность представления значений членов временного ряда в виде разложения:

Выводы о том, участвуют или нет факторы данного типа в формировании значений , могут базироваться как на анализе содержательной сущности задачи (т. е. быть априорно-экспертными по своей природе ), так и на специальном статистическом анализе исследуемого временного ряда .

В рамках введенных понятий и обозначений задача статистического анализа временного ряда в общем виде может быть сформулирована следующим образом:

по результатам измерений исследуемой переменной за тактов времени базового периода построить наилучшие (в определенном смысле) оценки для членов разложения (14).

Решение этой задачи используется для построения прогнозного значения на тактов времени вперед с помощью формулы (14) при и при подстановке в нее полученных оценок компонентов правой части разложения.

Механизмы формирования и статистический анализ экспертных оценок

Обычно выделяются следующие основные типы организации работы группы экспертов ():

· коллегиальный : «метод комиссий» (в виде открытой дискуссии по обсуждаемой проблеме); «метод суда» (в виде противостояния «защиты» и «обвинения» по каждому из вариантов обсуждаемого решения проблемы); «мозговая атака» и т.п.;

· частично коллегиальный: сценарный анализ типа «что – если», метод «Делфи» – многотуровое обсуждение проблемы с тайным голосованием экспертов или заполнением специальных анонимных анкет в конце каждого тура и работой независимой аналитической группы в промежутках между турами и т.п.;

· индивидуально-автономный: каждый из участников экспертной группы формирует и высказывает свое мнение (независимо от позиций других участников) в виде ранжирования обсуждаемых вариантов решения (или объектов), их парных сравнений или отнесения каждого из них к одной из заранее описанных градаций (см. формы представления исходных статистических данных в виде таблиц частот или таблиц сопряженности в между мнениями -го и -го экспертов измеряют величиной , где – коэффициент ранговой корреляции Спирмена (см. , гл. 11]). Определив тот или иной способ вычисления «расстояния» между мнениями пары экспертов, мы можем решать затем задачу «кластеризации» экспертов, интерпретируя каждый из найденных таким образом кластер как группу экспертов-единомышленников.

(ii) Анализ взаимной согласованности мнений группы экспертов. Располагая мнениями целой группы экспертов, аналитик-статистик стремится оценить степень согласованности всех этих экспертных оценок, в том числе и статистически проверить гипотезу о полном отсутствии какой-либо их согласованности (и тогда, очевидно, следует либо уточнить постановку предложенной экспертам задачи, либо поменять состав экспертной группы). Эта задача также решается средствами многомерного статистического анализа. Выбор конкретного метода зависит от формы исходных статистических данных. Например, если мнения экспертов представлены ранжировками, то в качестве меры их согласованности можно рассматривать коэффициент объектов), т.е. при исходных статистических данных вида определяется как решение оптимизационной задачи видаj -го эксперта отстоит от единого группового мнения, тем ниже оценивается уровень его относительной компетентности. Заметим, что если в результате исследования структуры совокупности экспертных мнений аналитик-статистик приходит к выводу о наличии нескольких подгрупп экспертов с однородностью мнений внутри каждой подгруппы и с существенным различием мнений в любой паре таких подгрупп, то задача единого группового мнения и оценка относительной компетентности эксперта решается отдельно для каждой из выявленных подгрупп.


Случайные факторы, в свою очередь, могут быть двоякой природы: внезапными («разладочными»), приводящими к скачкообразным структурным изменениям в механизме формирования значений x(t) (что выражается, например, в радикальных скачкообразных изменениях основных структурных характеристик функций f тр (t), j (t) и y (t) анализируемого временного ряда в случайный момент времени), и эволюционными остаточными , обусловливающими относительно небольшие случайные отклонения значений x(t) от тех, которые должны были бы получиться только под воздействием факторов (А), (Б) и (В). Однако в данном разделе будут рассмотрены схемы формирования временных рядов, включающие в себя действие только эволюционных остаточных случайных факторов.

Предыдущая
1

В статье на конкретных примерах рассмотрены различные математические методы прогнозирования во времени, среди которых простая экстраполяция, методы, основанные на темпах роста, математическое моделирование. Показано, что выбор метода зависит от базы прогноза – информации за предыдущий временной период.

прогнозирование

биостатистика

1. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование: Учебник. – М.: Финансы и статистика, 2001. – 228 с.

2. Петри А., Сэбин К. Наглядная статистика в медицине. – М.: ГЭОТАР-МЕД, 2003. – 144 с.

3. Садовникова Н.А., Шмойлова Р.А. Анализ временных рядов и прогнозирование: Учебное пособие. – М.: Изд. центр ЕАОИ, 2001. – 67 с.

Обычно под прогнозированием понимается процесс предсказания будущего основанное на некоторых данных из прошлого, т.е. изучается развитие интересующего явления во времени. Тогда прогнозируемая величина рассматривается как функция времени y=f(t) . Однако в медицине рассматриваются и другие виды прогноза : прогнозируется диагноз, диагностическая ценность нового теста, изменение одного фактора под действием другого и т.д.

Целью статьи было представить различные методы прогнозирования и подходы к их правильному использованию в медицине.

Материалы и методы исследования

В статье рассмотрены следующие методы прогнозирования: методы простой экстраполяции, метод скользящих средних, метод экспоненциального сглаживания, метод среднего абсолютного прироста, метод среднего темпа роста, методы прогнозирования на основе математических моделей.

Результаты исследования и их обсуждение

Как уже было отмечено, прогноз осуществляется на основании некоторой информации из прошлого (базы прогноза). Прежде чем подобрать метод прогнозирования полезно хотя бы качественно оценить динамику изучаемой величины в предыдущие моменты времени. На представленных графиках (рис. 1) видно, что она может быть различной.

Рис. 1. Примеры динамики изучаемой величины

В первом случае (график А) наблюдается относительная стабильность с небольшими колебаниями вокруг среднего значения. Во втором случае (график Б) динамика носит линейно возрастающий характер, в третьем (график В) - зависимость от времени нелинейная, экспоненциальная. Четвертый случай (график Г)- пример сложных колебаний, имеющих несколько составляющих.

Наиболее распространенным методом краткосрочного прогнозирования (1-3 временных периода), является экстраполяция, которая заключается в продлении предыдущих закономерностей на будущее. Применение экстраполяции в прогнозировании базируется на следующих предпосылках:

Развитие исследуемого явления в целом описывается плавной кривой;

Общая тенденция развития явления в прошлом и настоящем не претерпит серьезных изменений в будущем.

Первый метод из методов простой экстраполяции - это метод среднего уровня ряда. В этом методе прогнозируемый уровень изучаемой величины принимается равным среднему значению уровней ряда этой величины в прошлом. Этот метод используется, если средний уровень не имеет тенденции к изменению, или это изменение незначительно (нет явно выраженного тренда, рис. 1, график А)

где yпрог - прогнозируемый уровень изучаемой величины; yi - значение i-го уровня; n - база прогноза.

В некотором смысле отрезок динамического ряда, охваченный наблюдением, можно уподобить выборке, а значит, полученный прогноз будет выборочным, для которого можно указать доверительный интервал

где - среднеквадратичное отклонение временного ряда; tα -критерий Стъюдента для заданного уровня значимости и числа степеней свободы (n-1).

Пример. В табл. 1 приведены данные временного ряда y(t). Рассчитать прогнозное значение y на момент времени t =13 методом среднего уровня ряда.

Таблица 1

Данные временного ряда y(t)

(80+98+94+103)/4

(80+98+94+103+84)/5

(80+98+94+103+84+115)/6

(80+98+94+103+84+115+98)/7

(80+98+94+103+84+115+98+113)/8

(80+98+94+103+84+115+98+113+114)/9

(80+98+94+103+84+115+98+113+114+87)/10

(80+98+94+103+84+115+98+113+114+87+107)/11

(80+98+94+103+84+115+98+113+114+87+107+85)/12

Исходный и сглаженный ряд представлены на рис. 2, расчет y - в табл. 2.

Рис. 2. Исходный и сглаженный ряд

Таблица 2

Доверительный интервал для прогноза в момент t =13

Метод скользящих средних - это метод прогнозирования на краткосрочный период, основан на процедуре сглаживания уровней изучаемой величины (фильтрации). Преимущественно используются линейные фильтры сглаживания с интервалом m, т.е.

.

Доверительный интервал

где - среднеквадратичное отклонение временного ряда; tα - критерий Стъюдента для заданного уровня значимости и числа степеней свободы (n-1).

Пример. В табл. 3 приведены данные временного ряда y(t). Рассчитать прогнозное значение y на момент времени t =13 методом скользящих средних с интервалом сглаживания m=3.

Исходный и сглаженный ряд представлены на рис. 3, расчет y - в табл. 4.

Таблица 3

Данные временного ряда y(t)

Рис. 3. Исходный и сглаженный ряд

Таблица 4

Прогнозное значение y

Метод экспоненциального сглаживания - это метод, при котором в процессе выравнивания каждого уровня используются значения предыдущих уровней, взятых с определенным весом. По мере удаления от какого-то уровня вес этого наблюдения уменьшается. Сглаженное значение уровня на момент времени t определяется по формуле

где St - текущее сглаженное значение; yt - текущее значение исходного ряда; St - 1 - предыдущее сглаженное значение; α - сглаживающая параметр.

S0 берется равным среднему арифметическому нескольких первых значений ряда.

Для расчета α предложена следующая формула

По поводу выбора α нет единого мнения, эта задача оптимизации модели пока еще не решена. В некоторых литературных источниках рекомендуется выбирать 0,1 ≤ α ≤ 0,3.

Прогноз рассчитывается следующим образом

.

Доверительный интервал

Таблица 5

Данные временного ряда y(t)

0,3×80+(1-0,3)×90,7

0,3×98+(1-0,3) ×87,5

0,3×94+(1-0,3) ×90,6

0,3⋅103+(1-0,3) ×91,6

0,3×84+(1-0,3) ×95

0,3⋅115+(1-0,3) ×91,7

0,3×98+(1-0,3) ×98,7

0,3⋅113+(1-0,3) ×98,5

0,3⋅114+(1-0,3) ⋅102,8

0,3×87+(1-0,3) ⋅106,2

0,3⋅107+(1-0,3) ⋅100,4

0,3×85+(1-0,3) ⋅102,4

97,2+0,3× (85-97,2)

Исходный и сглаженный ряд представлены на рис. 4, расчет y - в табл. 6.

Рис. 4. Исходный и сглаженный ряд

Таблица 6

Прогнозное значение y на момент времени t =11

Следующий метод прогноза - это метод среднего абсолютного прироста Прогнозируемый уровень изучаемой величины изменяется в соответствии со средним абсолютным приростом этой величины в прошлом. Данный метод применяется, если общая тенденция в динамике линейна (для случая, приведенного на рис. 1, график Б)

где ; y0 - базовый уровень экстраполяции выбирается как среднее значение нескольких последних значений исходного ряда; - средний абсолютный прирост уровней ряда; l - число интервалов прогнози рования.

В качестве базового уровня принято усредненное значение последних значений ряда, максимально трех.

Таблица 7

Данные временного ряда y(t)

Прогноз = y0+Δl

(60+75+70)/3=68,3

(75+70+103)/3=82,7

(70+103+100)/3=91

(103+100+115)/3=106

(100+115+125)/3=113,3

(115+125+113)/3=117,7

(125+113+138)/3=125,3

(113+138+136)/3=129

(138+136+145)/3=139,7

(136+145+150)/3=143,7

143,7+8,2⋅1=151,9

143,7+8,2⋅2=160,1

143,7+8,2⋅3=168,3

Исходный и сглаженный ряд представлены на рис. 5.

Рис. 5. Исходный и сглаженный ряд

Метод среднего темпа роста

Прогнозируемый уровень изучаемой величины изменяется в соответствии со средним темпом роста данной величины в прошлом. Данный метод применяется, если общая тенденция в динамике характеризуется показательной или экспоненциальной кривой (рис. 1В)

где - средний темп роста в прошлом; l - число интервалов прогнозирования.

Прогнозная оценка будет зависеть от того, в какую сторону от основной тенденции (тренда) отклоняется базовый уровень y0, поэтому рекомендуется рассчитывать y0 как усредненное значение нескольких последних значений ряда.

Таблица 8

Данные временного ряда y(t)

62,5⋅1,081 = 67,7

(70/60)1/2 =1,08

65⋅1,081 = 70,2

(65+70+68)/3=67,7

(68/60)1/3 =1,04

67,7⋅1,041 =70,5

(70+68+82)/3=73,3

(82/60)1/4 =1,08

73,3⋅1,081 =79,3

(68+82+80)/3=76,7

(80/60)1/5 =1,06

76,7⋅1,061 =81,2

(82+80+95)/3=85,7

(95/60)1/6 =1,08

85,7⋅1,081 =92,5

(80+95+113)/3=96

(113/60)1/7 =1,09

96⋅1,091 =105,1

(95+113+135)/3=114,3

(135/60)1/8 =1,11

114,3⋅1,111 =126,5

(113+135+140)/3=129,3

(140/60)1/9 =1,10

129,3⋅1,11 =142,1

(135+140+168)/3=147,7

(168/60)1/10 =1,11

147,7⋅1,111 =163,7

(140+168205)/3=171

(205/60)1/11 =1,12

171⋅1,121 =191,2

171⋅1,122 =213,8

171⋅1,123 =239,1

Исходный и сглаженный ряд представлены на рис. 6.

Рис. 6. Исходный и сглаженный ряд

На сегодняшний день наиболее распространенным методом прогнозирования является нахождение аналитического выражения (уравнения) тренда . Тренд экстраполируемого явления - это основная тенденция временного ряда, в некоторой мере свободная от случайных воздействий.

Разработка прогноза заключается в определении вида экстраполирующей функции y=f(t), которая выражает зависимость изучаемой величины от времени на основе исходных наблюдаемых данных. Первым этапом является выбор оптимального вида функции, дающей наилучшее описание тренда. Наиболее часто используются следующие зависимости:

Линейная ;

Параболическая ;

Показательная функция ;

Проблемы нахождения коэффициентов линейной функции и прогноз на ее основе рассматриваются в разделе статистики «регрессионный анализ». Если форма кривой, описывающей тренд, имеет нелинейный характер, то задача оценки функции y=f(t) усложняется, и в этом случае необходимо привлечь к анализу специалистов по биостатистике и воспользоваться компьютерными программами по статистической обработке данных.

В большинстве реальных случаев временной ряд представляет собой сложную кривую, которую можно представить как сумму или произведение трендовой, сезонной, циклической и случайной компонент.

Тренд представляет собой плавное изменение процесса во времени и обусловлен действием долговременных факторов. Сезонный эффект связан с наличием факторов, действующих с заранее известной периодичностью (например, времена года, лунные циклы). Циклическая компонента описывает длительные периоды относительного подъема и спада, состоит из циклов переменной длительности и амплитуды (например, некоторые эпидемии имеют длительный циклический характер). Случайная составляющая ряда отражает воздействие многочисленных факторов случайного характера и может иметь разнообразную структуру.

Заключение

Методы простой экстраполяции, метод скользящих средних, метод экспоненциального сглаживания являются простейшими, и в тоже время самыми приближенными - это видно из широких доверительных интервалов в приведенных примерах. Большая погрешность прогноза наблюдается в случае сильных колебаний уровней. Следует обратить внимание на то, что неправомерно использовать эти методы при наличии явной тенденции к росту (или падению) исходного временного ряда. Тем не менее, для краткосрочных прогнозов их применение бывает оправданным.

Анализ всех компонентов временного ряда и прогнозирование на их основе задача нетривиальная, рассматривается в разделе статистики «анализ временных рядов» и требует специальной подготовки.

Библиографическая ссылка

Койчубеков Б.К., Сорокина М.А., Мхитарян К.Э. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ В МЕДИЦИНЕ // Успехи современного естествознания. – 2014. – № 4. – С. 29-36;
URL: http://natural-sciences.ru/ru/article/view?id=33316 (дата обращения: 30.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
Опубликованы более подробные и корректные материалы по .

В марте 2011 года была опубликована заметка «Пять способов повысить точность прогнозирования» . Автор Алексей Скрипчан весьма дельно, просто и достаточно подробно рассмотрел в ней прогнозирование, которое необходимо выполнять в рамках маркетинга и планирования. Интересно звучит его эпитет в подразделе «Выгоды более точного прогнозирования» :

Прогнозирование становится рулем, помогающим компании держать курс, менять направление движения или уверенно плыть в незнакомых водах…

Мне бы хотелось добавить несколько слов к уже сказанному. Главным образом, необходимо отметить, что в упомянутой статье речь идет об экспертном прогнозировании. Нужно различать два вида прогнозирования: экспертное и формализованное .

Экспертное прогнозирование

Экспертное прогнозирование подразумевает формирование будущих значений экспертом, т.е. человеком, обладающим глубокими знаниями в определенной области. Эксперт при этом часто использует математический аппарат , однако в данном виде прогнозирования математический аппарат является лишь вспомогательным вычислительным инструментом. Основой же являются знания и интуиция эксперта, а потому иногда эти методы называют интуитивными .

Экспертное прогнозирование применяется тогда, когда объект прогнозирования либо слишком прост, либо, напротив, настолько сложен, что аналитически учесть влияние внешних факторов невозможно . Экспертные методы прогнозирования не предполагают разработку моделей прогнозирования и отражают индивидуальные суждения специалистов (экспертов) относительно перспектив развития процесса. К таким методам относятся следующие методы.

  • Метод экспертных оценок
  • Метод исторических аналогий
  • Метод предвидения по образцу
  • Нечеткая логика
  • Сценарное моделирование «что – если»

Формализованное прогнозирование - это прогнозирование на основании математической модели, которая, улавливая закономерности процесса , на своем выходе имеет будущие значения исследуемого процесса. довольно много, например, согласно ряду обзоров в настоящее время насчитывается свыше 100 классов моделей прогнозирования. Число общих классов моделей, которые в тех или иных вариациях повторяются в других, конечно, гораздо меньше и сводится легко к дюжине.

  • Регрессионные модели (regression model)
  • Авторегрессионные модели ( , AR)
  • Нейросетевые модели (artificial neural network , ANN)
  • Модели экспоненциального сглаживания ( , ES)
  • Модели на базе цепей Маркова (Markov chain)
  • Классификационно-регрессионные деревья (classification and regression trees , CART)
  • Метод опорных векторов (support vector machine , SVM)
  • Генетический алгоритм (genetic algorithm , GA)
  • Модель на основе передаточных функций (transfer function , TF)
  • Формализованная нечеткая логика (fuzzy logic , FL)
  • Фундаментальные модели

Автор статьи о прогнозировании в маркетинге совершенно верно отметил, что «как и любой инструмент, математика может быть опасной в руках дилетанта. Чтобы проверить собственные выкладки, можно привлечь кого-то с сильными статистическими навыками для анализа вашей информации ». Математические модели прогнозирования требуют развитых компетенций не только в математике, но и программировании, владении сложными статистическими пакетами для создания не только точной и быстрой модели.

Повышение точности прогнозирования

Безусловно, оба рассмотренных вида прогнозирования часто работают в совокупности, например, на основании сложного алгоритма вычисляются будущие значения временного ряда, а далее, эксперт проверяет эти цифры на адекватность. На этом этапе эксперт может внести ручные корректировки, которые при его высокой квалификации, способны положительно повлиять на качество прогноза.

Итого, если вам нужно повысить точность экспертного прогнозирования в задачах маркетинга, то вам нужно прямиком следовать данным в статье рекомендациям. Если же перед вами стоит задача повышения точности прогнозирования за счет сложных, быстрых, программно реализованных математических моделей, то стоит взглянуть в сторону , то есть прогноза, составленного на основании набора независимых прогнозов. В ближайшее время я буду говорить о консенсус-прогнозе в этом блоге подробнее.