Главная Псн Априорная и апостериорная оценка качества прогноза.

Априорная и апостериорная оценка качества прогноза.

Оценка качества эксперта может быть:

1) априорной – если в ней не используется информация о его участии в других экспертизах (т.е. эксперт оценивается априорно, до того, как он был использован в качестве эксперта) ;

2) апостериорной – если она использует такую информацию (основана на ней) и

3) тестовой – в форме специального тестового испытания, направленного на выявление необходимых качеств эксперта.

К априорным методам оценки относятся:

1) самооценка эксперта. Она может осуществляться

а) с использованием балльной шкалы (например, 5-балльной) ;

б) с использованием других шкал. Например, если необходимо отнести себя к одной из двух групп - «теоретик» или «практик», - то речь идет о самооценке в номинальной шкале (шкале наименований), на которой задано только отношение тождества (либо объект относится к некоторой группе, либо нет). Если необходимо отнести себя к одной из групп: «начинающий исследователь», «исследователь, имеющий опыт работы в данной области», «исследователь с большим опытом работы», «углубленный специалист по исследованиям в данной области», - то речь идет об ординальной шкале (шкале порядков), на которой задано отношение «больше-меньше» («лучше-хуже»). Она может быть дополнена указанием некоторых числовых диапазонов, например, если специалист занимается данной областью исследований менее полугода, его считают начинающим, от полугода до 2 лет – имеющим опыт, от 2 до 5 лет – большой опыт, более 5 – углубленно знакомым с предметом. Более подробно типы шкал будут рассмотрены далее ;

в) путем расчета интегральных (агрегированных) показателей самооценки по различным показателям (например, по уровню знакомства с различными источниками информации в определенной области специалист оценивает себя 5 баллами, а по уровню знакомства с исследуемой проблемой – 4-мя баллами по 5-балльной шкале; если веса этих показателей равны соответственно 0.8 и 0.2, то агрегированная оценка составит 5*0.8 + 4*0.2 = 4.8). Подробнее способ расчета агрегированных показателей был рассмотрен при изучении принципа оптимальности;

Недостатком всех методов самооценки является то, что такая оценка тесно связана с уровнем самокритичности, что затрудняет ее интерпретацию. Достоинством является простота получения такой оценки.

2) взаимная оценка экспертов. Здесь, в свою очередь, потенциальным членам экспертной группы могут быть предложены различные методы оценки друг друга – балльные оценки, сравнительные оценки, простое формирование списков и т.п. (подробнее рассматривается далее). Полученные от разных экспертов оценки подлежат дальнейшей обработке для получения отдельной оценки для каждого эксперта. Т.е. такая оценка, в свою очередь, является групповой экспертной оценкой, и встает проблема ее обработки для получения общей оценки (см. далее). Такая оценка предположительно является более объективной, чем самооценка, но

Процесс ее получения более сложен;

- кроме того, здесь также могут проявиться личностные и групповые симпатии и антипатии, что повлияет на объективность;

- и, наконец, различные эксперты по одному и тому же вопросу не обязательно хорошо знакомы с работами и возможностями друг друга. В современных условиях такое знакомство может быть лишь у специалистов, длительно работающих совместно. Однако их одновременное привлечение к экспертизе может быть не целесообразно, поскольку они слишком похожи друг на друга.

3) документационный метод (так называемый метод объективных оценок, или метод формальных показателей) – основан на использовании соответствующим образом заверенных документов, содержащих объективную информацию об эксперте (диплом, трудовая книжка и т.п.). Например, для вхождения в экспертную группу могут быть предъявлены следующие требования: стаж работы не менее трех лет (подтверждается выпиской из трудовой книжки), высшее образование (подтверждается дипломом), не менее 10 научных трудов (подтверждается списком, заверенным соответствующим лицом). Объективность оценки, полученной по данному методу, зависит от добросовестности и объективности суждений лиц, выдающих и заверяющих используемые документы, а также репутации соответствующих организаций (например, дипломы разных вузов объективно имеют различную ценность, стаж работы в различных организациях также неравноценен и т.п.). Рекомендуется использовать данный метод только как вспомогательный.

4) и прочие методы.

Существующие, приборы, системы и традиционные методы определения места судна имеют значительные недостатки. Так, например, погрешности определения счислимых координат зависят от точности работы лага и компаса, от гидрометеорологических условий "плавания, "погрешности определения счислимых координат растут с течением времени. Методы мореходной астрономии зависят от погодных условий, имеют ограниченную точность, а также требуют значительного времени для получения обсервованных координат. Визуальные методы определения места судна имеют ограниченный район применения, и их использование также зависит от погодных условий. Радиопеленгование имеет ограниченный район использования и низкую точность. Почти все радионавигационные системы имеют ограниченный район использования, а глобальные радионавигационные системы имеют и низкую точность. Спутниковые навигационные системы на низких орбитах обладают значительной дискретностью определения места. Радиолокационные станции имеют ограниченный район использования и необходимость опознания ориентиров.

Список можно продолжить, но уже совершенно очевидно, что недостатки традиционных методов и средств определения места судна в значительной мере снижают безопасность мореплавания.

1.6 Априорная и апостериорная оценка точности обсервации.

В соответствии с хорошей практикой любой инженерный расчет должен сопровождаться оценкой точности полученного результата: отыскание математического ожидания искомых параметров и их дисперсии. В судовождении при определении места судна рассчитывают координаты и оценивают их точность либо через ковариационную матрицу, либо через одну из ее геометрических интерпретаций, например в виде эллипса погрешностей.

Измерения проводятся с погрешностями, поэтому и обсервованные координаты вычисляются тоже с погрешностями.

1.6.1 Правило переноса погрешностей

Особенностью определения координат является тот факт, что измерения косвенные, то есть измеряются навигационные параметры, и допущенные погрешности затем переносятся в погрешности координат.

1.6.2 Априорная оценка точности обсервации

Для оценки точности обсервации используются вероятно-статистические методы, которые устанавливают границы некоторой доверительной области, в которой с заданной вероятностью может находиться истинное место судна. При этом делаются следующие допущения:

В измерениях отсутствуют промахи, т.е. грубые погрешности;
Систематические погрешности измерений определены и компенсированы поправкой;
Вычислительные погрешности и погрешности графики пренебрежительно малы;
Статистические числовые характеристики погрешностей измерений (дисперсия и СКП) и законы их распределения заданы априорно, т.е. по результатам предыдущих экспериментов (обсерваций). Эти априорные данные имеют приближенные средние значения и базируются на том, что все эксперименты, проведенные ранее с такими же приборами на судах, имеют сходные условия, что и текущая обсервация.

Рассмотрим этот вопрос на примере ОМС по двум измерениям. В этом случае линеаризованная система принимает вид.

A D X = D U (75)

Так как измерения с погрешностями, то перепишем систему в виде

A (D X+ d x) = D U+ d u. (76)

Тогда

A d x = d u.

Откуда

d x = A -1 d u. (77)

Погрешности измерений могут быть статистически зависимы. Такая зависимость существует хотя бы потому, что обычно используются как минимум одни и те же инструменты. Эта статистическая зависимость определяется коэффициентом корреляции, а общее описание такой зависимости дает ковариационная матрица погрешностей измерений.

Формирование ковариационной матрицы погрешности измерений выполняется по формуле

D(D u)= d u d u T . (78)

Для двумерного случая это выглядит так:

На главной диагонали находятся дисперсии измеряемых навигационных параметров, а вне диагонали - ковариационные моменты, которые характеризуют статистическую связь между измерениями.

Структура ковариационной матрицы погрешностей измерений определяет название МНК: если матрица диагональна и все ее компоненты равны, то алгоритм носит название МНК, если компоненты не равны, то это метод взвешенных наименьших квадратов; если матрица не диагональна, то это обобщенный МНК.

Погрешности измерений в процедуре расчета трансформируются в погрешности координат. В качестве такого преобразователя погрешностей используется матрица коэффициентов A.

Определим ковариационную матрицу погрешностей определяемых параметров, используя правила (A B) -1 = B -1 A -1 и (B -1) T =(B T) -1

D(D x)= d x d x T = (A -1 d u) (A -1 d u) T =A -1 d u d u T (A -1) T =

A -1 D(D u) (A -1) T = (A Т (D(D u)) -1 A) -1 .

В дальнейшем при написании ковариационных матриц, где это не вносит двузначности, будем опускать аргумент

Обозначим ковариационную матрицу погрешностей координат через

N= D(D x) = (A Т D -1 A) -1 . (79)

Для двумерного случая матрица N имеет вид:

где n 11 - дисперсия по широте

n 22 - дисперсия по отшествию.

n 12 = n 21 - ковариационные моменты.

Вся информация о погрешностях содержится в матрице N . В судовождении часто используется ее геометрическая интерпретация в виде эллипса погрешностей. Установим связь между элементами матрицы N и параметрами эллипса: полуосями и углом ориентации.

В общем случае такая задача рассматривалась Хоттелингом Г. в 1933 г. Было показано, что для ковариационной матрицы существуют векторы, направлениям которых соответствуют максимальные и минимальные значения рассеивания (погрешностей). Численно эти значения соответствуют собственным числам матрицы. Направления собственных векторов, указывающие на направление максимального и минимального рассеивания (дисперсии), соответствуют направлениям полуосей эллипса. Собственные числа - это экстремальные значения дисперсий. Для перехода к линейным величинам - полуосям эллипса (гипер - эллипса для n-мерного пространства), необходимо извлечь квадратный корень.

Исследуем теперь точность оценок максимального правдоподобия и байесовских оценок в условиях, когда априорные значения математических ожиданий и дисперсий известны неточно. Будут рассмотрены два случая. В первом из них будет предполагаться, что априорная плотность вероятности параметра неизвестна, хотя значения ее первых двух моментов заданы; при этом также считается известной условная плотность вероятности . Для этого случая можно найти оценку максимального правдоподобия . Но поскольку среднеквадратическая ошибка байесовской оценки меньше, чем оценки максимального правдоподобия (см. пример 6.7), то вполне можно считать оправданными попытки использования псевдобайесовской оценки, при построении которой вместо недостающей априорной плотности вероятности оцениваемого параметра вводится какая-либо другая плотность. При анализе первого случая такой вводимой функцией служит нормальная плотность вероятности. При этом будет показано, что получающаяся псевдобайесовская оценка имеет меньшую среднеквадратическую ошибку, чем оценка максимального правдоподобия. Во втором случае будем считать, что неизвестными являются также и среднее значение, и дисперсия оцениваемого параметра. В подобных условиях будет предложено использовать эмпирические псевдобайесовские оценки, основывающиеся на априорных оценках неизвестных значений математического ожидания и дисперсии.

Анализ точности: оценки максимального правдоподобия. Рассмотрим линейную модель наблюдений:

где и - векторы с компонентами, представляющие собой выборку и вектор шума; - постоянный N-мерный параметр, подлежащий оцениванию; - модуляционная матрица размера .Будем предполагать, что является нормальным случайным вектором с нулевым средним значением и ковариационной матрицей

Оценка максимального правдоподобия для параметра определяется максимизацией по плотности вероятности

(6.56)

; ; .

Нетрудно доказать, что

В действительности часто оказывается, что ковариационные матрицы шума известны лишь приближенно. Поэтому примем, что вместо точных матриц или в алгоритме оценивания используются несколько отличающиеся матрицы или . Так что фактически будет вычисляться оценка

которая является несмещенной при каждом фиксированном значении оцениваемого параметра (условно несмещенной). Рассмотрим теперь следующие ошибки:

; ; . (6.59)

Здесь является ошибкой, которая получается при использовании алгоритма для вычисления значений оценки максимального правдоподобия, ориентированного на точную ковариационную матрицу (такую оценку назовем идеальной); - ошибка оценивания, когда используемый алгоритм ориентирован на предполагаемую матрицу ; разность между значениями действительной оценки максимального правдоподобия и вычисляемой обозначена символом .

Из ф-лы (6.25) для безусловной среднеквадратической ошибки получаем

, (6.60)

если для оценивания используется идеальная оценка максимального правдоподобия. С другой стороны, для оценки имеем:

или с использованием обозначений, принятых в (6.54),

Можно показать (см. § 6.7), что

Полезно рассмотреть разность двух анализируемых оценок, поскольку она характеризует точность вычисления значений идеальной оценки максимального правдоподобия. Для ковариационной матрицы вектора получаем

Рассмотрим теперь случай, когда предполагаемая ковариационная матрица шума «близка» к истинной, т. е. можно положить

где «мало». Тогда

(6.67)

Используя это приближение и учитывая также, что

получаем

Пример 6.10. В скалярном стационарном случае, когда

приходим к следующим выражениям для оценок и их дисперсий:

; ; ; ;

Интересным оказывается тот факт, что для этого частного случая не нужно знать дисперсию шума при вычислении оценки максимального правдоподобия. И это справедливо всякий раз, когда выборка является скалярной, а ее элементы независимы и одинаково распределены.

Пример 6.11. Допустим теперь, что предполагаемая ковариационная матрица шума отличается от истинной, причем

Выражения для рассматриваемых оценок и их ковариационных матриц при этом имеют вид

; ;

так что вновь оценка максимального правдоподобия оказывается нечувствительной к подобным ошибкам в определении ковариационной матрицы шума.

Пример 6.7 позволил показать, что оценка максимального правдоподобия хуже, чем байесовская оценка. Она приводит к большей среднеквадратической ошибке оценивания, поскольку при построении оценки максимального правдоподобия совсем не учитывается априорная плотность вероятности оцениваемого параметра. Перейдем теперь к анализу точности байесовских оценок.

Анализ точности: байесовские оценки. Снова рассмотрим линейную модель наблюдаемого процесса

где случайный параметр является -мерным вектором, выборочное значение которого одно и то же для всех элементов выборки; векторы и имеют размерность , а модуляционная матрица наблюдений - размер. Будем предполагать, что и - независимые нормальные векторы с параметрами:

Как и в примере 6.1, для оценки по максимуму апостериорной плотности вероятности получаем

Ковариационная матрица вектора ошибок при использовании этой оценки

Предположим теперь, что вместо истинных математических ожиданий и ковариационных матриц в ф-ле (6.73) используются другие матрицы , и или для составного вектора. Так что фактически вычисляется оценка

которая не является уже безусловно несмещенной, так как

Оценка будет несмещенной только в том случае, когда – либо , либо . Корреляционная матрица вектора ошибок при использовании этой оценки вычисляется обычным образом с использованием (6.74) Так как

(6.77)

Эта матрица зависит от величины смещения оценки [см. второе слагаемое в ф-ле (6.76)] Ковариационная матрица вектора ошибок для оценки

Если ковариационные матрицы, используемые при вычислении оценки , оказываются равными истинным, то ф-ла (6.79) переходит в (6.74). Во всех же других случаях

и равенство достигается тогда, когда ; . Разница между знаменателями двух рассматриваемых оценок получается путем вычитания (6.75) из (6.73). Ковариационную матрицу этого вектора, можно вычислить с помощью соотношения

Так что окончательно имеем

Эта матрица равна нулю, если моменты, используемые при вычислении оценки , совпадают с истинными. Формулы (6.76) и (6.82) позволяют провести анализ точности оценки по максимуму апостериорной плотности вероятности при неточно известных ковариационных матрицах оцениваемого параметра и шума.

Полезные приближения для полученных выражений можно указать для случая, когда

; ; , (6.83)

где и малы. Для этого достаточно воспользоваться следующими приближенными представлениями:

Если ошибки в определении априорных ковариационных матриц малы, то использовать это выражение несколько проще, чем (6.82). Однако более важным следствием, вытекающим из ф-лы (6.84) и касающимся точности оценок и является то, что согласно (6.84) ковариационная матрица вектора разности этих оценок пропорциональна , и . То есть, если при вычислении оценки используются ковариационные матрицы, отличающиеся от истинных на , то это приводит к увеличению на дисперсий ошибок оценивания. Аналогичное замечание следует сделать относительно ф-лы (6.69), определяющей ковариационную матрицу вектора разности двух оценок максимального правдоподобия.

Приведенные выше соотношения позволяют оценить ухудшение точности оценок максимального правдоподобия и байесовских оценок при неправильном выборе априорных средних значений и ковариационных матриц. Показано, что оценка максимального правдоподобия всегда остается несмещенной. Однако байесовская оценка оказывается смещенной, если априорное среднее значение отлично от истинного, либо выбранная обратная ковариационная матрица не равна нулю. Если же принимается равной нулю, то байесовская оценка переходит в оценку максимального правдоподобия.

Исследуем теперь смещение последовательных оценок, возникающее из-за неточного знания априорных данных. Снова примем, что

Однако при построении последовательной оценки для параметра , вычисляемой на каждом шаге , , было принято, что априорное среднее значение ковариационная матрица этого параметра равны соответственно и .

Сначала будем предполагать, что ковариационная матрица шума уже выбрана и может считаться заданной, в то время как и неизвестны и вместо них будут использоваться оценки и .

В соответствии с (6.73) имеем

, (6.86)

где - оценка по максимуму апостериорной плотности вероятности (или байесовская оценка при симметричной функции потерь) для параметра , вычисляемая по выборке . При эта оптимальная оценка имеет вид

Если теперь использовать предложенные оценки и вместо и и воспользоваться леммой об обращении матриц, то последнее выражение можно переписать следующим образом:

При получаем

Это выражение можно переписать следующим образом:

где ; .

Здесь снова использована лемма об обращении матриц. Повторяя подобные рассуждения для можно установить следующее рекуррентное соотношение:

(6.89)

Это и есть искомые алгоритмы последовательного оценивания. Полученные выражения являются частным случаем алгоритмов, описывающих фильтры Калмана и Винера, которые будут обсуждаться в следующей главе. Эти соотношения можно получить также непосредственно из общего выражения для оценки , если учесть, что

(6.91)

Эти оба набора соотношений можно использовать для построения алгоритма последовательного вычисления оценки. Если размерность векторов или меньше размерности вектора , то набор соотношений (6.89) намного предпочтительнее с вычислительной точки зрения. Это объясняется тем, что в этом случае при вычислении значений оценки требуется обращать матрицы более низкого размера. Очевидно также, что оба набора соотношений приводят к более сложным вычислениям, чем исходное выражение для оценки

. (6.92)

Поэтому это выражение и следует использовать при практических вычислениях, если нет необходимости в последовательном получении значений оценок. Если же требуются последовательные алгоритмы, то необходимо использовать соотношения (6.89). Следует, однако, иметь в виду, что подобными рекомендациями можно руководствоваться не всегда. Обычно последовательные алгоритмы более предпочтительны с точки зрения их реализации по сравнению с непоследовательными.

Найдем теперь смещение оценки при использовании последовательного алгоритма. Пусть - истинное среднее значение оцениваемого параметра. Тогда смещение

. (6.93)

Отсюда следует, что смещение оценки стремится к нулю при , так что эта оценка асимптотически несмещена. Смещение уменьшается также с ростом априорной ковариационной матрицы . Кроме того,

(6.94)

так что при достаточно большом числе наблюдений априорное среднее значение и ковариационная матрица вектора не оказывают существенного влияния на вычисляемые значения оценок. Однако при малых значениях смещение оценки по максимуму апостериорной плотности вероятности, обусловленное неточностью априорных оценок среднего значения и ковариационной матрицы вектора , может быть существенным. Если выбранная матрица отличается от истинной матрицы шума то ковариационная матрица фактически вычисляемой оценки может быть найдена по ф-ле (6.78). Так что для ковариационной матрицы ошибки получаем

где и - предполагаемые, a и - истинные ковариационные матрицы. Выражение для смещения было приведено выше. Заметим, что только в том случае, когда предполагаемые матрицы оказываются равными истинным, выражение для ковариационной матрицы совпадает с приведенным ранее выражением для матрицы . В гл. 8 будет показано, что найденное здесь соотношение для ковариационной матрицы ошибок можно записать в форме разностного уравнения. Здесь же приведем выражение для ковариационной матрицы ошибок при использовании оценки после достаточно большого числа шагов. Имеем

При смещение и ковариационная матрица этой оценки стремятся к нулю, даже если ковариационная матрица шума неизвестна. Подчеркнем, однако, что эти выводы остаются справедливыми только для этого частного примера, в котором оцениваемый параметр не меняет своего значения от наблюдения к наблюдению. В общем случае, когда значения оцениваемого параметра изменяются во времени, и смещение оценки, и ковариационная матрица вектора ошибок не стремятся к нулю с ростом времени наблюдения или объема выборки .

Пример 6.12. Если предположить, что и являются скалярными величинами и дисперсия шума не зависит от номера наблюдения, то полученные выше соотношения существенно упрощаются. Действительно, в этом случае совокупность алгоритмов последовательного оценивания (6.89) принимает вид

; ;

; .

Непоследовательная оценка и предполагаемая дисперсия этой оценки могут быть найдены в результате решения этих разностных уравнений. Так что

; .

Смещение оценки

Дисперсия фактически вычисляемой оценки

Согласно (6.82) для дисперсии разности двух оценок получаем

Это выражение не удается привести к более простому виду, поэтому может оказаться полезной приближенная формула типа (6.84)

На рис 6.9 приведены графики, иллюстрирующие влияние априорной дисперсии на нормированное смещение оценки при . Если намного больше, чем , смещение с ростом объема выборки быстро уменьшается. Поэтому если в практических задачах смещение оценки при малых нежелательно, то значение не следует брать слишком малым. Конечно, если истинное значение априорного среднего известно и используется при вычислении оценки, то смещение отсутствует. На рис 6.10 приведены графики зависимости среднеквадратической ошибки оценивания для двух случаев. В первом из них , во втором случае исследовалась зависимость среднеквадратической ошибки при , причем принятое значение дисперсии шума не совпадало с истинным.

Рис 6.9 Нормированное смещение оценки как функция объема выборки (пример 6.12)

Второй график рис. 6.10 справедлив также для случая, когда , однако значение априорной дисперсии

параметра выбрано неверно. Во всех случаях предполагалось, что . Соотношения, необходимые для построения графиков, получены с использованием приближенного представления (6.84) Для рассматриваемых здесь случаев получаем

; .

Рис 6.10 Дисперсии ошибок оценивания как функции от объема выборки (пример 6.12)

Разность между значениями среднеквадратической ошибки оценивания при использовании указанных алгоритмов и минимально достижимой ошибки оказывается максимальной при объеме выборки и уменьшается с ростом . Если неизвестными являются обе дисперсии и , то тот же приближенный способ вычисления приводит к выражениям

; .

Теперь разность между значениями среднеквадратических ошибок оказывается наибольшей при объеме выборки, совпадающем с ближайшим целым числом, превышающим . Если то максимум этой разности всегда достигается при .

Аналогичные результаты можно получить для процессов с непрерывным временем. Для наблюдаемого процесса в этом случае можно записать

, (6.97)

где вектор и шум независимы и являются нормальными, с параметрами:

Соответствующая запись для дискретного времени, которая уже была использована выше, имеет вид (6.85), где теперь необходимо положить . Вновь предположим, что при определении алгоритмов оценивания неизвестная априорная дисперсия шума принята равной .Будем считать также, что возможны ошибки при выборе значений и . Воспользовавшись уже известным предельным переходом, из (6.89) получаем следующие последовательные алгоритмы фильтрации при непрерывном времени:

(6.98)

Явное выражение для оценки имеет вид

Смещение этой оценки

, (6.100)

а матрица вектора ошибок

(6.101)

Теперь нетрудно выписать аналогичные выражения для только что рассмотренного скалярного случая при непрерывном времени. Необходимые для этого рассуждения полезно провести читателю самостоятельно.

До сих пор при анализе ошибок оценивания не предпринимались попытки уточнить значение дисперсии шума. Теперь попытаемся это сделать. Будем рассматривать последовательность наблюдаемых случайных величин

где случайные величины независимы, нормальны, имеют нулевое среднее значение и одну и ту же дисперсию . Будем исследовать байесовскую оценку для параметра , который является нормальным случайным вектором с известными моментами ; . В соответствии с (6.73) байесовская оценка

Отсюда ясно, что для того, чтобы воспользоваться этим выражением для вычисления значений оценки необходимо знать дисперсию шума. Поскольку для построения байесовской оценки дисперсии шума потребовалось бы вводить плотность вероятности этой дисперсии, то здесь в качестве оценки для ковариационной матрицы используем оценку максимального правдоподобия. Такой выбор будет более обоснованным, если относительно параметра , предположить, что он неслучаен и его значение неизвестно, а не считать его случайным. Подобные логические рассуждения приводят к выбору из двух возможных оценок оценки максимального правдоподобия. В примере 6.6 уже было показано, что в рассматривающихся здесь условиях оценки максимального правдоподобия для параметров и имеют вид

(6.104)

Сразу же становится очевидным, что при попытке решать эту систему уравнений относительно оценок для параметров или неизбежно возникнут значительные трудности. Их можно обойти, если задачу оценивания сформулировать несколько иначе. А именно, от -мерных векторных наблюдений , перейдем к скалярным наблюдениям , .

Если предположить, что , то рассматриваемые оценки максимального правдоподобия примут вид

; (6.105)

. (6.106)

Теперь для вычисления значений оценки не нужно знать значение оценки . В то же время значения оценки используются при вычислении оценки .

Если необходимо указать последовательные алгоритмы оценивания, то можно воспользоваться подходом, который уже был приманен ранее для получения последовательных оценок . Введем сначала обозначение . Заметим, что

Используя лемму об обращении матриц, получим

Для оценки максимального правдоподобия вектора состояния можно записать

; .

Объединяя эти два равенства, получаем

Снова используя лемму об обращении матриц применительно к матрице , имеем окончательно

Аналогичным образом можно найти последовательный алгоритм для оценки . В результате получаем

Эти последние два алгоритма могут быть использованы для последовательного адаптивного оценивания. Алгоритмы для более сложных случаев можно найти в работах .

Псевдобайесовские оценки. Покажем, что при оценивании случайного параметра среднеквадратическая ошибка оценивания при использовании оценки максимального правдоподобия больше, чем при использовании байесовской оценки. Именно это имея в виду, будем говорить, что оценка максимального правдоподобия хуже байесовской. Основная причина такого соотношения оценок состоит в том, что при построении байесовской оценки учитываются некоторые априорные сведения об оцениваемом параметре, в то время как при отыскании оценок максимального правдоподобия подобные сведения игнорируются. Правда, к сожалению, неправильный выбор значений параметров априорных распределений приводит к появлению смещения байесовской оценки. Вычисление смещения в таких условиях может оказаться трудно разрешимой проблемой. Таким образом, желательно использовать байесовские оценки с тем, чтобы обеспечить минимально возможное значение среднеквадратической ошибки. Однако при этом необходимо предусмотреть подстройку значений параметров априорного распределения с целью уменьшения смещения оценки.

Рассмотрим линейную модель при дискретном времени, когда

а и независимы и

(6.110)

Ранее уже было найдено выражение для оценки максимального правдоподобия для этого случая при дополнительном предположении, что шум является нормальным. Чтобы найти оценку максимального правдоподобия, основывающуюся на одном единственном наблюдении, необходимо максимизировать значение плотности . Это приводит к следующему выражению:

Условные математическое ожидание и ковариационная матрица этой оценки равны соответственно:

(6.112)

Таким образом, эта оценка является несмещенной, а ее ковариационная матрица

и совпадает с условной ковариационной матрицей.

Чтобы найти оценку максимального правдоподобия, основывающуюся на выборке объема , необходимо максимизировать значение плотности вероятности , где - выборка объема . В соответствии с (6.57) имеем

. (6.114)

Эта оценка не смещена, так как

, (6.115)

а ее ковариационная матрица

. (6.116)

Ранее было получено также выражение для оценки по максимуму апостериорной плотности вероятности для случая, когда параметр являлся нормальной случайной величиной. Если оценка должна основываться на одном наблюдении , то ее значения отыскиваются путем максимизации апостериорной плотности вероятности . В соответствии с (6.73) имеем

Эта оценка является несмещенной, так как . Согласно (6.74) ее ковариационная матрица

Если же оценка по максимуму апостериорной плотности вероятности должна основываться на выборке объема , то для ее отыскания необходимо максимизировать значение апостериорной плотности вектора при условии, что значение выборки фиксировано. Эта процедура максимизации приводит к следующему выражению для оценки:

Можно также показать, что

. (6.120)

Сравнивая матрицы (6.116) и (6.120), нетрудно заметить, что можно записать в виде

. (6.121)

Используя теперь лемму об обращении матриц, получаем

Заметим, что вторая матрица в правой части этого равенства неотрицательно определена. Это означает, что среднеквадратическая ошибка оценивания при использовании оценки по максимуму апостериорной плотности вероятности всегда меньше или, в крайнем случае, равна ошибке оценивания при применении оценки максимального правдоподобия.

Если среднее значение и ковариационная матрица параметра известны, но функциональный вид плотности вероятности этого параметра неизвестен, то оценку по максимуму апостериорной плотности вероятности найти нельзя. Поскольку оценка при нормальных оцениваемом параметре и шуме зависит только от среднего значения и ковариационных матриц этого параметра и шума, то можно попытаться использовать оценку в указанных выше условиях даже при неизвестной плотности вероятности параметра . Эту оценку будем называть псевдобайесовской. Как будет показано в следующем разделе, подобная псевдобайесовская оценка эквивалентна линейной оценке с минимальной среднеквадратической ошибкой.

Среднеквадратические ошибки оценивания при использовании псевдобайесовской оценки и оценки по максимуму апостериорной плотности вероятности одинаковы. Это следует из того, что алгоритмы этих оценок одинаковы, а три вычислении соответствующих им среднеквадратических ошибок используются только моменты второго порядка. Если распределения оцениваемого параметра и шума являются нормальными, то наилучшей будет оценка по максимуму апостериорной плотности вероятности. Если же распределение вектора отлично от нормального, то наилучшей линейной оценкой оказывается псавдобайесовская оценка. В этом случае, вообще говоря, могут существовать нелинейные алгоритмы оценивания, обеспечивающие меньшую среднеквадратическую ошибку.

Предположим теперь, что среднее значение и ковариационная матрица априорного распределения неизвестны. Можно найти оценки этих параметров, основывающиеся на выборке объема , и использовать эти оценки при построении псевдобайесовской оценки для параметра . Оценки параметров априорного распределения обозначим соответственно и . Если эти оценки используются при построении псевдобайесовской оценки, то ее будем называть эмпирической псевдобайесовской оценкой. Условия оценивания при этом оказываются точно такими же, как и при построении оценки (6.75), т. е. для эмпирической псевдобайесовской оценки, основывающейся на выборке объема , можно записать

Соответствующая корреляционная матрица вектора ошибок определяется тем же выражением, что и матрица (6.79), т. е.

(6.124)

Построенная таким образом псевдобайесовская оценка смещена. Ее смещение можно найти с помощью соотношения (6.76). Так что

Можно показать, что если оценки и являются выборочным средним и выборочной ковариационной матрицей соответственно и вычисляются по результатам априорных наблюдений, то эмпирическая псевдобайесовская оценка параметра асимптотически не смещена. Это является следствием несмещенности выборочного среднего .

Если среднее значение и ковариационная матрица параметра неизвестны, то в качестве оценок и будем использовать оценки максимального правдоподобия. К сожалению, в том случае, когда априорная плотность вероятности вектора не является нормальной, выборочное среднее и выборочная ковариационная матрица априорных оценок параметра не являются статистически независимыми оценками. Наличие статистической зависимости между этими оценками существенно усложняет вычисление корреляционной матрицы вектора ошибок при использовании эмпирической псевдобайесовской оценки. Поэтому здесь будем предполагать, что случайные векторы и являются нормальными.

Предположим далее, что можно осуществить наблюдений. Пусть в течение каждого наблюдения записывается выборка объемом . Будем считать также, что значение параметра случайным образом и независимо изменяется от наблюдения к наблюдению. Вычислим значений оценки максимального правдоподобия

, , (6.126)

где - оценка значения параметра при -м наблюдении, основывающаяся на выборке

объема . Очевидно, что

; . (6.127)

Таким образом, при конечном объеме выборки оценка сама является нормальной случайной величиной. Так как для любых двух оценок и , то эти оценки статистически независимы. Напомним здесь, что если взаимная ковариационная матрица двух нормальных случайных векторов равна нулю, то эти векторы независимы., запишем имеет вид и фактически является отношением мощности сигнала к общей мощности принятого колебания. Таким образом, если объем выборки больше десяти, то эмпирическая псевдобайесовская оценка намного лучше, чем оценка максимального правдоподобия, если критерием сравнения является величина среднеквадратической ошибки оценивания. Причем выигрыш в точности увеличивается с уменьшением значения параметра . Другими словами, при малых отношениях сигнал/шум эмпирические псевдобайесовские оценки могут обеспечить значительно более высокую точность оценивания по сравнению с оценками максимального правдоподобия (или с байесовскими оценками при неправильно установленных значениях параметров априорных распределени, когда нет возможности оценить эти параметры). Если объем выборки неограниченно возрастает, то эмпирическая псевдобайесовская оценка почти эквивалентна байесовской оценке, использующей точные значения параметров априорного распределения вектора . Это объясняется тем, что при больших объемах выборки значения оценок максимального правдоподобия мало отклоняются от истинных значений оцениваемых параметров. При больших объемах выборки неограниченно увеличивается, то можно доказать, что являются истинными значениями параметров априорного распределения величины к дисперсии ошибки оценивания. Для приемника максимального правдоподобия дисперсия ошибки оценивания определяется выражением (6.106). Поэтому для отношения сигнал/шум (на

Здесь определяется ф-лой (6.136). Можно воспользоваться соотношением (6.134) и выписать выражение для отношения сигнал/шум на выходе приемника, реализующего эмпирическую псевдобайесовскую оценку . Коэффициент определяется ф-лой (6.135). При больших объемах выборки можно получить приближенное аналитическое выражение, характеризующее выигрыш в точности оценивания при применении псевдобайесовской оценки по сравнению с оценкой максимального правдоподобия. Для этого достаточно воспользоваться приближенным соотношением (6.137).

Для рассмотренного здесь примера значение отношения сигнал/шум на выходе байесовского приемника превышает отношение сигнал/шум на выходе приемника максимального правдоподобия ровно в раз, причем обозначение и графиков для приведенных на рис. 6.10.

При построении математических моделей приходится сталкиваться со случаями, когда на выходные характеристики объекта исследования действует множество различных факторов и анализ литературных источников на позволяет отобрать наиболее значимые из них. В этих условиях с помощью опроса специалистов можно оценить значимость фактора и установить на основе этих оценок, следует ли тому или иному фактору собирать информацию. Материалы анкетного опроса могут оказаться полезными и при определении очередности введения переменных в математическую модель.

Используя различные способы организации анкетного опроса. В одном случае каждому опрашиваемому специалисту предлагается назвать неограниченное количество факторов, влияющих на исследуемый показатель, и оценить степень их влияния. В другом случае исследователь заранее составляет перечень факторов, а задача эксперта заключается в их ранжировании. Обычно более широко используется второй из указанных способов, при этом специалистам предоставляется возможность проранжировать включенные в набор факторы, а также включать дополнительные факторы, оказывающие влияние, по мнению эксперта, на показатель.

Если число факторов относительно невелико (10 - 15), то каждому эксперту предлагают проранжировать факторы в соответствии со степенью их влияния на функцию (моделируемый показатель). Опросная анкета в этом случае может иметь вид:

Опросная анкета

№ п/п	Наименование факторов	Размерность факторов	Ранг


...
n

Фактору, который, по мнению данного специалиста, оказывает наибольшее влияние на изучаемый процесс, присваивает ранг 1, следующему - ранг 2 и т.д.

При большом числе ранжируемых факторов последние объединяются в группы, и эксперт сначала ранжирует группы факторов, а на следующем этапе определяет место отдельных факторов внутри группы.

Анализ данных анкетного опроса начинается с составления анкеты, так называемой матрицы рангов (таблица 1).

Матрица рангов

Таблица 1

Факторы Опрашиваемые				. . .		. . .	n
	x 11	x 12	x 13	. . .	x 1j	. . .	x 1n
	x 21	x 22	x 23	. . .	x 2j	. . .	x 2n
	x 31	x 32	x 33	. . .	x 3j	. . .	x 3n
. . .
. . .
. . .
i	x i1	x i2	x i3	. . .	x ij	. . .	x in
. . .
. . .
. . .
m	x m1	x m2	x m3		x mj		x mn

В таблице 1 x ij - ранг j - го фактора и i - го исследователя; m - число исследователей, n - число факторов.

Если специалисту не удается различить по силе влияния некоторые факторы, то он вынужден приписывать им один и тот же ранговый номер. В этом случае вводится так называемые «связанные ранги». Например, трем факторам в анкете i - го специалиста присвоен ранг 3. Их ранговый номер в сводной анкете равен:

Если следующие два фактора в анкете i - го исследователя имели ранг 4 и 5, то в сводной анкете их ранг будет равен 6 и 7, т.е. происходит переформирование рангов.

Иногда в сводной анкете появляются дробные ранги. Например, если в анкете 8 и 9 фактору приписан ранг 8, то в сводной анкете их ранг будет 8,6. (Розанов, Френкель, 1969).

После заполнения сводной анкеты следует провести проверку. Для этого ищется контрольная сумма по строкам:

Когда есть уверенность, что матрица рангов составлена правильно, можно перейти к выявлению существенности влияния отобранных факторов на изучаемый показатель, с точки зрения опрошенных специалистов. Для этого в таблице 1 подсчитываются суммы всех отдельных столбцов. При этом:

Фактор, который с точки зрения специалистов, оказывает наибольшее влияние на изучаемый показатель, имеет наименьшую сумму рангов, а фактор, оказывающий самое слабое влияние - наибольшую сумму рангов.

Для того, чтобы полнее использовать информацию, содержащуюся в анкетах, после сводки результатов переходят к статистической их обработке. Анкета обычно содержит два рода сведений: основные - ответ эксперта о порядке расположения факторов и вспомогательные - характеристики самого опрашиваемого (должность, образование, профессиональный стаж и т.п.). Статистический анализ предполагает использование обеих групп сведений. При этом необходимо учитывать специфические особенности полученной информации. Значение ранга не является количественной оценкой фактора, а представляет собой лишь измерение по шкале порядка. Кроме того, при заполнении анкеты эксперт решает не ряд одномерных задач о месте каждого фактора, а одну многомерную задачу об относительном расположении всех факторов набора. Результаты оценки места отдельных факторов взаимозависимы. Коллективное мнение о порядке следования факторов может быть обоснованно установлено только при достаточно хорошей согласованности ответов опрашиваемых специалистов. Поэтому обработка результатов анкетного опроса обязательно включает оценку степени согласованности мнений экспертов и выяснение причин неоднородности.

На первом этапе исследования проверяют адекватность таблиц начальных и переформированных рангов. Эта проверка осуществляется в связи с тем, что дальнейшая работа проводится на переформированных рангах. Поэтому необходима их адекватность. Причина неадекватности:

а) неоднозначное понимание специалистами каждого фактора;

б) выбраны недостаточно квалифицированные специалисты.

Предположим, что m = 15, n = 12.

Адекватность перехода от рангов начальной таблицы к таблице переформированных рангов проверяют по коэффициенту ранговой кореляции

Спирмена:

где:

Ранги фактора для первой и второй таблиц соответственно.

Если коэффициент незначимо отличен от единицы, то это говорит о том, что матрица переформированных рангов адекватна матрице первоначальных рангов. Поэтому в дальнейшем с одинаковым правом можно использовать как первую, так и вторую таблицы, в зависимости от того, какая из них удобнее для применяемого в каждом конкретном случае метода. В случае, если значимо отличается от единицы, то это покажет, что при переформировании произошло изменение первоначальной информации, что совершенно недопустимо. Ранговый коэффициент кореляции может использоваться и в качестве меры близости ответов двух экспертов в случаях, когда используется строгая ранжировка факторов (число мест равно числу факторов). Он, по существу, является коэффициентом беспорядка.

Предположим, что ранги расположены в натуральном порядке 1,2, ... , n, и что соответствующие ранги образуют перестановку чисел 1,2, ... , n. Естественный метод изменения беспорядка - рангов, т.е. отклонения от порядка 1,2, ... , n, состоит в подсчете числа инверсий между ними. Например, при n = 4 в - ранжировке 3214 имеются три инверсии (3-2, 3-1, 2-1). Число таких инверсий, которое обозначается буквой V, может изменяться от 0 до 1/2 n(n-1), причем эти граничные значения достигаются на - ранжировках 1,2, ... , n и n, (n-1), ... , 1.

Таким образом, мы приходим к коэффициенту.

Распределение Т стремится к нормальному с нулевым средним и дисперсией:

Коэффициент и Т ассимптотически эквивалентны, коэффициент кореляции между ними убывает от 1 при n=2 до своего минимального значения 0,98 при n=5 и затем возрастает к 1 при .

Степень согласованности ответов всех опрошенных специалистов оценивают по коэффициенту конкордации . Для случая связанных рангов этот коэффициент вычисляется по формуле:

где:

где: t - число связанных рангов в каждой строке матрицы рангов.

Если мнения специалистов полностью совпадают, то коэффициент конкордации равен 1, если же они полностью не совпадают, то коэффициент равен 0. Значимость отличия от нуля можно проверить по - критерию (Фишера).

Получение статистически значимого коэффициента конкордации свидетельствует о неслучайном характере совпадения мнений специалистов, а его величина позволяет оценить степень этого совпадения.

Дальнейший анализ анкетных данных может производиться по методикам, описанным в (Розанов, Френкель, 1969; Розин, 1973, 1976).

Для получения обоснованного согласованного мнения группы экспертов относительно состава и степени значимости включаемых в рассмотрение факторов целесообразно1 использовать активно разрабатывающийся в настоящее время для целей прогнозирования будущего метод Дельфи. Потенциальные достоинства этого метода заключаются в предоставляемой специалистам возможности рассматривать возражения и предложения других членов экспертной группы в атмосфере, свободной от влияния личных качеств участников. С помощью метода Дельфи делается попытка эффективно использовать так называемое «информированное интуитивное суждение» специалиста-эксперта, путем совпадения таких условий, когда он сможет активно взаимодействовать с другими специалистами в этой области или в областях, касающихся прочих аспектов этой проблемы. При этом непосредственное общение специалистов друг с другом заменяется тщательно разработанной программой последовательных индивидуальных опросов, проводимых, как правило, с помощью анкет. Эти опросы чередуются с постоянным информированием специалистов о результатах предыдущего опроса. Весьма важно, что для проведения опросов с применением метода Дельфи могут быть использованы универсальные ЭВМ. Рассмотрим использование дельфийской процедуры для выделения факторов, существенно влияющих на показатели качества работы зерноуборочных комбайнов. Анализ литературных источников не позволил сделать однозначный отбор наиболее существенных факторов для первоначального включения в математическую модель и составления плана эксперимента. Учитывая значительную трудоемкость (не испытаниях 5 комбайнов бывает занято до 50 человек в день) и высокую стоимость проведения отсеивающих экспериментов, возможное влияние на функцию (показатели качества работы) большого числа природных факторов, что затрудняло постановку адекватных сравнительных экспериментов, был проведен анкетный опрос специалистов относительно состава и степени значимости факторов.

При отборе специалистов, помимо объективных характеристик (должность, стаж работы, образование и т.п.) учитывалась также даваемая ими оценка собственной компетентности по интересующему нас вопросу (по 10-бальной шкале).

После составления анкеты (см. Форма 1), в которой перечислялись все выявленные факторы, каждому из членов экспертной группы было предложено проранжировать факторы по степени значимости и ответить на вопрос, как сказывается изменение величины фактора на функции (увеличивает или уменьшает значение функции, в каких пределах изменения оказывают наиболее заметное влияние).

Затем производилась обработка результатов опроса (определялись и проставлялись в анкетах 2-го тура средний, максимальный и минимальный ранги факторов среди всех опрошенных), и экспертов просили пересмотреть и при желании исправить свои предыдущие ответы. Если новый ответ какого-либо эксперта значительно отличался от среднего ранга фактора (не попадал в интервал, расположенный между 25% самых «низких» и 25% самых «высоких» оценок), то этого специалиста просили объяснить причины отклонения его ответа мнения большинства, уточнить условия, при которых, по его мнению, влияние указанного фактора наиболее (наименее) значимо. Подобная система опросов давала возможность тем специалистам, у кого не было твердой уверенности , помещать свои ответы вблизи среднего значения ранга фактора.

Результаты обработки анкет второго тура вновь сообщались членам экспертной группы. Кроме того, им направлялся краткий перечень объяснений, представленных в защиту сильно отличающихся между собой ответов. Затем всех просили вновь провести ранжирование с учетом представленных объяснений причин отклонения мнения некоторых экспертов от мнения большинства. При этих условиях каждый эксперт независимо от направления его специализации (в экспертизе участвовали агрономы, инженеры и комбайнеры) вынужден был учитывать многие аспекты проблемы, на которые он мог бы не обратить внимания, если бы работал в одиночку.

Опросная анкета

Как показали проведенные исследования, при использовании такого метода опроса наблюдалась сходимость мнений экспертов к относительно узкому интервалу значений см. табл. 2,3). В случае, если такой сходимости нет, то это может указывать на недостаточную изученность исследуемого явления, на наличие разных научных подходов к данному вопросу, различную интерпретацию данных и др.

Таким образом, применение метода Дельфи и возможных его модификаций оказывается весьма полезным на стадии априорного анализа объекта исследования. Однако, при этом возникает ряд проблем. Как объективно и количественно оценить степень сходимости мнения экспертов при проведении нескольких туров опросов? Как выделить отдельно группировки специалистов и, возможно, выявить причины образования таких группировок (специализация, место работы, стаж и т.п.)? На каком этапе следует прекратить дальнейшие опросы?

Хотя на некоторые из этих вопросов можно ответить, проведя анализ ранжирования методами ранговой кореляции, представляется более наглядным и удобным в смысле простоты вычислительных алгоритмов другое направление решения указанных задач.

Тур 1

Таблица 2

Номер/	Эксперты	Диапазон изменения
наименование			ранга фактора
			3-14
			2-17
			5-14
			3-13
			4-15
			1-5
			1-3
			4-18
			3-17
			1-6
			3-10
			5-16
			9-18
			10-18
			11-18
			6-17
			14-18
			7-18

Тур 2

Таблица 2

Номер/ Наименование	Эксперты	Средний ранг после 1 тура	Диапазон изменения ранга
фактора				фактора
				4-8
				6-13
				8-12
				3-6
				6-11

				1-3
				9-15
				6-16
				1-4
				4-7
				5-17
				10-18
				13-16
				15-17
				10-16
				17-18
				11-18

Пусть имеется m ранжирований n факторов. Представим каждое из них в виде матриц упорядочения, например, и , элементы которых определяются следующим образом:

Очевидно, что расстояние (Кемени, Снелл, 1972).

характеризует степень рассогласования между ранжированиями Z и T. Тогда в матрице , которую назовем матрицей рассогласования, будут представлены все между ранжированиями (Хубаев, 1973).

Д - симметричная положительная матрица с нулевыми диагональными элементами, поскольку

Сумма элементов i-ой строки матрицы Д характеризует степень рассогласования i-го эксперта с остальными. Матрица Д может быть преобразована в матрицу

Сравнением сумм элементов матрицы Д можно количественно оценить степень сходимости мнений специалистов при проведении нескольких туров опросов. Таксономический анализ матрицы Д (Д’) позволяет выделить согласованные группы среди экспертов.

В таблицах 4 и 5 матрицы рассогласования, полученные после машинной обработки анкет первого и второго туров опросов экспертов относительно степени влияния факторов на один из показателей качества работы зерноуборочных комбайнов (дробление зерна).

Как видно из таблиц, общая величина рассогласования после второго тура уменьшилась более, чем в 1,5 раза (рассогласование между средними рангами после 1 и 2 туров равно 64).

Опросы прекращаются, когда величина рассогласования стабилизируется. Обычно это достигается после 2-3 тура опросов.

На следующем этапе матрицу рассогласования необходимо разбить на однородные группы одним из алгоритмов таксономии. В результате таксономического анализа матрицы рассогласования может возникнуть одна из следующих ситуаций (Розин, 1973, 1976):

а) ответы большинства экспертов образуют однородную группу, причем состав групп остается стабильным при различных разбиениях. Отдельные эксперты с резко отличающимся мнением образуют единичные или малочисленные таксоны;

б) в процессе разбиений помимо единичных таксонов выделяется несколько стабильных, четко организованных групп;

в) на разных шагах разбиения образуются нестабильные группы, ответы экспертов приблизительно равномерно рассеяны в пространстве факторов.

В первом случае имеется хорошая согласованность ответов большинства экспертов. Выделенная однородная группа ответов может приниматься за эталон, на ее основе производится упорядочение факторов в соответствии с коллективным мнением . Вторая ситуация позволяет выдвинуть гипотезу о неоднородности коллектива экспертов. В этом случае задача заключается в выявлении набора объективных характеристик экспертов, обуславливающих эту неоднородность, и построении упорядоченной последовательности факторов для каждой выделенной группы экспертов . Появление третьей ситуации - равномерного рассеяния точек - ответов по всему факторному пространству - означает, что, либо неудачно выбран набор факторов в анкете, либо существенно неоднороден и некомпетентен коллектив экспертов, либо и то и другое вместе. В этом случае возможны два решения: переработать анкеты и повторить опрос, или же ранжировать только те факторы, по которым имеется достаточно высокая согласованность мнений экспертов.

В заключение отметим, что применение экспертных методов часто оказывается единственно возможным способом уменьшения размерности пространства факторов. Например, при оптимизации режимов работы зерноуборочной техники в составленный на основании анализа протоколов испытаний машин список было включено более 30 различных факторов: состояние хлебостоя, влажность зерна, соломы, воздуха, параметры технологических регулировок и ряд других. Естественно, возникла необходимость сократить этот список факторов, выделив наиболее значимые из них.

На первый взгляд, эта задача не представляет особых трудностей. На МИСах 80 «Сельхозтехника» ежегодно в соответствии с утвержденным планом проводятся испытания сельскохозяйственных машин и тракторов. За годы испытаний по всем зерноуборочным комбайнам накоплена обширная информация, содержащая данные по тысячам опытов. Естественно, что, имея такую матрицу наблюдений и воспользовавшись стандартными программами статистического анализа, можно легко выделить значимые факторы, чтобы затем, если они окажутся управляемыми, построив математическую модель, активно воздействовать на эффективность использования зерноуборочной техники.

Однако при тщательном анализе матрицы исходных данных обнаружилось, что в ней имеется много выпавших наблюдений (в строчках матрицы исходных данных отсутствовали значения одного или нескольких факторов). Такое положение вынуждало исключать из рассмотрения опыты, в которых отсутствовало значение хотя бы одного из факторов.1 В результате в матрице исходных данных осталось лишь несколько строк.

Таким образом, поскольку число опытов получилось значительно меньше числа факторов, общие статистические методы набора существенных факторов, основанные на анализе матрицы наблюдений, оказались здесь непригодными. Поэтому возникла необходимость уменьшить число включаемых в рассмотрение факторов с тем, чтобы, вновь обратившись к протоколам испытаний, попытаться расширить матрицу наблюдений.

Анализ литературных источников не позволил сделать однозначный отбор наиболее существенных факторов, поскольку в опубликованных работах специалистами высказывались различные, а порой и противоречивые суждения о степени влияния того или иного фактора на показатели качества работы зерноуборочной техники. В сложившейся ситуации было принято решение провести анкетный опрос специалистов (инженеров, агрономов, комбайнеров) с использованием описанной выше дельфийской процедуры. В результате априорного анализа объекта исследования удалось отобрать небольшую группу наиболее существенных факторов, расширить матрицу наблюдений (естественно, что для меньшего числа факторов заполненных строк в матрице оказалось больше) и, использовав стандартные процедуры регрессионного анализа (см. ниже), количественно оценить значимость выделенных факторов и характер их взаимосвязи и построить уравнения, описывающие исследуемый процесс с высокой точностью.

Тема 5: Регрессионные модели в технико-экономических исследованиях

Задачи анализа и моделирования экономических процессов с использованием вероятностных методов, этапы разработки регрессионной модели, выделение значимых факторов для включения в модель.

Похожая информация.

Бухгалтеру о налогах и кадрах. Налоги, бухгалтерия, отчетность, ККМ

Априорная и апостериорная оценка качества прогноза.

1.6 Априорная и апостериорная оценка точности обсервации.

1.6.1 Правило переноса погрешностей

1.6.2 Априорная оценка точности обсервации