СТАТИСТИЧЕСКИЕ МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСТРЕМАЛЬНЫХ ЭКСПЕРИМЕНТОВ

СТАТИСТИЧЕСКИЕ МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСТРЕМАЛЬНЫХ ЭКСПЕРИМЕНТОВ


6_statistyczne-met200.gif

   увеличить

Фрагменты из книги

Предисловие

В последнее время стало возможным говорить о появлении новой научной дисциплины – математической теории эксперимента. Одним из разделов этой дисциплины является планирование экстремальных экспериментов. Это, по-видимому, наиболее важный в практическом отношении раздел математической теории эксперимента. Большинство научных и инженерно-технических работников отраслевых научно-исследовательских институтов и заводских лабораторий занято решением экстремальных задач, направленных на отыскание оптимальных условий протекания сложных процессов или на выбор оптимального состава многокомпонентных систем.

В монографии, предлагаемой вниманию читателей, мы попытались дать систематическое и по возможности обобщенное изложение тех новых идей и методов, которые стали интенсивно разрабатываться в течение последних десяти лет. Книга написана так, чтобы она могла служить настольным руководством для экспериментатора. При изложении материала широко использовался тот опыт, который был накоплен математическими группами в Гиредмете и на кафедре неорганической химии МГУ, а также опыт чтения лекций на химфаке МГУ и на курсах по математической переквалификации химиков при Госхимкомитете. Мы взяли на себя смелость изложить в книге и те совсем новые идеи, которые стали обсуждаться в периодической печати только в течение последних одного-двух лет. Это неизбежно привело к тому, что не все разделы книги удалось изложить с одинаковой степенью отчетливости.

Книга рассчитана на читателя, имеющего несколько повышенную математическую подготовку. Предполагается, что он знаком не только с элементами математического анализа и аналитической геометрией, но также и с численными методами анализа, матричной алгеброй и многомерной геометрией, теорией вероятностей и математической статистикой – особенно с таким ее разделом, как дисперсионный анализ.

В приложении дана краткая сводка элементарных сведений их линейной алгебры – она может служить справочником, облегчающим чтение книги. Специальные математические вопросы выделены в отдельную главу (гл. 10); читатель может пропустить ее, если он не заинтересован в строгом математическом рассмотрении некоторых из наиболее сложных вопросов, связанных с планированием эксперимента.

Считаем своим долгом вынести глубокую благодарность Ю.В.Грановскому и Ю.П.Адлеру – ими написана глава 9 для этой книги, составлена библиография по прикладным работам, а также даны ценные замечания по ряду других разделов. Ю.П.Адлером написан также § 2 в гл. 11. Мы также благодарим сотрудников математической группы Гиредмета Г.Н.Веселую, И.М.Герман и Р.И.Слободчикову за большую помощь при работе над корректурой.

Авторы

Введение

Постановка задачи

Многие исследования, проводимые в физике, химии и металлургии, сводятся к решению экстремальных задач, направленных на отыскание оптимальных условий протекания процессов или на оптимальный выбор состава многокомпонентных систем. Например, при разработке новых химико-технологических процессов задача исследования часто формулируется так: нужно получить максимально возможный выход реакции, варьируя температуру, давление и соотношение реагентов. В металлургии одной из типичных задач является выбор соотношения легирующих компонент для получения сплава с максимальным значением какой-либо интересующей исследователя характеристики – ударной вязкости, коррозионной устойчивости и пр. С аналогичными многофакторными экстремальными задачами приходится сталкиваться и в технической физике – при получении сверхчистых металлов, изготовлении сложных приборов или при выборе оптимальных условий протекания процессов. Часто такие задачи формулируются как задачи на условный экстремум: нужно найти условия, обеспечивающие максимальный выход продукта при заданном уровне чистоты и пр.

Существуют два различных подхода к решению задач подобного рода. Можно потребовать, чтобы решению экстремальных задач предшествовало всестороннее исследование как механизма процесса, так и свойств вещества. Основываясь на результатах такого исследования, можно создать теорию процесса, с помощью которой будут решаться все экстремальные задачи. Опыт показывает, что подход такого рода сравнительно редко применяется при решении технических задач. Как правило, системы, подлежащие оптимизации, оказываются столь сложными, что не поддаются теоретическому изучению в разумные сроки. В большинстве случаев экстремальные задачи решаются экспериментально, при неполном знании механизма явлений.

Методы эмпирического поиска оптимальных условий протекания процессов долгое время оставались неформализованными.

Экспериментатор выбирал тот или иной путь исследования, базируясь только на своем опыте и интуиции. Лишь совсем недавно, на протяжении последних десяти лет, стала развиваться математическая теория экстремальных экспериментов, позволяющая выбирать оптимальную стратегию исследования при неполном знании процесса. Эффективность нового метода исследований тем выше, чем сложнее изучаемая система. Существенным здесь является также то, что при новом подходе к решению экстремальных задач исследователь получает математическую модель процесса. Эта модель может быть использована при переходе к автоматическому управлению.

На математическом языке задача формулируется следующим образом: нужно получить некоторое представление о функции отклика

η = φ (x1, x2, ..., xk),

где η – параметр процесса, подлежащий оптимизации, x1, x2, ..., xk – независимые переменные, которые можно варьировать при постановке экспериментов.

Назовем переменные x1, x2, ..., xk факторами, а координатное пространство с координатами x1, x2, ..., xkфакторным пространством. Геометрический образ, соответствующий функции отклика, назовем поверхностью отклика.

Будем рассматривать самый общий случай, когда исследование поверхности отклика ведется при неполном знании механизма изучаемых явлений. Естественно считать, что в этом случае аналитическое выражение функции отклика неизвестно. Поэтому приходится ограничиваться представлением её полиномом

1.gif

с коэффициентами регрессии βo, βi, βij,βii, ... Разложение функции в степенной ряд эквивалентно представлению ее рядом Тейлора:

2.gif

Пользуясь результатами эксперимента, можно определить только выборочные коэффициенты регрессии bo, bi, bij, bii, которые являются лишь оценками для теоретических коэффициентов регрессии[1] βo, βi, βij,βii,. Уравнение регрессии, полученное на основании опыта, запишется так:

3.gif

где y.gif – значение выхода, предсказанное уравнением (y.gif – выборочная оценка для η).

Еще Ньютон умел представлять функции степенными рядами, а Гаусс предложил метод наименьших квадратов для оценки коэффициентов регрессии по результатам наблюдений. Но только за последние годы была создана последовательная и достаточно строгая теория регрессионного анализа, базирующаяся на современных теоретико-вероятностных представлениях [194]. Эта теория позволила значительно глубже понять и оценить результаты, получаемые методом наименьших квадратов.

Классический регрессионный анализ базируется на обработке результатов так называемых «пассивных экспериментов». Предполагается, что исследователь ведет наблюдение за некоторым неуправляемым спонтанно изменяющимся процессом (типичная ситуация: астроном – галактика) или ставит эксперименты каким-то произвольным образом, выбирая экспериментальные точки в факторном пространстве, основываясь на интуиции или на каких-либо случайных, привходящих обстоятельствах (удобство экспериментирования в данной ситуации).

Опыт показал, что классический регрессионный анализ, несмотря на хорошо разработанную теорию, не нашел сколько-нибудь широкого применения для решения экстремальных задач в физике, химии и металлургии. При решении подобного рода задач приходится иметь дело с очень большим числом независимых переменных. В этом случае метод становится крайне громоздким. Здесь возникают практически непреодолимые трудности, связанные, с одной стороны, с необходимостью ставить очень большое количество экспериментов, с другой стороны – трудности, связанные с интерпретацией уравнения регрессии (все коэффициенты регрессии оказываются корреляционно связанными между собой).

В самое последнее время специалисты по автоматизации делали попытки вернуться к классическому регрессионному анализу для математического описания сложных химических процессов по результатам пассивного наблюдения за работой действующих цехов. Однако в литературе не появилось публикаций, подтверждающих эффективность такого подхода к математическому моделированию достаточно сложных процессов. Исходя из общетеоретических представлений, легко показать бесперспективность такого подхода к решению экстремальных задач в химии, металлургии и технической физике.

Существенно новые возможности открылись после того, как в регрессионный анализ были привнесены идеи планирования эксперимента. Планирование эксперимента было предложено Р.Фишером в тридцатых годах для решения агробиологических задач. Фишер положил начало новому разделу математической статистики – дисперсионному анализу, позволяющему оценивать вклад, вносимый отдельными факторами в суммарную дисперсию. Позднее, особенно после второй мировой войны, планирование эксперимента стало применяться в химии, технической физике и металлургии для решения широкого круга задач. Дисперсионный и регрессионный анализы, базирующиеся на планировании эксперимента, переплелись весьма сложным образом, и сейчас трудно провести четкую границу между этими разделами математической статистики.

Планирование эксперимента – это новый подход к исследованию, в котором математическим методам отводится активная роль. Основываясь на априорных сведениях об изучаемом процессе, исследователь выбирает некоторую оптимальную стратегию для управления экспериментом. Процесс исследования обычно разбивается на отдельные этапы. После каждого этапа исследователь получает новую информацию, позволяющую ему изменять стратегию исследования.

На математическом языке задача планирования эксперимента формулируется так: на каждом этапе исследования нужно выбрать оптимальное, в некотором смысле, расположение точек в факторном пространстве, для того чтобы получить некоторое представление о поверхности отклика. Выбор критерия оптимальности в значительной степени произволен. Здесь приходится учитывать как постановку задачи экспериментатором, так и ту реальную ситуацию, в которой приходится решать данную задачу. При постановке экстремальных экспериментов естественно на первом этапе исследования задачу формулировать так: нужно найти направление движения к той области, где условия протекания процесса оптимальны. Для решения этой задачи достаточно исследовать поверхность отклика на небольшом участке, ограничиваясь линейным приближением. Иначе формулируется задача после достижения той области, где находится оптимум. Здесь исследователю нужно получить значительно более полное представление о поверхности отклика, аппроксимируя ее полиномами второго, а иногда даже и третьего порядка. Во многих случаях исследования приходится начинать с постановки так называемых отсеивающих экспериментов, цель которых – выделить доминирующие эффекты среди очень большого числа потенциально возможных. Совсем особые требования возникают при постановке экспериментов в производственных условиях; здесь нужно суметь выделить интересующие исследователя эффекты при очень высоком уровне помех, в условиях, когда независимые переменные можно варьировать лишь в узком интервале.

Опыт показывает, что успех нового подхода к решению экстремальных задач в значительной степени зависит от того, насколько хорошо удалось сформулировать критерий оптимальности планирования для решения того или иного класса задач. Формулировка критерия оптимальности всегда должна находиться в хорошем согласии с интуитивными представлениями исследователя. По-видимому, нельзя построить некоторой общей универсальной системы критериев оптимальности.

В настоящее время имеется ряд хорошо сформулированных критериев оптимального планирования для различных ситуаций и для них разработаны алгоритмы, пользуясь которыми исследователь может располагать экспериментальные точки в факторном пространстве и производить обработку результатов наблюдений. Опыт показал, что, пользуясь такими методами, можно находить математическое описание для очень сложных и малоизученных систем. При этом, правда, повышаются требования к технике эксперимента: в ряде случаев возникает необходимость в создании управляемых («пилотных») установок, на которых легко можно реализовать заранее разработанные схемы планирования эксперимента и получать достаточно воспроизводимые результаты.

Основная идея нового метода – возможность оптимального управления экспериментом при неполном знании – родственна тем предпосылкам, на которых базируется кибернетика. Появление кибернетики – науки об управлении, включающей рассмотрение и таких сложных объектов как биологическая система, — стало возможным лишь после того, как было понято, что возможно оптимальное управление при неполном знании.



[1] Здесь имеются в виду те коэффициенты регрессии, которые можно было бы получать для некоторой гипотетической генеральной совокупности, состоящей из всех мыслимых опытов. Согласно существующей традиции параметры генеральной совокупности обозначают греческими буквами, их выборочные оценки – латинскими буквами.



Назад в раздел