ТЕОРИЯ ЭКСПЕРИМЕНТА

ТЕОРИЯ ЭКСПЕРИМЕНТА


 7_theorie200.gif

     увеличить

ФРАГМЕНТЫ ИЗ КНИГИ

Предисловие

Экспериментатор с некоторым беспокойством воспринимает то все увеличивающееся давление, которое оказывает на него математическая статистика. Под ее влиянием изменились методы анализа, оценки и представления результатов наблюдений. Во многих областях знаний сейчас уже явно неприлично представлять для опубликования экспериментальную работу, игнорируя статистические методы анализа данных. Выводы, сделанные в такой работе, будут восприниматься с недоверием. Редакции некоторых журналов просто не примут такую работу для опубликования. Под влиянием математической статистики стала изменяться и сама стратегия эксперимента. Появился новый раздел математической статистики: планирование эксперимента. Теперь стало возможным говорить о возникновении математической теории эксперимента или, точнее, о теории экспериментальных исследований, базирующейся на математической статистике. Почему же все это вызывает беспокойство у экспериментатора? Почему математическая теория эксперимента не преподается экспериментатору? Почему с планированием эксперимента знакомы лишь отдельные экспериментаторы?

На эти вопросы легко ответить. Все дело в том, что математическая статистика или, точнее, ее теоретические основы развиваются, как правило, математиками, совсем плохо знающими эксперимент. Их логические концепции часто оказываются мало понятными экспериментатору. Сложный, вполне современный математический аппарат, делающий задачи статистики столь привлекательными для математиков, часто только отпугивает экспериментаторов. С позиций экспериментатора нередко наиболее важными и интересными оказываются те аспекты математической статистики, которые с позиций математика кажутся совсем второстепенными. Математики, занимающиеся разработкой математической статистики, подчас бывают совсем мало озабочены возможностью практического применения их идей и методов.

Цель этой книги посмотреть глазами экспериментатора на развитие математической статистики и особенно на развитие работ по планированию эксперимента. Нам представляется, что экспериментатору нужно знать то принципиально новое, что внесла математическая статистика в методологию, или, если хотите, даже в философию эксперимента. С позиций экспериментатора нам хочется посмотреть на логическое развитие идей математической статистики.

При изложении материала мы обращали особое внимание на основные концепции, опуская трудные для понимания строгие математические обоснования и избегая рецептурного изложения, столь загромождающего многие руководства. Нам представляется, что экспериментатору, прежде всего, нужно хорошо понимать идейную сторону математической теории эксперимента. Можно надеяться, что затем в своей повседневной работе он сможет постоянно обращаться за советом к немногочисленным пока еще в нашей стране специалистам нового профиля – консультантам по методологическим вопросам математической статистики. Естественно, что ему придется также широко использовать различного рода специализированные руководства и справочники, в том числе и руководства рецептурного характера. Сейчас уже совершенно невозможно написать обстоятельное всеобъемлющее руководство по математической статистике.

Эту небольшую книгу, если угодно, можно рассматривать и как путеводитель по тем идеям математической статистики, которые представляют интерес для экспериментатора. Если что-либо особенно заинтересует читателя, то в обширной библиографии, приведенной в конце книги, он найдет руководства, к которым следует обратиться для более обстоятельного изучения. Автор просит читателя быть снисходительным в своих суждениях об его книге, поскольку эта первая в мировой литературе попытка составить путеводитель такого типа.

Книга была задумана как популярная, но автор отнесся к ней вполне серьезно. В ней сделана попытка изложить те мысли, которые возникли в результате последних десяти лет, когда автор работал как профессионал-статистик. В ней нашли отражения и те дискуссии, которые приходилось вести со своими коллегами, как отечественными, так и зарубежными. Мне кажется, что экспериментатор, занимаясь применением математической статистики, должен знать не только ее фасад, который выглядит вполне респектабельно, но и то, что находится за ним.

Книга рассчитана на читателей, знакомых с элементами теории вероятностей и математической статистики и имеющих некоторое представление о линейной алгебре. Чтобы не загромождать книгу, автор не касается здесь такого фундаментального раздела математической статистики, как учение о функциях распределения, поскольку он достаточно подробно изложен во множестве руководств, написанных на различном уровне строгости. Малоподготовленному читателю мы рекомендуем предварительно проработать совсем маленькую, но хорошо написанную книжечку Б.В.Гензденко «Разговор о математической статистике» (изд. «Знание», 1969). Наиболее трудным оказался § 4 гл. III «Изучение процессов, протекающих во времени». При первом чтении этот параграф можно опустить.

Хотелось бы надеяться, что материал, изложенный в книге, послужит в дальнейшем и основой для преподавания теории эксперимента всем экспериментаторам.

Глава 1
Изучение плохо организованных систем – задача математической статистики и кибернетики

§ 1. Что такое плохо организованная система

По-видимому, одно из самых примечательных явлений, наблюдающихся сейчас в науке, – это стремление прейти от изучения хорошо организованных систем к плохо организованным – диффузным – системам или, пользуясь терминологией Ньюэлла и Саймона [1], перейти к изучению задач с плохой структурой. Со времен Ньютона и до начала XX-го века точные науки стремились иметь дело с хорошо организованными системами, в которых можно было выделить явления или процессы одной физической природы, зависящие от совсем небольшого числа переменных. Результаты исследований можно было представить хорошо интерпретируемыми функциональными связями, которым приписывалась роль неких абсолютных законов. В течение более чем 200 лет экспериментаторам внушали, что единственно правильной является методология однофакторного эксперимента. Предполагалось, что исследователь мог с любой степенью точности стабилизировать все независимые переменные (факторы) своей системы. Затем, поочередно варьируя некоторые из них, он устанавливал интересующие его зависимости. Лишь в начале XX-го века математическая статистика стала делать первые шаги по изучению плохо организованных – диффузных – систем, в которых нельзя четко выделить отдельные явления. В этих системах нельзя установить непроницаемые перегородки, разграничивающие действие переменных различной физической природы. Такие системы иногда называют также большими системами, поскольку здесь надо учитывать действие очень многих разнородных факторов, задающих по своей природе, но тесно взаимодействующие друг с другом процессы. Наверное, почти любой технологический процесс может рассматриваться как пример такой плохо организованной системы. Известно, например, что в химико-технологических процессах надо одновременно учитывать такие не поддающиеся в реальных условиях разграничению процессы, как теплопередача, аэродинамические и гидродинамические процессы, а также кинетику множества одновременно протекающих реакций. Примером плохо организованной системы может служить хорошо известный процесс эмиссионного спектрального анализа.

Рассмотрим этот процесс несколько подробнее. Между двумя электродами подается высокое напряжение – возникает искровой разряд, спектр которого несет информацию о химическом составе электродов. На электродах и в межэлектродном промежутке происходят сложные процессы. В момент пробоя возникает нитевой разряд с температурой в несколько десятков тысяч градусов. При этом на отдельные участки электродов подается энергия с колоссальной плотностью. Возникает взрывное испарение, которое затем переходит в равновесное. Между электродами образуется облако из вещества электродов, в котором происходят процессы диффузии, возбуждения и излучения. Одновременно на поверхности электродов возникают избирательные окислительно-восстановительные процессы, а в их толще – диффузия элементов, зависящая от температурного градиента, фазового состава электродов, дефектов решетки и пр. Все эти явления носят периодический характер, соответствующий периоду колебания напряжения. На периодическую составляющую накладывается временной дрейф, связанный с эрозией электродов. Чтобы количественно описать все эти явления, надо привлекать чуть ли не все разделы физики и химии: спектроскопию, статистическую физику, физику твердого тела, физическую химию. В одном из своих выступлений Г.С.Ландсберг, один из основателей отечественной спектроскопии, обратил внимание не следующий исторический курьез: в 1910 г., на заре эмиссионного спектрального анализа, один из крупных немецких физиков утверждал, что количественным эмиссионным спектральным анализом нельзя управлять, так как нельзя стабилизировать столь большое число переменных. В 1928 г. уже другой немецкий ученый писал, что спектральный анализ, по-видимому, возможен, но непонятно почему.

Спектральный анализ действительно оказался возможным, но его результаты до сих пор остаются не очень надежными, зависящими от многих факторов, природа которых часто до конца не известна. Большинство факторов все же удалось стабилизировать в такой степени, что они стали давать вклады примерно одного порядка в суммарную ошибку. Проблема повышения надежности и универсальности эмиссионного анализа, тем не менее, не была снята с рассмотрения. Ее пытались изучать традиционными методами – так, как физики привыкли изучать хорошо организованные системы. Десятилетия были потрачены на исследование физических основ эмиссионного спектрального анализа. Были написаны сотни статей и много интеллектуальной крови было пролито в попытке доказать, что какой-либо один из физических процессов имеет доминирующее значение. Результат оказался печальным. Пользуясь традиционными методами, не удалось построить количественной теории. Описывающей поведение этой системы и предсказывающей поведение ее при переходе от одного комплекта эталонных проб к другому, хотя совершенно ясно, что в ней протекают только такие процессы, которые, будучи взяты в отдельности, хорошо известны физикам и химикам. Система была слишком диффузной – здесь оказалось невозможным разграничить различные по своей природе явления.

С еще большими трудностями пришлось столкнуться при попытке изучать такие диффузные системы, для которых неизвестны протекающие в них элементарные процессы. Примером такой системы служит, например, интеллект человека.

§ 2. Гносеологические проблемы, возникающие при изучении плохо организованных систем

Можно указать на два существенно различных подхода к изучению плохо организованных систем, четко выкристаллизовавшихся за последние десятилетия. Первый подход – использование идей и методов многомерной математической статистики. Это направление начало развиваться в 20–30 годах нашего века, его возникновение связано в значительной степени с именем английского ученого Фишера. Многомерная математическая статистика – это, по существу, просто хорошо логически обоснованная формализация эмпирических методов изучения диффузных систем, применяемых тогда, когда исследователь сознательно хочет отказаться от детального изучения механизма всех явлений, протекающих в системе. Например, в рассмотренной выше задаче эмиссионного спектрального анализа можно отказаться от четкого разграничения всех сложным образом переплетенных физических и химических процессов. К задаче можно подойти чисто эмпирически – варьируя одновременно возможно большее число переменных, пытаться найти оптимальные в каком-то смысле условия протекания процесса. Тогда немедленно возникнут такие проблемы:

как выбрать оптимальную стратегию эксперимента,
как обработать результаты наблюдений,
как принимать обоснованные решения?

Это типичные задачи математической статистики. Развитие многомерной математической статистики существенно связано с развитием электронной вычислительной техники, что иллюстрируется данными, приведенными в табл. 1.1. Мы видим, как на Ротамстедской агробиологической станции (Великобритания) после появления ЭВМ начинает расти число многомерных задач. Второй скачек в росте происходит в 1965 г., когда в распоряжении станции оказывается новая, более мощная машина. Сейчас уже становится реальностью решение задач с числом независимых переменных, близким к ста.

Таблица 1.1.
Рост числа экспериментов м повторениями, анализировавшихся в статистическом отделе Ротамстедской агробиологической станции [2]

Годы

Число экспериментов, обработанных

Число независимых переменных, приходящихся

вручную

на ЭВМ

1934

1951

1955

1957

1959

1961

1963

1964

1965

115

437

384

98

67

89

72

88

69

419

1253

2649

2862

2770

3383

4151

2,9

4,0

4,2

5,3

5,2

5,3

6,0

Второй подход к изучению диффузных систем – чисто логический анализ процесса управления ими. Здесь мы уже имеем дело с кибернетическим подходом – его возникновение связано с именем Н.Винера. Естественно, что как только возникло представление о плохо организованных системах как самостоятельных структурах, подлежащих изучению, так срезу стал вопрос об исследовании процесса управления ими, ибо этот процесс является существенным элементом самого понятия диффузной системы. Было бы бессмысленно ставить вопрос об изучении процессов управления в традиционной физике, имеющей дело с хорошо организованными системами. В таких системах все однозначно управляется действующими в них функциональными связями – например, движение планет управляется законами Кеплера.

Нужно подчеркнуть, что два подхода – статистический и кибернетический – существенно различны, хотя объект изучения один – плохо организованные системы. Нередко мы можем видеть, как одна и та же система изучается одновременно и совершенно независимо двумя методами. Например, интеллектуальная деятельность человека изучается, с одной стороны, методами так называемого факторного анализа, являющегося одним из приемов многомерного статистического анализа. Многие психологи и статистики уверены, что с помощью этого метода удастся разобраться в результатах множества тестовых испытаний. С другой стороны, интеллектуальная деятельность человека изучается путем создания искусственного интеллекта, т.е. путем построения программ для ЭВМ, имитирующих деятельность человека. Такие программы создаются на основании логического анализа поведения человека в процессе решения им интеллектуальных задач [1, 3].

Переход от изучения хорошо организованных систем к изучению плохо организованных, диффузных систем, естественно, оказал влияние на общеметодологические концепции науки. Стали изменяться некоторые гносеологические представления, задающие понятие истинности и ложности в научных построениях и выводах. Здесь мы будем говорить о гносеологии не как о некоторой философской науке, а как о системе взглядов, которой пользуются научные работники в своей повседневной работе. Эта система, может быть, никогда четко не сформулированная, постепенно изменяется, частот малозаметным образом для людей одного поколения. Сейчас интересно попробовать проанализировать те изменения, которые наметились за последнее время в связи со стремлением изучать и описывать поведение диффузных систем. Мы видим, прежде всего, как изменяются требования, предъявляемые к математическому описанию наблюдаемых явлений. Понятие закона в науке заменяется более широким, хотя и очень расплывчатым понятием модели. Изменилась в связи с этим и сама система построения научных выводов. Стало меняться отношение к тому, что допустимо и что недопустимо в науке. Этот процесс еще далеко не закончился – быть может, он только начался. Более того, сейчас наряду с учеными нового направления, занимающимися изучением плохо организованных систем, и таких ученых большинство. Много досадных недоразумений возникает, когда работы, выполненные с позиций статистических или кибернетических, обсуждаются учеными другого направления.

§ 3. Модель вместо закона

Модель – это весьма многозначное понятие. Чжао Юань-Жень в статье «Модели в лингвистике и модели вообще» [4] приводит «список 30 синонимов, или характеристик, «модели» и 9 несинонимов, или понятий, противопоставляемых модели[1]. Мы видим, что слова, синонимичные с одним и тем же словом, не всегда синонимичны между собой, а иногда одно и то же слово даже не синонимично самому себе». Вряд ли тут стоит давать скрупулезное определение понятие модели. Читатель получит ясное представление о нем из рассматриваемых ниже примеров. Нам хочется обратить здесь внимание лишь на то, что понятию математической модели, существующему сейчас в кибернетике, можно противопоставить понятие закона в науке. Такое противопоставление потребовалось, когда пришлось снизить требования, предъявляемые к математическому описанию наблюдаемых явлений. Закон в науке имеет характер некоторой абсолютной категории на данном уровне знаний. Он может быть либо безусловно верен, либо безусловно неверен, и тогда просто отвергается. Нельзя говорить о хороших и плохих законах – такое утверждение просто лишено смысла. Точно так же нельзя говорить о том, что одно и то же явление можно объяснить двумя или несколькими слегка различными законами. Если в точных науках иногда и проявлялся дуализм, например в концепции корпускула–волна, то он всегда вызывал чрезвычайную озабоченность, и, в конце концов, выяснилось, что какая-то одна сторона наблюденного явления однозначно описывается одними закономерностями, другая – другими. В методологии научных исследований не рассматривался специально вопрос о том, как проверить истинность закона в науке, но всегда предполагалось, что такую проверку можно осуществить достаточно точно и так, чтобы результаты можно было однозначно интерпретировать по крайней мере на некотором отрезке времени при данном уровне знаний. Совсем иные требования предъявляются к математической модели, применяемой для описания поведения диффузной системы. Здесь уже не идет речь об абсолютной категории. Математическая модель может давать лишь какое-то представление о поведении плохо организованной системы. Одни и те же аспекты изучаемой системы можно описывать различными моделями, одновременно имеющими право на существование. Можно говорить о том, что одни из этих моделей в каком-то смысле хороши, другие – плохи. Всегда нужно специально оговорить, как и с помощью каких критериев производится оценка модели.

Понятие модели отличается и от хорошо и давно известного в науке понятия гипотезы [5]. Наука допускает существование нескольких гипотез, поскольку одни и те же наблюденные явления могут одинаково хорошо подтверждать различные гипотезы. Но наличие нескольких гипотез всегда рассматривается как некое временное явление – предполагается, что рано или поздно из нескольких конкурирующих гипотез удастся выбрать одну. Математические же модели не всегда нужно считать конкурирующими друг с другом. Если после выбора одной из конкурирующих гипотез удается представить ее в математической форме, оценив количественно входящие в нее константы, то она приобретает уже статус закона.

Раньше считалось, что язык математики строго однозначен и этим отличается от многозначного – полиморфного – естественного языка людей [6]. Снижение требований, предъявляемых к математическому описанию, замена закона моделью привели к тому, что математический язык, однозначный по своей природе, стал применяться как многозначный. Начала стираться столь четкая грань, которая ранее существовала между математическим и вербальным описанием явлений. На это очень важное обстоятельство до сих пор не обращали достаточного внимания при обсуждении гносеологических проблем кибернетики.

Еще и сейчас очень часто можно слышать споры о возможности математического описания столь сложных систем, как, скажем, социальные системы. Нам кажется, что в большинстве случаев эти споры основаны на недоразумении. Те, кто утверждают, что нельзя, имеют в виду математическое описание в старом, традиционном смысле. Те же, кто говорит, что можно, исходят просто из совсем других методологических концепций, понимая под математическим описанием не установление законов, а создание моделей с резко ослабленными требованиями.

Опишем теперь несколько наиболее интересных подходов к созданию моделей для описания плохо организованных систем.

а. Эскизная модель, заданная дифференциальными уравнениями. В рамках этих представлений математические модели предлагаются лишь для описания отдельных, может быть, наиболее интересных явлений, протекающих в сложной диффузной системе. Не делается попытка описания системы в целом. Не рассматриваются все возможные взаимодействия между отдельными процессами, развивающимися в системе. Образно говоря, здесь мы имеем дело с математическим описанием, напоминающим современную модернистскую живопись. Можно сказать, что попытки реалистичного описания слишком сложных систем иллюзорны – такое описание не воспринималось бы читателем из-за чрезмерной громоздкости. Примером эскизного описания сложной системы может служить написанная мною совместно с 3.М.Мульченко книга «Наукометрия. Изучение развития науки как информационного процесса» [7]. В ней мы использовали самые простые дифференциальные уравнения для описания лишь отдельных, наиболее интересных сторон сложной системы.

Ясно, что при таком описании отдельные явления могут оказаться слишком подчеркнутыми, другие – затушеванными или даже искаженными. Различные исследователи могут предлагать существенно различные математические модели для описания одной и той же системы, и здесь нельзя указать простого и четкого критерия для их дискриминации. Выбор одной из множества возможных моделей будет определяться уровнем интеллектуального эстетизма. Хорошо воспринимаются лишь те модели, которые попадают в резонанс с интуитивными представлениями читателя о природе рассматриваемой системы. Явное раздражение вызовут слишком сложные модели с множеством оговорок и поправок. Изящество становится одним из критериев достоинства математической модели. Модель, конечно, должна быть не только изящна, но и содержательна. Это значит, что она должна хорошо объяснять множество уже известных фактов, выявлять новые, незамеченные явления, в какой-то степени предсказывать их дальнейшее развитие и, что, вероятно, имеет наибольшее значение, должна выдвигать перед исследователями новые проблемы.

Путь построения модели таков: вначале предлагают некоторые, логически обоснованные постулаты. Исходя из них, записывают дифференциальные уравнения, которые затем интегрируют. Полученные таким образом функциональные зависимости сопоставляют с наблюденными явлениями, пользуясь обычными статистическим и критериями.

С познавательной точки зрения очень важно задать исходные модели в виде дифференциальных уравнений – они легче поддаются осмысливанию, чем записи в интегральной форме. Например, в экономической литературе часто можно встретить утверждение о том, что сложность управления растет пропорционально квадрату числа объектов, подлежащих управлению, т.е. y = kx2. На первый взгляд это утверждение вызывает недоумение – почему все увеличивается пропорционально квадрату числа объектов? Однако если то же утверждение записать в дифференциальной форме dy = х dx•const, то все сразу проясняется. Кажется вполне естественным, что приращение сложности управления должно быть пропорционально числу уже действующих объектов, так как каждый новый объект должен взаимодействовать со всеми уже существующими. Второй пример – экспоненциальный рост числа публикаций, количества научных работников и пр. Эта закономерность становится сразу же понятной, если мы запишем ее в дифференциальной форме: dy/dt = ку. Представляется вполне разумным предположить, что скорость роста числа публикаций и количества научных работников должна быть пропорциональна достигнутому уровню – чем больше публикаций, тем больший отклик они вызывают. Нам нередко приходилось слышать, что рост числа научных работников во времени можно представить и прямой, ибо прямая может идти и круче, чем экспонента. Но нелепость такого утверждения становится опять-таки очевидной, если представить его в дифференциальной форме. Концепция линейного роста эквивалентна утверждению о постоянстве скорости роста, т.е.
dy/dt = к. Трудно представить себе, чтобы число научных работников в наши дни росло с такой же скоростью, как, скажем, во времена Ньютона. Здесь хочется обратить внимание на одно обстоятельство: одну и ту же функцию – экспоненту – можно использовать как для записи четких физических закономерностей, которым подчиняется, например, радиоактивный распад или поглощение излучения, так и для эскизного описания поведения сложных систем. Чтобы четко разграничить эти два способа, проведем следующий мысленный эксперимент: забросим, скажем, на Луну порцию радиоактивных, веществ и некоторое множество научных публикаций. Радиоактивные атомы будут продолжать распадаться по экспоненте – здесь мы имеем дело с законом природы. Публикации, естественно, расти не будут – на Луне нет той системы – науки, развитие которой лишь эскизно можно описать приведенным выше дифференциальным уравнением, где скорость роста пропорциональна достигнутому уровню публикаций. Аналогию здесь можно провести и дальше: как в случае радиоактивного распада, так и в случае роста числа публикаций мы имеем дело только со статистическим описанием явлений. В обоих случаях экспонентой задается функция распределения, но в первом случае экспоненциальное распределение рассматривается как закон природы, во втором случае – лишь как элемент эскизного описания сложной системы.

Не нужно слишком серьезно относиться к экспериментальной проверке моделей, предложенных при эскизном описании диффузных систем. Хорошее совпадение с данными эксперимента не служит достаточно сильным подтверждением правильности модели, ибо всегда можно предложить и другие модели, которые также не будут противоречить наблюденным явлениям. При плохом совпадении всегда можно придумать достаточно разумные объяснения – ведь изучаемая система по определению диффузна; можно даже ввести поправки в модель, что, правда, поведет к нежелательному ее усложнению. Иногда сама постановка задачи о строгой проверке моделей теряет смысл. Так, обсуждая вопрос об адаптационном торможении в развитии науки [7], мы записали модель dy = (dn/n) const, где у – некий результат научной работы (не просто публикация), n – число научных работников. Модель представляется вполне разумной: приращение результатов научной работы оказывается обратно пропорционально общему числу научных работников, так как каждому вновь вступившему в коллектив научному работнику приходится тратить время на обмен информацией со всеми уже работавшими в нем, что тормозит деятельность каждого члена коллектива. Интегрируя, мы получаем логарифмический закон роста – он, в общем, хорошо согласуется с наблюдаемым в нашей повседневной работе. Но вряд ли имеет смысл здесь говорить о строгой проверке. Мы не очень хорошо знаем, как измерять результат научной работы, и, кроме того, при тщательной проверке мы должны были бы учесть множество дополнительных факторов: ведь не всегда вновь поступающие сотрудники вливаются в старый коллектив, иногда они образуют новые, совершенно замкнутые группы; вступают в игру и такие не учтенные моделью факторы, как старение коллектива и т.д.

Нам кажется, что разумнее обсуждать достоинство модели на уровне ее логических предпосылок. Но тут мы сталкиваемся с новой трудностью. К системе логических предпосылок здесь нельзя предъявлять столь излюбленного математиками требования внутренней непротиворечивости. Ведь мы имеем дело с диффузной системой и описываем лишь отдельные, часто противоречивые тенденции, задаваемые различными механизмами, сфера деятельности которых четко не разграничивается.

Можно поставить вопрос – в чем же смысл таких моделей? Ответ на него очень прост. Такие модели позволяют лицам определенной интеллектуальной настроенности понимать повеление системы лучше, чем если бы оно было изложено вербально. Это происходит, видимо, потому, что математический язык и, в частности, язык дифференциальных уравнений обладают очень высокой степенью общности. У ученого, владеющего этим языком, сразу же возникает множество ассоциаций с аналогичными, хорошо известными ему ситуациями, описываемыми такими же уравнениями. Математическая модель сразу же становится па свое место в системе тех представлений, которыми располагает ученый, мыслящий на языке математики. Но все это вызывает страшное раздражение со стороны представителей гуманитарных наук, для которых язык математики все же остается лишь плохо выученным иностранным языком. Их точку зрения можно сформулировать так: зачем говорить и мыслить на неродном языке?

б. Программная модель. В некоторых случаях модель диффузной системы можно представить совокупностью программ, написанных для ЭВМ. Сейчас очень большая работа ведется по составлению программ, имитирующих деятельность человека при решении интеллектуальных задач некоторого типа [1, 3]. Составлены программы для игры в шахматы и шашки, программы для доказательства теорем математической логики и планиметрии, программы, отвечающие на вопросы об игре в бейсбол, программы для интегрирования функций и т.д. Среди широких кругов научных работников у нас распространено ошибочное мнение о таком построении программ, которое позволяет, используя колоссальные возможности ЭВМ, осуществлять полный перебор всех возможных вариантов. Даже современные ЭВМ не справились бы с такой задачей. Нетрудно показать, что мощной современной ЭВМ для доказательства более или менее простой десятишаговой теоремы путем полного перебора всех вариантов потребовалось бы несколько тысяч лет. Все перечисленные выше программы построены как эвристические. Они составляются на основании тщательного логического анализа поведения человека при решении подобных задач, причем предполагается, что сложные процессы мышления состоят из элементарных процессов оперирования над символами. Допускается возможность различных путей дальнейшего действия в зависимости от исхода операции сравнения. Задача исследователя заключается в том, чтобы найти такую упорядоченную последовательность процедур, которая не отличалась бы от поведения человека. Предполагается, что этот путь приведет к созданию искусственного разума и, вместе с тем, позволит познать процесс мышления. Сейчас очень много пишут об эвристическом программировании и противопоставляют ему традиционные строго математические методы исследования. Эвристическое программирование – это все же лишь перебор вариантов, но перебор с наложением некоторого ограничения. Вся эвристичность заключается именно в этом ограничении, налагаемом на перебор всех вариантов. Ограничения налагают, исходя только из интуитивных соображений, подражая деятельности человеческого интеллекта – строгого математического обоснования им не дается. Подробнее мы проиллю­стрируем эту мысль при описании метода случайного баланса (см. ниже стр. 163).

Часто можно слышать критические высказывания, основанные на попытке противопоставить человека машине с каких-то принципиальных позиций. Утверждается, например, что ЭВМ делает только то, что запрограммировано. На это можно ответить, что и человек делает только то, что запрограммировано в его сознании. Иногда составляются длинные и интересные списки ситуаций, в которых проявляется глубокое и пока не устранимое различие в поведении человека и ЭВМ. Вероятно, одно из самых серьезных различий состоит в том, что человек, в отличие от ЭВМ, может решать плохо формулированные задачи. Или иначе – машине нужен однозначный математический язык, человеку – естественный, полиморфный, язык. Естественный язык, как раз в силу своей полиморфности, оказывается мощнее любого строго формализованного языка; это почти самоочевидное утверждение, не раз обсуждавшееся и в нашей литературе, очень хорошо сформулировано английской лингвистической философской школой [8]. Но не объясняется ли такое различие результатов тем, что пока еще никто не понял, как в сознании человека работает программа семантического анализа предложений, формулируемых на полиморфном языке. Если бы удалось понять механизм подобного анализа, то это существенно продвинуло бы все работы, направленные на создание искусственного интеллекта. Создание искусственного разума – модели человеческого интеллекта – является сейчас центральной проблемой кибернетики.

Здесь хочется опять обратить внимание на неприятную для докибернетической методологии науки многозначность: можно предложить множество моделей человеческого интеллекта, представленных существенно различными программами. Нужно придумывать специальные критерии для сравнения работы программ с мышлением человека и дли сопоставления программ между собой. Опять в каком-то одном смысле данные программы будут хорошими, в другом – плохими.

в. Комбинированная модель, представленная дифференциальными уравнениями. Два рассмотренных выше типа моделей носили познавательный характер. Модели такого типа создаются для того, чтобы лучше понять структуру той или иной диффузной системы. Иногда моделирование ведется, исходя из иных, чисто практических задач. Модель может строиться только для предсказания поведения диффузной системы в изменяющихся условиях, или для того, чтобы в каком-то смысле оптимально управлять системой. Хорошо известны модели такого типа, например, в здравоохранении, в экологии и т.д. В экологи [9], скажем, может идти речь о выборе наилучшей стратегии для борьбы с насекомыми-вредителями или о создании модели, позволяющей построить разумную систему ограничений на лов ценных пород животных или рыб и т.д. При построении таких моделей, естественно, стремятся учесть возможно большее число факторов. Модели строятся на основании всестороннего анализа поведения диффузной системы – к работе привлекается, как правило, множество специалистов различного профиля. Широко используются как результаты проведенных ранее статистических исследований, так и математические модели отдельных явлений, заданные дифференциальными уравнениями. Сейчас известны хорошо разработанные модели таких явлений, как рост популяций, развитие эпидемий и пр. [10]. При этом часто исследователи располагают весьма ограниченными данными – скажем, известны параметры для модели роста лишь для популяций одного вида, но затем эти данные используют для моделирования роста популяции совсем другого вида. Нередко в ЭВМ вводится очень много математических моделей. Например, в задаче, связанной с поиском разумных ограничений на лов лососевых рыб [9], в ЭВМ было введено 1000 уравнений. При моделировании часто пытаются выяснить поведение изучаемой системы в различного рода экстраординарных ситуациях, например, при вспышках эпидемий, или больших пожарах, вырубках больших площадей леса и кустарника и т.д.

При построении моделей подобного типа исследователь не стремится к вполне адекватному описанию изучаемой системы. К тому же проверка степени адекватности часто оказывается трудной или просто невозможной. Так, например, нельзя сопоставить поведение модели с реальной действительностью, когда моделируется поведение системы в таких условиях, как вспышка эпидемии или большой пожар, которые для данной системы реально еще не наблюдались. Задача исследователя здесь ограничивается лишь тем, чтобы предложить модель, в какой-то степени напоминающую предполагаемое поведение реальной системы. Он надеется таким образом найти разумную стратегию поведения при управлении подобной системой, полагая, что человек в своей повседневной жизни поступает так же, принимая решения в сложных ситуациях при неполном знании.

Модели описанного выше типа из-за их чрезвычайной сложности и далеко неполной адекватности могут вообще не иметь никакого познавательного значения.

С гносеологических позиций здесь интересно снова отметить, многозначность – различные коллективы исследователей могут создавать различные модели для описания одной и той же диффузной системы. Любопытно отметить еще одно обстоятельство – строгие математические модели отдельных явлений (например, рост популяций, развитие эпидемий и пр.) начали создавать уже давно, но внимание биологов они привлекли лишь после того, как оказалось возможным проигрывать с помощью ЭВМ ситуации во всей их сложности, в условиях, подражающих реальным.

г. Локально-интегральная (полиномиальная) модель. Появление ЭВМ воскресило интерес к полиномиальному описанию поведения сложных систем. И такое описание оказалось возможным включить много десятков независимых переменных. В этом случае мы представляем себе диффузную систему в виде некоторого «черного ящика»; исследователь ищет связь между выходным параметром и множеством входных параметров (независимых переменных), почти ничего не зная о механизме явлений, протекающих в системе.

Несколько подробнее это можно изложить следующим образом. Исследователь полагает, что, вообще говоря, механизм явлений можно записать дифференциальными уравнениями, но, практически, из-за сложности системы этого сделать нельзя. Далее он полагает, что систему дифференциальных уравнений можно решить, но ее решение ему неизвестно и неизвестен даже аналитический вид той функции, которой оно задается. Коэффициенты регрессии (коэффициенты полинома) можно интерпретировать как коэффициенты ряда Тейлора, т.е. как значения частных производных в точке, вокруг которой производится разложение неизвестной нам функции, задающей решение неизвестных нам дифференциальных уравнений. Пользуясь статистическими методами, легко оценить степень адекватности представления результатов наблюдений полиномом заданного порядка.

С познавательных позиций полиномиальная модель не представляет особого интереса. Зная численные значения коэффициентов отрезка ряда Тейлора, нельзя восстановить исходную функцию, аналитическое выражение которой остается неизвестным исследователю, и тем более нельзя восстановить исходные дифференциальные уравнения, которыми описывается механизм процесса. Здесь мы опять-таки сталкиваемся с той же пресловутой неоднозначностью модели, о которой мы уже столько раз говорили в этой главе. Некоторое, может быть, не очень полное представление о механизме явлений можно, конечно, получить и из анализа полинома, используя хорошо известные методы аналитической геометрии. В практическом отношении полиномиальные модели могут оказаться очень полезными, если они используются для решения экстремальных задач (например, при разработке оптимальных условий протекания технологических процессов) и в планировании эксперимента [11]. К этому вопросу мы еще раз вернемся позднее (см. § 1 и 2 гл. IV). С позиций статистики полиномиальная модель очень удобна, так как мы можем улучшать аппроксимацию, повышая порядок полинома, и при этом наша аппроксимирующая функция остается линейной по параметрам, что облегчает все последующие статистические процедуры, а именно, применение метода наименьших квадратов для оценки параметров, выбор оптимального расположения точек в пространстве независимых переменных и т.д.

Заканчивая настоящий раздел, хочется поставить вопрос, остающийся пока еще без ответа: не приведет ли многозначность, о которой так много здесь говорилось, к засорению науки множеством моделей, имеющих одинаковое право на существование?

***

В заключение нам хочется рассмотреть логическую модель системы, в которой возникают новые идеи; в дальнейшем мы будем называть ее просто информационно развивающейся системой. Здесь мы имеем в виду самоорганизующиеся системы, управляющиеся своими информационными потоками и, вместе с тем, создающие новую информацию. Такими системами являются биологическая система, создающая новые виды, наука, рассматриваемая как самоорганизующаяся система, интеллект человека, мыслящий автомат (если он возможен). Можно ли представить себе принцип организации таких систем? Можно ли построить хотя бы логическую модель такой системы? Эти вопросы время от времени возникают в литературе по кибернетике.

Задачу можно поставить несколько иначе: способна ли сколь угодно долго информационно развиваться система, состоящая на некоторой совокупности аксиом и правил обращения с ними. Мы вправе рассматривать аксиомы как некоторые строки символов, а правила вывода – как способы получения новых строк. Если правила конечны и строго детерминированы, то на такую систему накладывает ограничения известная теорема Гёдели о неполноте (1931). Из нее следует существование истин, выразимых на языке этой системы, которые, тем не менее, нельзя вывести из системы, как бы ни задавались аксиомы и конечные и детерминированные правила вывода[2].

Нагель и Ньюман [13] утверждают, что из теоремы Гёделя следует невозможность построения думающих машин. Но так же можно обосновать и невозможность творческого мышления человека и необходимость признания виталистического начала в биологической организации. Представляется более интересным другой подход к построению логической модели информационно развивающейся системы. Следуя Кастлеру [14], можно ввести в модель что-то вроде генератора случайных чисел, случайным образом изменяющих систему аксиом и правила вывода. В биологической эволюции этот генератор физически реализуется, скажем, в виде жесткого излучения, действующего на гены и вызывающего мутации. В модель нужно, конечно, включить еще и блок обучения, отсеивающий неблагоприятные идеи. Интересно замечание Кастлера о том, что пришелец с другой планеты не смог бы отличить систему, построенную таким образом, от системы, наделенной «свободной волей». Из теоремы Гёделя следует, во всяком случае, что информационно развивающуюся систему нужно освободить от безусловного детерминизма, и она должна иметь какие-то степени свободы. Генератор случая является той моделью, которая описывает такое свободное поведение системы. Модель с генератором случая имеет хотя бы одно бесспорное преимущество – она дает нам в руки оператор, поведение которого можно изучать и которым можно действовать при создании искусственного интеллекта. Концепция генератора случая является операционной, в отличие от концепции особого жизненного начала или концепции сверхлогического мышления, которые обрекают исследователя на роль пассивного наблюдателя. Здесь дело не сводится к простой замене слов.

По-видимому, в модели информационно развивающейся системы, как и при эвристическом программировании, весьма существенную роль должна играть какая-то неизвестная еще нам система ограничений, налагаемых на генератор случая или на правила отбора генерированной идеи до ее проверки. Быть может, системой таких ограничений и определяется гениальность отдельных людей? Во всяком случае, ясно, что, создавая искусственный интеллект, нужно ввести туда генератор случая и систему отбора, иначе нам придется иметь дело с уже совсем скучным интеллектом, построенным по принципу ветвящегося логического дерева с четко прогнозируемым поведением. Проблема создания искусственного интеллекта – это вполне реальная задача, возникающая в различных областях деятельности человека и прежде всего в информационной службе. В частности, в области математической статистики сейчас нужно думать о создании интеллектуальной машины – машины-консультанта, работающей в режиме диалога. Сейчас специалисты по математической статистике слишком много времени тратят на оказание консультаций. Эта работа носит как рутинный, так и творческий характер. Удастся ли полностью передать ее машине-консультанту? Во всяком случае, работая над созданием такой машины, можно будет лучше понять как логические основы математической статистики, так и механизм мышления исследователя.

Генератор случая и блок обучения придают системе способность к адаптации. Система приобретает возможность нетривиально приспосабливаться к изменяющимся условиям. В биологии уже давно делались попытки провести границу между живой и неживой природой. Сейчас ясно, что неконкурентоспособными оказываются гипотезы, пытающиеся проводить такое разграничение на основании особых свойств вещества. По-видимому, различно между живой и неживой природой надо искать в особенностях организации информационной системы. В живой системе она построена так, что одной из основных ее особенностей является способность к адаптации. Так же организованы жизнеспособные системы, созданные человеком: наука и общество. В неживой природе – при росте кристалла или развитии плазмы, не происходит нетривиальных адаптационных процессов, т.е. система не обогащается информационно в процессе своего эволюционного развития. Может быть, в способности к адаптации больше, чем в чем-нибудь другом, проявляется грань между живой и неживой природой. Построенная таким образом логическая модель информационно развивающейся системы оправдана хотя бы тем, что она задает то направление, в котором интересно вести исследование в ближайшем будущем.

Из обсуждения приведенной выше модели следует и ряд других выводов.

Рассмотрим здесь два из них.

1. Поведение системы с генератором случая непрогнозируемо. Нельзя прогнозировать эволюционное развитие биологической системы, открытий в науке, поведение мыслящего автомата (если он будет создан). Невозможность прогнозирования в науке мы уже ранее обосновывали, исходя из других соображений[3] [7].

2. Мы уже упоминали о том, что естественный полиморфный язык мощнее любого строго формализованного искусственного языка. Полиморфность языка позволяет преодолевать гёделевскую трудность в мышлении и интеллектуальном общении людей. Может ли, например, достаточно долго развиваться какая-нибудь научная система, если приверженцы ее всегда совершенно формально опираются только на буквальные высказывания своих основателей? Если и может, то только в силу полиморфности языка: этим высказываниям придается все новый и новый смысл. Разговаривая на естественном, полиморфном, языке ученый может пользоваться строгой дедуктивной логикой, оставаясь в то же время не вполне логичным. Нелогичность, нужная для преодоления гёделевской трудности мышления, оказывается завуалированной полиморфностью языка, – это не вызывает раздражения. Вместе с тем, за полиморфизм приходится нередко дорого расплачиваться – часто бесконечно долгие споры возникают только из-за того, что одним и тем же словам упорно приписывается разный смысл. Впрочем, быть может, в результате таких споров и возникают новые идеи. Если соблюдать крайнюю осторожность и принять гипотезу о непонятом механизме сверхлогического мышления[4], то это все равно не снимет гёделевской трудности; возможно, что разные ученые находятся на разных уровнях иерархии мышления, но коммуникация между ними всегда ведется на одном – строго логическом уровне (подробнее см. [108]).

***

В настоящей книге мы не будем ничего говорить о критериях, проводящих грань между детерминированными и случайными явлениями – это слишком сложный и до сих пор не решенный вопрос. Мы не будем также пытаться осмыслить философскую природу случая. Для нас важно другое – показать, как вероятностный подход можно применить к описанию сложных, плохо организованных систем, где строго детерминированное описание становится невозможным. Ниже (см. стр. 70) будет рассмотрена процедура рандомизации, позволяющая искусственно создавать ситуацию случайности при изучении сложных систем. Во всяком случае, читателя не должно смущать то обстоятельство, что вероятностные методы можно применять и для описания поведения систем, которое на самом деле имеет детерминированный характер. Вероятностные модели в некоторых случаях просто отражают недостаточность наших знаний.



[1] В статье Чжао Юань-Жень дается также интересный исторический анализ развития смыслового содержания слова «модель». В английском языке слово «модель» означает нечто образцовое или идеальное. Например, «model husband» означает «образцовый супруг». В математику понятие модели было введено, по-видимому, Клейном (70-е годы XIX века), а затем Расселом.

Одно из применений этого понятия в математике состоит в доказательстве внутренней непротиворечивости теории путем нахождения реально существующей модели – ибо то, что существует, не может быть внутренне противоречиво. В математике модель оказывается, таким образом, конкретнее, чем то, сто моделируется. Это явно противоположно смыслу, который сейчас придают ему в кибернетике.

[2] Подробное и вполне доступное доказательство теоремы Гёделя можно найти в книге Арбиба [12], где эта теорема используется для обсуждения вопроса о возможностях человека и ЭВМ.

[3] Тем не менее ученые постоянно пытаются прогнозировать. Какая-то часть этих прогнозов иногда даже оправдывается. Однако прогностическим высказываниям нельзя приписать статус научных высказываний – они в момент своего появления принципиально неверифицируемы, даже в вероятностном смысле нельзя оценить степень их достоверности. Хотя, конечно, всегда можно выявить некоторые тенденции в развитии того или другого явления; экстраполируя некоторые кривые роста, можно довести их до абсурдных значений и, следовательно, таким образом показать, что механизм роста как-то должен изменяться и т.д.

[4] Если, скажем, речь идет о мышлении человека, то можно допустить существование целой иерархии его форм. На нижней ступени этойиерархии стоит образное мышление, далее следует логическоемышление и т.д. Не стоит ли выше логического мышления другая совершенно не понятая нами форма творческого – сверхлогического – мышления, которое мы пытаемся описать вероятностной моделью с генератором случая только в силу нашего непонимания реальносуществующего механизма?



Назад в раздел