8. Математическая статистика и прикладные задачи
читать дальше«Математическая статистика, наука о математических методах систематизации и использования статистических данных для научных и практических выводов» (РЭС).
Таким образом речь идёт об использовании разработанных и упомянутых выше методов для применения в различных предметных областях – в данном случае в лингвистике, литературоведении и т.д.
Кроме тех задач, о которых шла речь выше (оценка параметров, идентификация функций распределения, расчёт характеристик вероятностных связей, оценка вероятности превышения некоторого уровня) значительная часть математической статистики посвящена проверке гипотез – оценке адекватности сделанных предположений о виде функции распределения, о значении тех или иных параметров.
Широко практикующиеся в лингвистике и литературоведении оценки частот отдельных слов, выражений, стихотворных размеров и стилей с помощью этих методов получают твёрдую количественную основу, легко автоматизируются, перекладываются «на плечи» компьютеров. В частности, легко повторить и дополнить результаты монографии [6].
Те же методы позволяют исследовать вопросы авторства по анализу почерка и текста.
Косвенно связаны с математической статистикой ( как приложениями теории вероятностей) разработанные новые подходы – уже упомянутая теория игр и теория массового обслуживания – «теория очередей». Последняя позволяет, в частности, обосновать тираж произведений искусства (печатных и изобразительных), оценить спрос и последствия решений менеджеров (зачастую – ошибочные, приводящие к значительным убыткам).
Теория игр в гуманитарных науках обычно не имеет в явном виде «противника», но почти всегда связана с «игрой против Природы», поведение которой, по выражению А. Эйнштейна, «не злокозненно, но неизвестно и замысловато».
Важной задачей математической статистики является и оценка объёма словарей. Более или менее субъективный отбор «необходимого» запаса слов привел, например, к тому, что в 7 учебниках французского языка общими оказалось лишь… 10% слов!
То есть учебники посвящены по существу разным языкам!
Одной из важнейших задач прикладной статистики являются проблемы кластеризации – выделения групп объектов (областей представляющих их точек), объединённых некоторыми общими свойствами, разбиения множества объектов на типовые группы, классификация их. Эти проблемы актуальны и в археологии, ив литературоведении.
В связи с всё растущим применением вероятностных и статистических методов возникает вопрос о роли случайности.
С одной стороны – это объективная реальность, практически все параметры окружающих нас процессов являются более или менее случайными, изменяющимися независимо от нас в большем или меньшем диапазоне. Поэтому учёт таких изменений необходим.
С другой стороны, такой учёт всегда усложняет возникающие задачи, делает их более трудными для решения, и неизвестно, нужно ли «платить» таким усложнением или можно ограничиться детерминированными задачами со средними значениями параметров? Ответ на этот вопрос требует как раз решения стохастических задач и сравнения результатов.
Но есть ещё и третья сторона вопроса об учёте случайности. Оказывается, что при решении достаточно сложных детерминированных задач нередко возникают серьёзные трудности – появление «оврагов» при задачах оптимизации, «зацикливание» процессов решения задач и т.п. И выход необходимо искать … в применении случайности, в организации случайного поиска, случайного «наброса» точек, то есть случайность оказывается, хоть и медлительной, но «палочкой-выручалочкой». Тот же эффект даёт применение так называемого «метода Монте Карло» - статистической имитации почти любых сложных процессов (от ремонта локомотивов до изучения спроса и вкусов для литературных произведений).