Метод. Московский ежегодник трудов из обществоведческих дисциплин. Выпуск 4: Поверх методологических границ
Шрифт:
Различаются иерархические и итеративные методы кластеризации. Агломеративные иерархические методы предполагают последовательное объединение объектов в группы и групп между собой до тех пор, пока все объекты не окажутся в одном кластере. Дивизивные, наоборот, построены на последовательном разбиении одного кластера со всеми объектами на более малочисленные группы.
К итеративным методам кластерного анализа относится метод k– средних. В отличие от иерархических методов, он требует предварительного определения количества кластеров, которые будут сформированы. Смысл процедуры состоит в итерационном уточнении «центров тяжести» искомых классов и классификации наблюдений в соответствии с расстоянием до ближайшего «эталонного» центра. Но итеративные методы значительно более трудоемки с точки зрения вычислений и менее популярны.
Мерой схожести (однородности)
1) Евклидово,
2) квадрат Евклидова
3) расстояние Манхеттен
где xi (1), xi (2), .., xi (m) – m количественных признаков, которыми описываются объекты.
Если признаки измерены на категориальном уровне, тогда мерами схожести будут такие метрики, которые основаны на совпадении или несовпадении значений по каждому признаку [Ким, Мьюллер, Клекка, 1989, с. 161].
После объединения наиболее близких друг к другу точек в один кластер, в иерархических методах необходимо задать способ агломерации – правило сравнения и объединения единичных точек к кластерам или двух кластеров в один более крупный. Для этого используются метод ближнего соседа, метод дальнего соседа, центроидный метод и метод средней связи. По результатам некоторых исследований, лучшие результаты дают метод Варда и метод средней связи [Gore, 2000, p. 315].
Кластерный анализ позволяет получить относительно объективную классификацию единиц наблюдения, так как является формальным методом, но в зависимости от способа агломерации и смены метрики он может выдавать различные по составу группы при одинаковом числе кластеров. В каждом отдельном случае самым важным остается качество содержательной интерпретации полученных совокупностей объектов, но все-таки некоторые конвенциональные правила комбинации метрик и правил агломерации существуют [Gore, 2000, p. 309–312].
Совокупность описанных методов анализа данных позволяет решать наиболее типичные задачи политического анализа (а возможно, и социальных наук вообще) на основе количественных данных. Тем не менее за рамками нашего обзора остался широкий класс методов, изучение и описание которого требует достаточно свободного владения понятиями теории вероятностей и математической статистики, а также алгебраической геометрии. Речь идет, в первую очередь, о байесовском подходе к анализу данных, непараметрических методах, методах анализа пространственно-временных данных и временных рядов, а также нелинейных вариантах метода главных компонент, основанных на теории нелинейных многообразий.
Все описанные и оставленные без обзора методы прикладной статистики, однако, требуют для успешности использования привлечения способности исследователя интерпретировать как саму изучаемую реальность, так и полученные в ходе математической обработки результаты. Семиотика потенциально способна оказать практикующим исследователям большую помощь в этой области. Надеемся, что продемонстрированная в этом обзоре широта приложений статистики привлечет внимание специалистов по семиотике к прикладной статистике и будет способствовать сближению этих областей знания.
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики: Учебник для вузов. – М.: ЮНИТИ, 2001. – 1022 с.
Ахременко А.С. Политический анализ и прогнозирование. – М.: Гардарики, 2006. – 333 с.
Аптон Г. Анализ таблиц сопряженности / Пер. с англ. и пред. Ю.П. Адлера. – М.: Финансы и статистика, 1982. – 144 с.
Ким Дж.-О., Мьюллер Ч.У., Клекка У.Р. Факторный, дискриминантный и кластерный анализ. – М.: Финансы
и статистика, 1989. – 215 с.Кимбл Г. Как правильно пользоваться статистикой. – М: Финансы и статистика, 1982. – 294 с.
Стукал Д.К., Хавенсон Т.Е. Моделирование государственной состоятельности постсоциалистических стран // ПОЛИТЭКС. – СПб., 2012. – Т. 8, № 1. – С. 233–260.
Analysis of multivariate social science data / D.J. Batholomew, F. Steele, I. Moustaki, J.I. Galbraith (eds.). – Boca Raton; L.; N.Y.: CRC Press, 2008. – xi, 371 p.
Collier D., Adcock R. Democracy and dichotomies: A pragmatic approach to choices about concepts // Annual review of political science. – Palo Alto, Calif., 1999. – N 2. – P. 537–565.
Gore P.A., jr. Cluster analysis // Handbook of applied multivariate statistics and mathematical modeling. – San Diego: Academic Press, 2000. – P. 297–321.
Inglehart R.F., Welzel C. Political culture, mass beliefs and value change // Democratization. – N.Y.: Oxford univ. publishers, 2009. – P. 126–144.
King G., Keohane R.O., Verba S. Designing social inquiry: scientific inference in qualitative research. – Princeton: Princeton univ. press, 1994. – xi, 245 p.
Martynenko G. Semiotics of statistics // Journal of quantitative linguistics. – L., 2003. – Vol. 10, N 2. – P. 105–115.
Mondak J.J. Reconsidering the measurement of political knowledge // Political analysis. – Oxford, 2000. – Vol. 8, N 1. – P. 57–82.
Модальная семиотика: основания и обоснования
Конец прошлого – начало нынешнего века ознаменовались попыткой тотального пересмотра идей и методов структурализма, в особенности же того, что еще в 60-х годах Ж. Деррида было названо Соссюрианским «логоцентризмом» [Деррида, 2000]. Не претендуя на оценку того, что было создано в результате подобной «деконструкции», заметим, что сегодня в гуманитарных науках вновь утверждается возврат к основам, заложенным в структурной лингвистике и аналитической философии, причем в их первоначальном варианте. Вместе с тем очевидно, что необходимы значительные уточнения. Уместно вспомнить провидческое замечание Ю.М. Лотмана относительно ситуации, сложившейся в конце 70-х: «Обобщение опыта развития принципов семиотической теории за все время, протекшее после того, как исходные предпосылки ее были сформулированы Фердинандом де Соссюром, приводит к парадоксальному выводу: пересмотр основных принципов решительным образом подтверждал их стабильность, в то время как стремление к стабилизации семиотической методологии фатально приводило к пересмотру самых основных принципов» [Лотман, 1978, с. 18].
Как нам представляется, необходимо уточнение, если не пересмотр самой концепции знака и семиотики, поскольку традиционная семиотика сегодня оказалась оторванной от семантики. То, что было достигнуто в лингвистической семантике начиная с 60-х годов, в семиотике оказалось незамеченным – во всяком случае, в том, что касается не дескриптивных и прикладных аспектов, а теоретических основ, затрагивающих само определение знака. С одной стороны, модальная семантика, а с другой – когнитивистика могут во многом дополнить наше понимание семиозиса, в то время как генеративная семантика ставит перед необходимостью коренного уточнения взаимодействия синтактики и семантики и отказа от рассмотрения их как автономных сфер (что с 70-х годов уже можно считать укорененным в лингвистике) 36 .
36
Заметим, что уточнение взаимодействия этих трех аспектов приводит к «стабилизации» исходных принципов: для предложившего данную триаду Чарльза Морриса «автономия» синтактики, семантики и прагматики, в отличие от его последователей, была относительной. Ср.: «Верно, что синтактика и семантика, как в отдельности, так и вместе, характеризуются сравнительно высокой степенью автономности. Однако синтактические и семантические правила – это не что иное, как созданные семиотикой словесные констатации того, каковы особенности употребления знаков реальными пользователями в каждом конкретном случае семиозиса. “Правила употребления знаков”, так же как сам термин “знак”, – это семиотический термин, и его нельзя определить только синтактически или семантически» [Моррис, 1983, с. 62].