Чтение онлайн

ЖАНРЫ

Метод. Московский ежегодник трудов из обществоведческих дисциплин. Выпуск 4: Поверх методологических границ
Шрифт:

Различаются иерархические и итеративные методы кластеризации. Агломеративные иерархические методы предполагают последовательное объединение объектов в группы и групп между собой до тех пор, пока все объекты не окажутся в одном кластере. Дивизивные, наоборот, построены на последовательном разбиении одного кластера со всеми объектами на более малочисленные группы.

К итеративным методам кластерного анализа относится метод k– средних. В отличие от иерархических методов, он требует предварительного определения количества кластеров, которые будут сформированы. Смысл процедуры состоит в итерационном уточнении «центров тяжести» искомых классов и классификации наблюдений в соответствии с расстоянием до ближайшего «эталонного» центра. Но итеративные методы значительно более трудоемки с точки зрения вычислений и менее популярны.

Мерой схожести (однородности)

обычно принимается величина, обратная расстоянию между объектами, ведь если объекты в многомерном пространстве находятся рядом, то разумно предположить, что они похожи друг на друга. Возможных мер расстояния между точками (объектами) i и j довольно много, вот только некоторые из них:

1) Евклидово,

,

2) квадрат Евклидова

,

3) расстояние Манхеттен

,

где xi (1), xi (2), .., xi (m)m количественных признаков, которыми описываются объекты.

Если признаки измерены на категориальном уровне, тогда мерами схожести будут такие метрики, которые основаны на совпадении или несовпадении значений по каждому признаку [Ким, Мьюллер, Клекка, 1989, с. 161].

После объединения наиболее близких друг к другу точек в один кластер, в иерархических методах необходимо задать способ агломерации – правило сравнения и объединения единичных точек к кластерам или двух кластеров в один более крупный. Для этого используются метод ближнего соседа, метод дальнего соседа, центроидный метод и метод средней связи. По результатам некоторых исследований, лучшие результаты дают метод Варда и метод средней связи [Gore, 2000, p. 315].

Кластерный анализ позволяет получить относительно объективную классификацию единиц наблюдения, так как является формальным методом, но в зависимости от способа агломерации и смены метрики он может выдавать различные по составу группы при одинаковом числе кластеров. В каждом отдельном случае самым важным остается качество содержательной интерпретации полученных совокупностей объектов, но все-таки некоторые конвенциональные правила комбинации метрик и правил агломерации существуют [Gore, 2000, p. 309–312].

Совокупность описанных методов анализа данных позволяет решать наиболее типичные задачи политического анализа (а возможно, и социальных наук вообще) на основе количественных данных. Тем не менее за рамками нашего обзора остался широкий класс методов, изучение и описание которого требует достаточно свободного владения понятиями теории вероятностей и математической статистики, а также алгебраической геометрии. Речь идет, в первую очередь, о байесовском подходе к анализу данных, непараметрических методах, методах анализа пространственно-временных данных и временных рядов, а также нелинейных вариантах метода главных компонент, основанных на теории нелинейных многообразий.

Все описанные и оставленные без обзора методы прикладной статистики, однако, требуют для успешности использования привлечения способности исследователя интерпретировать как саму изучаемую реальность, так и полученные в ходе математической обработки результаты. Семиотика потенциально способна оказать практикующим исследователям большую помощь в этой области. Надеемся, что продемонстрированная в этом обзоре широта приложений статистики привлечет внимание специалистов по семиотике к прикладной статистике и будет способствовать сближению этих областей знания.

Литература

Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики: Учебник для вузов. – М.: ЮНИТИ, 2001. – 1022 с.

Ахременко А.С. Политический анализ и прогнозирование. – М.: Гардарики, 2006. – 333 с.

Аптон Г. Анализ таблиц сопряженности / Пер. с англ. и пред. Ю.П. Адлера. – М.: Финансы и статистика, 1982. – 144 с.

Ким Дж.-О., Мьюллер Ч.У., Клекка У.Р. Факторный, дискриминантный и кластерный анализ. – М.: Финансы

и статистика, 1989. – 215 с.

Кимбл Г. Как правильно пользоваться статистикой. – М: Финансы и статистика, 1982. – 294 с.

Стукал Д.К., Хавенсон Т.Е. Моделирование государственной состоятельности постсоциалистических стран // ПОЛИТЭКС. – СПб., 2012. – Т. 8, № 1. – С. 233–260.

Analysis of multivariate social science data / D.J. Batholomew, F. Steele, I. Moustaki, J.I. Galbraith (eds.). – Boca Raton; L.; N.Y.: CRC Press, 2008. – xi, 371 p.

Collier D., Adcock R. Democracy and dichotomies: A pragmatic approach to choices about concepts // Annual review of political science. – Palo Alto, Calif., 1999. – N 2. – P. 537–565.

Gore P.A., jr. Cluster analysis // Handbook of applied multivariate statistics and mathematical modeling. – San Diego: Academic Press, 2000. – P. 297–321.

Inglehart R.F., Welzel C. Political culture, mass beliefs and value change // Democratization. – N.Y.: Oxford univ. publishers, 2009. – P. 126–144.

King G., Keohane R.O., Verba S. Designing social inquiry: scientific inference in qualitative research. – Princeton: Princeton univ. press, 1994. – xi, 245 p.

Martynenko G. Semiotics of statistics // Journal of quantitative linguistics. – L., 2003. – Vol. 10, N 2. – P. 105–115.

Mondak J.J. Reconsidering the measurement of political knowledge // Political analysis. – Oxford, 2000. – Vol. 8, N 1. – P. 57–82.

Модальная семиотика: основания и обоснования

С.Т. Золян

Конец прошлого – начало нынешнего века ознаменовались попыткой тотального пересмотра идей и методов структурализма, в особенности же того, что еще в 60-х годах Ж. Деррида было названо Соссюрианским «логоцентризмом» [Деррида, 2000]. Не претендуя на оценку того, что было создано в результате подобной «деконструкции», заметим, что сегодня в гуманитарных науках вновь утверждается возврат к основам, заложенным в структурной лингвистике и аналитической философии, причем в их первоначальном варианте. Вместе с тем очевидно, что необходимы значительные уточнения. Уместно вспомнить провидческое замечание Ю.М. Лотмана относительно ситуации, сложившейся в конце 70-х: «Обобщение опыта развития принципов семиотической теории за все время, протекшее после того, как исходные предпосылки ее были сформулированы Фердинандом де Соссюром, приводит к парадоксальному выводу: пересмотр основных принципов решительным образом подтверждал их стабильность, в то время как стремление к стабилизации семиотической методологии фатально приводило к пересмотру самых основных принципов» [Лотман, 1978, с. 18].

Как нам представляется, необходимо уточнение, если не пересмотр самой концепции знака и семиотики, поскольку традиционная семиотика сегодня оказалась оторванной от семантики. То, что было достигнуто в лингвистической семантике начиная с 60-х годов, в семиотике оказалось незамеченным – во всяком случае, в том, что касается не дескриптивных и прикладных аспектов, а теоретических основ, затрагивающих само определение знака. С одной стороны, модальная семантика, а с другой – когнитивистика могут во многом дополнить наше понимание семиозиса, в то время как генеративная семантика ставит перед необходимостью коренного уточнения взаимодействия синтактики и семантики и отказа от рассмотрения их как автономных сфер (что с 70-х годов уже можно считать укорененным в лингвистике) 36 .

36

Заметим, что уточнение взаимодействия этих трех аспектов приводит к «стабилизации» исходных принципов: для предложившего данную триаду Чарльза Морриса «автономия» синтактики, семантики и прагматики, в отличие от его последователей, была относительной. Ср.: «Верно, что синтактика и семантика, как в отдельности, так и вместе, характеризуются сравнительно высокой степенью автономности. Однако синтактические и семантические правила – это не что иное, как созданные семиотикой словесные констатации того, каковы особенности употребления знаков реальными пользователями в каждом конкретном случае семиозиса. “Правила употребления знаков”, так же как сам термин “знак”, – это семиотический термин, и его нельзя определить только синтактически или семантически» [Моррис, 1983, с. 62].

Поделиться с друзьями: