Тикунов В. С. Геоинформатика. Классификации. Операционно-территориальные единицы

Скачать полную версию учебника (с рисунками, формулами, картами, схемами и таблицами) одним файлом в формате MS Office Word Скачать книгу

2.2.2. Классификации

Ранее мы уже касались вопросов классификации. Учитывая их важность во всех науках о Земле, в том числе экологии и географии, в этом подразделе рассмотрим методы классификации более подробно.
Объектом классификации, как правило, являются ОТЕ — операционно-территориальные единицы [А. М.Трофимов и др., 1985. — С. 13]. В качестве ОТЕ могут выступать, например, административно-территориальные единицы, населенные пункты, ячейки регулярной или нерегулярной сетки, наложенной на исследуемую территорию, ячейки растра (см. 3..1). Обозначим все множество ОТЕ символом О = (о1,..., oN), где оi — i -я ОТЕ; N — количество ОТЕ.
Целью классификаций является получение некоторого заранее заданного или незаданного количества групп ОТЕ (классов ОТЕ). В пределах каждого класса ОТЕ должны быть максимально «похожи» друг на друга в некотором смысле, однородны, а ОТЕ из разных классов — максимально «отличаться». Синонимами группы и класса являются также понятия кластера и таксона, а методы получения классов называют методами классификации, кластер-анализа (кластерного анализа), числовой таксономии или распознавания образов.
В пространственном отношении ОТЕ описываются различными показателями и метриками, основными из которых можно считать способы расчета расстояния между ОТЕ (т. е. коэффициентов «сходства» или «отличия» ОТЕ). Помимо географического пространства, исследуемая совокупность ОТЕ фиксирована и в пространстве М атрибутивных показателей (или в пространстве М атрибутивных признаков). В этом пространстве ОТЕ теряют свою географичность и независимо от своей первоначальной природы становятся M-мерными точками.

Результатом нахождения ОТЕ в каждом признаковом пространстве является одно из двух представлений.
1. Представление исходных ОТЕ в виде матрицы ОТЕ-признак, отражающей измерение М признаков на N ОТЕ и содержащей N строк и М столбцов:

Формула (доступно при скачивании полной версии книги)

2. Представление исходных ОТЕ в виде матрицы ОТЕ-ОТЕ отражающей результат сопоставления ОТЕ в признаковом или географическом пространстве между собой и содержащей по N строк и столбцов:

Формула (доступно при скачивании полной версии книги)

Обычно аij означает меру различия (или сходства) ОТЕ. В случае интерпретации аij в качестве мер различия матрица А симметричная с нулями на главной диагонали. Переход от матрицы ОТЕ-признак к матрице ОТЕ-ОТЕ осуществляется с помощью задания метрики d (или расстояния между ОТЕ).
Рассмотрим пример представления ОТЕ с помощью матриц объект-признак и объект-объект.
Допустим, анализируется электоральная статистика в разрезе субъектов Российской Федерации, N = 89, М = 6. Признаками или показателями электоральной географии могут являться название субъекта (0), процент голосов, отданный за какого-либо кандидата (1), явка избирателей (2), количество недействительных бюллетеней (3), уровень образования в регионе — низкий, средний или высокий (4), статус субъекта Российской Федерации — область, край, автономный округ, город или республика (5). Фрагмент матрицы объект-признак для этого случая приведен в табл. 2.2.

Таблица 2.2. Фрагмент матрицы объект-признак (доступно при скачивании полной версии книги)

Для иллюстрации таблицы объект-объект рассмотрим пример оценки экспертом экологической ситуации в регионах. Предположим, что эксперт не может дать уверенную оценку по какому-либо региону, поэтому он сопоставляет регионы между собой методом парных сравнений (табл. 2.3).

Таблица 2.3. Фрагмент матрицы объект-объект (доступно при скачивании полной версии книги)

Способы расчета расстояний и показатели качества классификации. Признаки могут быть измерены в различных шкалах, что накладывает ограничение на способы расчета расстояний между ОТЕ. В приведенном выше примере показатели (1), (2) и (3) — количественного типа, показатель (4) — порядкового типа, показатели (0) и (5) — номинального типа. Для количественных признаков важны единицы измерения. Сопоставлять пары ОТЕ по показателю (3) не совсем корректно, поскольку численность населения в ОТЕ различна. Показатель (1), выраженный в процентах, позволяет сравнивать ОТЕ без проведения дополнительных процедур (например, нормировки, о которой будет сказано ниже).
Различные виды расстояний между ОТЕ, во-первых, позволяют сформировать различные матрицы близостей ОТЕ-ОТЕ для географического и признакового пространств. Кроме того, на их основе строятся расстояния между классами и функционалы качества классификации.
Расстояние между ОТЕ в географическом пространстве обозначим символом g, в признаковом пространстве — символом d.

Формула (доступно при скачивании полной версии книги)

Расчет расстояний между ОТЕ в географическом пространстве.
Задание расстояния в географическом пространстве должно быть содержательно интерпретируемым. Например, для ОТЕ точечного (городов и др.) и полигонального (административно-территориальных единиц, ландшафтов) типов на практике используют следующие виды расстояний.
1. ОТЕ точечного типа.
1.1. Кратчайшее расстояние g1• между двумя точками в двумерном евклидовом пространстве.
1.2. Кратчайшее расстояние g2• между точками, вычисленное по графу (или нескольким графам) дорожной сети (автомобильные и железные дороги, морские и воздушные пути) с учетом стоимости перемещения по каждому виду дорожной сети и каждому ее участку.
1.3. Географическая смежность точек g3•. Для формирования расстояния типа смежности для ОТЕ точечного типа необходимо задаться некоторым порогом с е R+ = (0, +оо) и, например, расстоянием типа g1•:

Формула (доступно при скачивании полной версии книги)

2. ОТЕ полигонального типа.
2.1. Любой вид расстояния между двумя представительными точками ОТЕ-полигона (например, столица региона, геометрический центр региона и т.д.), т.е.

Формула (доступно при скачивании полной версии книги)

2.2. Кратчайшее расстояние g4• между ОТЕ-полигонами (т.е. минимальное евклидово расстояние между любыми двумя точками ОТЕ-полигонов).
2.3. Географическая смежность полигонов.

Скачать полную версию учебника (с рисунками, формулами, картами, схемами и таблицами) одним файлом в формате MS Office Word Скачать книгу