Тикунов В. С. Геоинформатика. Базы данных и управление ими. Проектирование географических баз и банков данных.

Скачать полную версию учебника (с рисунками, формулами, картами, схемами и таблицами) одним файлом в формате MS Office Word Скачать книгу

2.1.4. Базы данных и управление ими

Совокупность цифровых данных о пространственных объектах образует множество пространственных данных и составляет содержание баз географических данных, определяет принципы построения информационного обеспечения ГИС.

Анализ общего состава данных необходим уже на этапе проектирования ГИС и требует ответа, по крайней мере, на ряд основных вопросов:
— имеется ли возможность сбора, хранения и обновления географических данных?
— каковы ожидаемые объемы данных и их форматы?
— какой объем данных необходимо преобразовать в цифровую форму, сколько времени это займет и сколько будет стоить?
— каковы качество и надежность данных?
— какого рода затруднения могут возникнуть при обработке собранных данных?

Проектирование географических баз и банков данных. Выявление географических объектов и явлений и последующий выбор адекватного представления данных о них являются составной частью процесса, именуемого проектированием базы данных (БД).
В ГИС пользователь рассматривает реальный мир через призму тематической базы данных. Измерения и выборки, содержащиеся в базе данных, должны как можно полнее и точнее соответствовать предмету исследования и его основным характеристикам. Представление данных должно учитывать типы их возможных преобразований. К созданию БД ГИС предъявляются высокие требования, связанные с пространственной формой организации и представления данных [И.К.Лурье, 2002].

Требования к базе данных. База данных должна быть:
• согласованной по времени — хранящиеся в ней количественные данные должны соответствовать определенному времени, быть актуальными;
• полной, достаточно подробной для предполагаемого создания ГИС или картографического произведения; категории данных и их подразделения должны включать все необходимые сведения для осуществления анализа или математико-картографического моделирования исследуемого объекта или явления;
• позиционно точной, абсолютно совместимой с другими данными, которые могут добавляться в нее;
• достоверной, правильно отражающей характер явлений, для этого необходимо четко определить включенные в нее атрибуты явлений;
• легко обновляемой;
• доступной для любых пользователей.

Проектирование базы данных. В процессе проектирования БД обычно выделяют три основных уровня: концептуальный, логический и физический.
Концептуальный уровень не зависит от имеющихся аппаратных и программных средств. Для БД ГИС он связан с концептуальной Моделью географических данных и включает: описание и определение рассматриваемых объектов; установление способа представления географических объектов в базе данных; выбор базовых типов пространственных объектов — точки, линии, ареалы, ячейки Растра; решение вопроса о способе представления размерности и взаимосвязей реального мира в БД (например, следует ли показать здание в виде ареала или точки). На концептуальном уровне определяется и содержание базы данных, в свою очередь определяемое сутью явления, характером его пространственного распространения и задачами, для которых создается БД. Здесь следует выделить задачи создания одной или серии карт, комплексного картографирования, создания синтетических карт для многоцелевого и многократного использования.
Логический уровень определяется имеющимися программными средствами и практически не зависит от технического обеспечения. Он включает разработку логической структуры элементов базы данных в соответствии с системой управления базами данных (СУБД), используемой в программном обеспечении. Наиболее распространенными логическими структурами — моделями БД и их СУБД — являются иерархическая, сетевая, реляционная (рис. 16).

Рис. 16. Модели баз данных: а — иерархическая; б — сетевая; в — реляционная (доступно при скачивании полной версии книги)

В иерархической модели (рис. 16, а) записи данных образуют древовидную структуру, при этом каждая запись связана только с одной записью, находящейся на более высоком уровне. Доступ к любой записи осуществляется по строго определенным «веткам» и узлам такого дерева. Иерархические модели хорошо подходят для задач с явно выраженной иерархически соподчиненной структурой информации и запросов. Они обладают низким быстродействием, трудно модифицируемы, но эффективны с точки зрения организации машинной памяти.
В сетевых моделях (рис. 16, б) каждая запись в каждом из узлов сети может быть связана с несколькими другими узлами; кроме данных записи содержат указатели, определяющие местоположение других записей, связанных с ними. Такие модели очень трудно редактировать, например удалять записи, так как вместе с данными нужно редактировать и указатели. Подобные модели хорошо работают в случае решения сетевых, коммуникационных задач.
В иерархической и сетевой моделях для поиска конкретной записи необходимо вначале определить путь доступа к записи, а затем просмотреть все записи, находящиеся на этом пути.
Реляционные СУБД завоевали самую широкую популярность. Они свободны от всех ограничений, связанных с организацией хранения данных и спецификой запоминающих устройств. Эти модели имеют табличную структуру (рис. 16, в): строки таблицы соответствуют одной записи сведений об объекте, а столбцы — поля — содержат однотипные характеристики всех объектов. Всевозможные способы индексации данных существенно сокращают время поиска и запроса к данным. К числу наиболее известных СУБД реляционного типа относятся dBASE, Clipper, Foxbase, Paradox, ORACLE (последняя особенно подходит для больших объемов данных).
Физический уровень связан с аппаратными и программными средствами. На этом уровне определяются объемы хранимой в БД информации и необходимые объемы памяти компьютера (оперативной и долговременной), рассматриваются вопросы о структурировании файлов на диске или других носителях информации для обеспечения программного доступа к ним, представления данных в памяти компьютера (целые, действительные числа, байты или буквенно-цифровые характеристики).

Позиционная и атрибутивная составляющие данных. Пространственные данные, как упоминалось ранее, традиционно подразделяются на две взаимосвязанные составляющие — позиционные и непозиционные.
Позиционная составляющая характеризует положение географических объектов (или пространственную форму) в координатах двух- и трехмерного пространства — декартовых (x,y,z) или географических (фД).
Непозиционная составляющая данных включает качественную характеристику пространственных объектов (семантику) и статистику; эта информация называется атрибутивной и представляется в виде текстовых или числовых параметров. Она соответствует тематической форме данных или кодированному представлению взаимосвязей объектов (топологии). Почти всегда тип объекта маркируется и опознается по его атрибутивным параметрам (дорога имеет название и идентифицируется по ее классу — грунтовая, с асфальтобетонным покрытием). Обычно атрибутивная информация
не имеет пространственного характера, хотя некоторая ее часть может быть связана с пространственной природой изучаемого объекта, например, площадь, периметр.
В качестве атрибутивной информации часто выступает время (временная форма), которое может отражаться несколькими способами: указанием временного периода существования объектов, соотнесением информации с определенными моментами времени, указанием скорости движения объектов.
Количественные атрибуты создаются в соответствии с номинальными, порядковыми, интервальными или пропорциональными шкалами измерений. Важно знать, какие шкалы измерений использованы для данных, поскольку это определяет характер возможных математических операций с ними.
Как упоминалось ранее, составляющие пространственных данных кратко называют геометрией и атрибутами.

Скачать полную версию учебника (с рисунками, формулами, картами, схемами и таблицами) одним файлом в формате MS Office Word Скачать книгу