Скачать учебники

Тикунов В. С. Геоинформатика. Качество данных и контроль ошибок. Позиционная точность данных и типы ошибок.

Скачать полную версию учебника (с рисунками, формулами, картами, схемами и таблицами) одним файлом в формате MS Office Word Скачать книгу

Качество данных и контроль ошибок. Представления о качестве данных, их точности и оценке погрешности становятся чрезвычайно важными при создании баз и банков данных ГИС. Существует практически всеобщая тенденция забывать об ошибках в данных, если последние представлены в цифровой форме. Все пространственные данные до некоторой степени неточны, но в цифровой форме они обычно представляются с высокой точностью, определяемой параметрами памяти компьютера. Необходимо каждый раз рассматривать два вопроса:
— насколько правильно представляемые в БД цифровые структуры отражают реальный мир;
— насколько точно алгоритмы позволяют рассчитать истинное значение результата.

Методы расчета точности определений по картам рассматриваются в курсе картографии, с понятиями надежности и качества географических данных можно ознакомиться в работе [Б. Б. Сера-пинас, 1983]. Показатели качества данных определяются стандартами [И.К.Лурье, 2002]. Основные из них: позиционная точность и точность атрибутов объектов, а также логическая непротиворечивость, полнота, происхождение, относящиеся к базе данных в целом.

Позиционная точность данных и типы ошибок. Позиционная точность определяется как величина отклонения измерения данных о местоположении (обычно координат) от истинного значения. При ее определении, как правило, исходят из масштаба исследования или первичного материала, например в данных о природных ресурсах стремятся достичь точности карты заданного масштаба. Обеспечение большей точности требует более качественных исходных материалов, но всегда следует задаться вопросом, оправданны ли дополнительные затраты задачами исследования.
Точность координат определяется по-разному в растровом и векторном представлении.
Точность растра зависит от размера ячеек сетки. Для избежания потери информации можно использовать ячейки меньшего размера с тем, например, чтобы показать искусственные объекты, но следует оценить, что будет представлять из себя выбранная ячейка в заданном масштабе. В большинстве случаев неясно, относятся ли координаты, представленные в растровом формате, к центральной точке ячейки или к одному из ее углов; точность привязки, таким образом, составляет 1/2 ширины и высоты ячейки.
Координаты в векторном формате могут кодироваться с любой мыслимой степенью точности; она ограничивается возможностями внутреннего представления координат в памяти компьютера. Обычно для представления используется 8 или 16 десятичных знаков (одинарная или двойная точность), что соответствует ограничению по точности соответственно до 1/108 и 1/1016 измерения на Местности. Для получения такой же точности растра необходимо, соответственно, 108х108 или 1016х1016 ячеек, что невозможно даже при специальном сжатии данных. Но лишь некоторые классы данных соответствуют такой точности векторного представления: данные, полученные точной съемкой, карты небольших участков, составленные на основе крупномасштабных топографических карт; лишь для немногих природных явлений характерны четкие границы, которые можно представить в виде математически определенных линий. Поэтому можно утверждать, что тонкие линии в векторном формате дают ложное ощущение точности. Обычно на карте толщина линии отражает неопределенность положения объекта. Поэтому в векторной системе фиксируется неопределенность положения векторного объекта, а не точность координат. В растровой системе эта неопределенность автоматически выражается размером ячейки, который и дает действительное представление о точности.
Точность базы данных. Практически на каждом этапе создания БД возможно внесение ошибок.
Карты имеют погрешности, которые при цифровании автоматически переносятся в базу данных; из-за генерализации они не всегда точно фиксируют информацию о местоположении объекта; несоответствия на границах листов могут обусловить несоответствия в базе данных.
Ошибки характерны для данных, взятых из некартографических источников. Они могут появиться и при проведении инвентаризации по аэрофотоснимкам, если изображения дешифрированы неверно, часто возникают потому, что слишком велико доверие к базовым картам. Другие ошибки связаны с проблемой границ и погрешностями классификации. Многие ошибки обусловлены особенностями сбора данных. Ручной ввод цифровых данных весьма утомителен, и трудно сохранять необходимое качество работы на протяжении долгого времени.
Для снижения ошибок в измерении местоположения используют геодезический контроль и системы спутникового позиционирования, а также создание массивов данных географической привязки. К последним предъявляют особенно высокие требования по точности и достоверности еще на этапе сбора исходной информации. Их применение в качестве основы для интеграции данных в известных оригинальных масштабах и проекциях не вызывает затруднений. Во всех других случаях требуется преобразование информации, которое должно выполняться по правилам картографической генерализации и согласования.
Большая часть данных о местоположении объектов берется с аэроснимков, при этом точность зависит от правильного размещения контрольных точек. Данные космической съемки труднее расположить с большой точностью — не позволяет разрешение снимка.
На весь набор данных влияют: ошибки регистрации и определения контрольных точек, преобразования координат, особенно когда неизвестна проекция исходного документа; ошибки обработки данных, неправильный логический подход, генерализация и проблемы интерпретации; математические ошибки; потеря точности представления из-за невысокой точности вычислений; перевод векторных данных в растровый формат.
В БД обычно используются данные из разных источников с разной степенью точности. При наложении множества карт точность результирующего материала может оказаться очень низкой. Однако больший интерес представляет показатель пригодности полученной карты. Для некоторых типов операций степень пригодности карт определяется точностью наименее точного слоя БД. Показатель пригодности можно оценить также по его устойчивости при смене порядка ввода данных или изменении веса атрибута.
Часто возникают искусственные признаки ошибок (артефакты) — нежелательные последствия применения высокоточных процедур для обработки пространственных данных, имеющих небольшую точность. Использование растровых данных позволяет застраховаться от артефактов до тех пор, пока размер элемента растра больше или равен позиционной точности данных. При работе с векторными данными артефакты возникают при кодировании (цифровании) и наложении полигонов.
Чтобы проверить позиционную точность, нужно использовать независимый, более точный источник, например, карту более крупного масштаба, данные спутникового позиционирования, первичные («сырые») данные съемки. Для контроля можно использовать и внутренние признаки: незамкнутые полигоны, линии, проходящие выше или ниже узловых точек, и т. п. Величина этих погрешностей может служить мерой позиционной точности.
Наиболее надежным путем создания качественных БД, особенно для ее многократного и многопользовательского применения, является хранение информации о точности в самой БД в виде атрибутов или метаданных.

< Распределенные БД. Интегрированные и мультибазы данных. Объектно-ориентированные структуры БД.

Содержание книги "Тикунов В. С. Геоинформатика."

Точность атрибутивных данных. Логическая непротиворечивость, полнота, происхождение. Особенности интеграции разнотипных данных. >

Скачать полную версию учебника (с рисунками, формулами, картами, схемами и таблицами) одним файлом в формате MS Office Word Скачать книгу

При копировании информации обязательны прямые ссылки на сайт, а также на авторов книг.
Все книги являются собственностью их авторов и служат исключительно для ознакомления.
© Edu-Knigi.ru, 2011. © Дизайн и программирование от студии "ПСГ".