О некоторых аспектах железнодорожной геоинформатики (обзор)
Розенберг И.Н.
Дулин С.К.
Ключевые слова:
геоинформатика, географическая информация, географическая информационная система (ГИС), геоинформационное пространство, единая геоинформационная база данных, репозиторий геоданных, геоинтероперабельность, геоинформационный синтез, железнодорожный транспорт, железнодорожная инфраструктура
Введение
Геоинформатика - научная дисциплина, в сферу интересов которой входят природные, технические и социально-экономические пространственные системы, изучаемые посредством компьютерного моделирования локализуемых объектов и явлений [1].
Основные цели геоинформатики как науки - это визуализация, локализация и принятие решений относительно пространственных преобразований окружающей среды. Структура геоинформатики включает такие разделы, как геосистемное моделирование, пространственный анализ и собственно прикладная геоинформатика. Развитие технологий сбора, хранения, преобразования и обмена пространственно-временными данными привели к бурному развитию ГИС-технологий и появлению большому разнообразию промышленных географических информационных систем (ГИС), нацеленных на переработку геоданных с целью принятии обоснованных решений. В настоящее время геоинформатика во многих отраслях воспринимается как геоинформационная индустрия, подразумевающая наличие собственной аппаратуры, разработку коммерческих программных продуктов типа ГИС, штат опытных экспертов-аналитиков и организацию маркетинга.
Эффективное управление таким сложным территориально распределенным объектом как железная дорога невозможно без использования современных средств представления и обработки геоинформации. Основные преимущества геоинформационных баз данных: наглядное представление информации, удобный интерфейс, высокая степень интеграции текстовой и графической информации, - широко используются для представления схем и планов станций, схемы сети дорог, диспетчерских участков и регионов управления. Однако эффективность использования геоинформатики могла бы быть существенно повышена, если бы удалось, во-первых, интегрировать разрозненные геоинформационные ресурсы и создать единую геоинформационную базу данных, а во-вторых - увязать ее с параметрами работы и развития отрасли, получаемыми в результате функционирования других автоматизированных систем. Особый интерес вызывают вопросы, связанные с формированием и сопровождением интегрированной базы геоданных при решении задач мониторинга, характеризующихся необходимостью оперативной обработки поступающих данных и обусловленной ими реструктуризации базы геоданных.
В настоящее время накоплен большой объем геоинформационных ресурсов различного назначения, служащих для выполнения разного рода задач управления. Это электронная схема сети железных дорог Российской Федерации и стран Содружества; схемы отдельных дорог с нанесенными на них объектами, привязанными к станциям и перегонам; схемы железнодорожных узлов, схемы диспетчерских участков, масштабные и немасштабные схемы станций.
Кроме того, в рамках опытного внедрения созданы геоинфор-мационные базы данных крупных водно-транспортных узлов, схем перспективного развития станций, масштабных планов крупных станций с расположенными на них объектами инфраструктуры различных хозяйств, масштабных планов полосы отвода с точным указанием границ земельных участков и объектами недвижимости. Повышение эффективности использования геоинформационных ресурсов возможно путем создания геоинформационного портала с возможностью облачного хранения геоинформационных ресурсов. В состав геоинформационного портала отрасли должны входить функции, позволяющие осуществлять поиск требуемого геоинформационного ресурса по его текстовому описанию, формирование заявки на подключение к ресурсу, администрирование и актуализация каталога геоинформационных ресурсов отрасли. Реализация геоинформаци-онного портала отрасли позволяет:
а) Рассматривать все виды геоинформационных ресурсов отрасли во взаимосвязи. Это означает, что все виды графической пространственной информации будут представлять собой некоторую иерархию в соответствии с масштабами (абсолютными или условными), в которых они представлены. С увеличением масштаба детальность карт, планов и схем возрастает, а площадь охватываемой территории уменьшается. То есть, для получения общей картины необходимо использовать изображения в минимальных масштабах, и, наоборот, для детального анализа расположения объектов, например, на станции - планы достаточно больших масштабов. Кроме того, в пределах одного уровня масштабности представляются слои с различным набором типов объектов и создаются специальные тематические виды, например, для показа взаимного расположения объектов различных служб. В условиях разрозненных геоинформационных ресурсов такое решение не представляется возможным.
б) Оперативно получать графическую информацию необходимого вида и содержания. На текущий момент в отрасли в качестве типовых уже используются геоинформационные ресурсы. В их состав входят: общая схема сети железных дорог, схемы железных дорог, схемы диспетчерских участков, схемы станций. Определен состав объектов и перечень условных обозначений для типовых геоин-формационных ресурсов. Разработаны технологии и регламенты их актуализации. Однако в процессе анализа и принятия решений руководство отрасли зачастую использует и другую графическую информацию, например, схемы транспортных коридоров, схемы развития водно-транспортных узлов, схемы крупных железнодорожных узлов, и т.п. [2]. Необходимо сформулировать требования к виду, масштабу, составу объектов и их условным обозначениям для каждого из таких ресурсов, разработать технологию и регламент их корректировки и актуализации, определить должностное лицо, отвечающее за правильность информации.
Для выполнения действий по созданию, ведению и использованию интегрированной геоинформационной базы данных отрасли необходимо специальное программное обеспечение, опирающееся на типовые функции ГИС.
Специализированные графические и текстовые редакторы и анализаторы обеспечивают проверку правильности ввода текстовой и графической информации и максимально автоматизируют работы по ведению графических данных.
Программные интерфейсы интеграции данных геоинформаци-онных баз с другими автоматизированными системами для обеспечения увязки с параметрами работы и развития ОАО «РЖД». Для их реализации необходим анализ информационных потоков и разработка принципов совместного использования интегрированной геоинформационной базы данных с другими автоматизированными отраслевыми системами с целью решения задач стратегического мониторинга, оптимизации инвестиционной деятельности, прогнозирования работы отрасли.
Перечисленные программные средства практически обеспечивают функции мониторинга геоинформационных ресурсов
Современные системы управления геоинформационными ресурсами воплотили в себе комплексные технологические решения, направленные на поддержку различных этапов формирования и использования корпоративных данных и знаний. На каждом из этих этапов решаются самостоятельные задачи, однако, важнейшими среди них являются задачи, связанные с мониторингом.
В общем случае задача мониторинга заключается в перманентном сборе из различных источников необходимой информации, ее аналитической обработке экспертами и выработке на основе этого соответствующих решений. Условно, задачи мониторинга можно разделить на два класса: внутренний и внешний мониторинг.
Первый класс задач связан в большей степени с мониторингом внутренних параметров деятельности, например, с постоянным контролем за функционированием сложного оборудования, использованием собственных ресурсов и пр. В качестве примера можно привести сложные системы управления электростанциями, системы обеспечения транспортных перевозок и т.д. Характерной особенностью таких задач можно считать относительно постоянный набор параметров, по которым оценивается текущее состояние производственного или иного процесса (физические параметры оборудования и пр.).
Внешний мониторинг, в отличие от внутреннего, в большей степени связан с оценкой состояния внешней среды и внешних условий, в которых осуществляется деятельность компании. В качестве примера такого мониторинга можно привести анализ предоставления транспортных услуг в зависимости условий поставки энергоносителей, специфики регионов, сезонных ограничений. Характерной особенностью таких задач является то, что оцениваемые параметры не носят четко формализованный характер с одной стороны, а с другой - состав этих параметров может постоянно изменяться, что требует от специалистов-аналитиков реорганизации своих знаний в соответствии с новыми условиями. В задачах внешнего мониторинга особые требования должны предъявляться к информационным источникам, используемым экспертами для локализации необходимых им знаний и данных.
Современное развитие информационных технологий позволяет успешно представлять данные и знания о реальном пространственном местоположении тех или иных объектов. Информационное взаимодействие с указанным представлением обеспечивают ГИС. Первоначально они получили широкое распространение в областях, напрямую связанных с географией, геодезией и картографией, однако в дальнейшем, преимущества полноценной информационной модели с реальной привязкой к местоположению объектов стимулировали распространение ГИС в широкий спектр областей применения. В настоящее время ГИС уже можно рассматривать как необходимый инструмент при оценке, анализе и принятии решений в широком круге аспектов человеческой деятельности [1].
Основой современных ГИС являются пространственные базы данных или базы геоданных (БГД), содержащие в себе векторную и растровую картографическую информацию и ассоциированные с ними атрибутивные (семантические) данные. Технология построения картографических серверов, предоставляющих своим пользователям возможности динамического доступа и анализа геоинформационных данных, превратилась в отдельную отрасль симбиоза WEB-индустрии и ГИС.
Основным вопросом реализации ГИС является выбор модели представления и отображения геоданных на существующие системы управления базами данных, т.е. практически речь идет о размещении геоданных в среде какой-либо SQL-подобной СУБД, а именно: SQL-сервер, Oracle, DB2, Informix, Sybase. Помимо атрибутивной информации, с размещением которой в реляционной БД проблем не может быть, БГД содержит еще и географические данные в четырех представлениях [1], требующие специальных методов и приемов для их отображения в реляционной среде:
- • векторные данные для представления пространственных объектов,
- • растровые данные для представления непрерывных полутоновых изображений, сеточных тематических данных и поверхностей,
- • нерегулярные триангуляционные сети (TINs) для представления поверхностей,
- • адреса и локаторы (locators) для нахождения географического положения.
Топологические отношения геообъектов
При размещении геоданных особый интерес вызывает проблема группируемости данных в наборы, классы, категории, проекты и другие классификации, соответствующие однородности (достаточной близости) геоданных, дающей основание для помещения их в одну и ту же таблицу. Если атрибутивные данные из одной таблицы можно рассматривать как класс эквивалентности экземпляров одного логического типа с точностью до перечисления списка атрибутов, то с геоданными все выглядит не так просто. Набор «похожих» пространственных объектов, таких как участки или реки, хранится в таблице и называется классом объектов. Наборы связанных классов объектов, имеющих одинаковую пространственную привязку, могут быть организованы в более крупную структуру, называемую набором классов объектов. Каждый пространственный объект в базе геоданных содержит форму (геометрию) и может участвовать в топологических отношениях. Способность хранения геометрии объекта является одним из обязательных условий существования БГД, поскольку каждый пространственный объект всегда должен быть доступен для отображения и анализа.
Что касается отношений, то помимо типичных (общих) для реляционной БД «родо-видовых» отношений или отношений типа «часть-целое» необходимо позаботиться об отображении топологических (соединение, узел пересечения и др.) и пространственных (касание, внутри, снаружи и др.) отношений. Можно заметить, что в действительности пространственные отношения могут быть представлены в рамках реализации топологических отношений заданием соответствующей топологии.
Обеспечивающие функционирование ГИС объекты в БГД хранятся в связанных реляционных таблицах. Часть из этих таблиц содержат атрибутивные данные, другие - представляют собой группировки пространственных объектов. Специальные таблицы задают отношения между пространственными объектами, правила проверки корректности и домены атрибутов.
Большинство реальных географических объектов, имеющих четкие очертания, целесообразно моделировать с помощью векторного представления. Векторные данные описывают форму пространственных объектов в виде упорядоченного набора координат с ассоциированными атрибутами. Такое представление поддерживает некоторые геометрические операции, среди которых расчет длины или площади, идентификация перекрытий и пересечений с другими объектами, нахождения смежных или находящихся поблизости пространственных объектов.
Векторные объекты принято классифицировать по их размерности следующим образом [1]:
• Точки являются фигурами без измерений, они представляют географические объекты, которые слишком малы, так что можно пренебречь их размерами. Каждая точка хранится как одна пара координат (х, у) и набор атрибутов.
• Линии являются фигурами с одним измерением, они представляют географические объекты, размеры которых существенны только в одном измерении. Каждая линия хранится как упорядоченный набор пар координат (х, у) и набор атрибутов. Сегменты линий могут быть прямыми, округлыми, эллиптическими или сплайновыми.
• Полигоны являются фигурами с двумя измерениями, они представляют площадные географические объекты. Каждый полигон хранится как набор сегментов, образующих его границу.
• Есть еще один тип, который условно можно отнести к векторным данным, - это надпись (аннотация). Надписи являются описаниями, которые связаны с пространственными объектами и отображают названия или атрибуты.
• Векторные данные в базе геоданных обладают структурой, которая управляет хранением пространственных объектов в соответствии с их размерностью и отношениями.
• Фоновые изображения, объекты с размытыми очертаниями и оригиналы результатов съемок, напротив, целесообразно поддерживать в растровой (сеточной) форме в виде пиксельных значений на двухмерной сетке, называемой растром.
При необходимости отображения физических рельефов с присущей им трехмерностью используется нерегулярная триангуляционная сеть (TIN), являющаяся по сути моделью поверхности. База геоданных хранит TIN в виде интегрированного набора узлов с их значениями высоты и треугольников со сторонами, соединяющими узлы. Высоту можно интерполировать для любой точки в пределах географического экстента (области простирания) TIN. Модель данных TIN позволяет выполнять различные виды анализа поверхности, оценку видимости произвольных точек поверхности из заданной точки наблюдения др.
Из вышеперечисленного только векторные объекты могут использоваться как самостоятельные субъекты, участвующие в топологических отношениях. Растры и TIN, подобно рисункам или другим OLE-объектам, участвуют в организации БД как внедренные и обрабатываются специальными приложениями.
Очень важным и достаточно принципиальным моментом является выбор одной из трех вышеперечисленных категорий, к которой следует причислять векторный объект.
Во-первых, векторный объект обязан своим появлением процедуре векторизации некоторой части растрового изображения. Соответственно, его характеристики напрямую зависят от выбранных параметров этой процедуры.
Во-вторых, вопрос о возможности пренебрежения размерами векторного объекта решается в зависимости от условий поставленной задачи. Так, имеющий все основания считаться площадным объект «станция» при укрупнении детализации рассмотрения (генерализации) может перейти в категорию точечного объекта, а при дальнейшем агрегировании параметров задачи просто исчезнуть из рассмотрения как несущественный фактор, находящийся внутри диапазона выбранной точности. Это не означает, что он исключается из БГД, но в рамках данного рассмотрения в категории точечных объектов его нет. Таким образом, мы подходим к необходимости динамического формирования категорий векторных объектов в зависимости от условий взаимодействия с проблемной средой и поставленной задачи.
От принадлежности к определенной категории зависит участие векторного объекта в топологических отношениях. Топология, устанавливающая топологические отношения между географическими объектами, делает возможным проведение расширенного пространственного анализа и играет фундаментальную роль в обеспечении качества БГД.
В настоящий момент можно указать следующие базовые типы топологий [1]:
■
Линейно-узловая топология
(Линейные объекты могут иметь общие конечные точки).
■
Полигональная топология
(Площадные объекты могут иметь общие границы).
■
Топология маршрутов
(Линейные объекты могут иметь общие сегменты).
■
Топология регионов
(Площадные объекты могут перекрываться).
■
Узловая топология
(Линейные объекты могут иметь общие конечные вершины).
■
Точечные события
(Вершины линейных объектов могут совпадать с точечными объектами).
В одних и тех же топологических взаимоотношениях могут участвовать несколько классов полигональных, точечных и линейных объектов. В современных ГИС пользователи могут устанавливать, какие топологии являются подходящими для соответствующих слоев данных. Топология обычно реализуется в виде набора правил целостности, определяющих поведение пространственно взаимосвязанных геоданных и объектных классов. Топологические правила могут быть заданы для объектов внутри объектного класса или для объектов, принадлежащих двум или более объектным классам. Они позволяют моделировать пространственные отношения связности, смежности, близости и совпадения, а также контролировать целостность совпадающей геометрии у различных классов объектов. Для этого в ГИС входят инструментальные средства, интерпретирующие пространственные условия и обеспечивающие поиск и исправление любых нарушений этих правил.
Все процедуры установления топологических отношений и группировки геоданных в существующих ГИС предназначены для использования специалистом в процессе настройки ГИС на решение определенного класса задач. Для реализации в ГИС автоматической адаптации к изменению параметров взаимодействия пользователя с предметной областью нужен принципиально новый инструмент поддержки согласованности структуры топологических отношений и группируемости в динамическом режиме.
Об онтологическом статусе изображений. Онтологии и пространственные типы данных
Изображения как образы сканированных пространственных объектов - один из самых распространенных источников пространственных данных, доступных в настоящее время для исследователей, которые интересуются крупномасштабными географическими явлениями. Однако, несмотря на большой накопленный опыт сбора, обработки и анализа данных и широкое применение изображений поверхности Земли, онтологический статус таких изображений остается открытой проблемой. Удивительно, но не всегда просто ответить на элементарный вопрос: «Что находится на изображении земной поверхности?» или перефразировать тот же самый вопрос по-другому, «Что является онтологическим статусом информационного содержания изображений, полученных в результате дистанционного сканирования или фотосъемки поверхности Земли?»
Наиболее широко принятая концептуальная модель данных для пространственной информации предполагает, что географическая действительность представлена или как полностью определимые сущности (объекты) или как непрерывное пространственное изменение (область, поле) [1]. Модель объекта представляет мир как поверхность, занятую дискретными объектами с геометрическим представлением и описательными признаками. Модель на основе парадигмы поля представляет географическую действительность как ряд пространственных распределений в географическом пространстве. Хотя эта простая дихотомия была неоднократно подвергнута критике, она оказалась полезной системой взглядов и была принята с некоторыми уточнениями при проектировании существующих технологий географических информационных систем.
Дихотомия объекта с непрерывными характеристиками - характерное географическое понятие, не предназначенное, тем не менее, обеспечивать поддержку специфики семантики различных типов пространственных данных. Этот недостаток заставил многих исследователей перенести акцент на использование онтологий как средства диссеминации знаний в группах пользователей с различными интересами, тем самым улучшая функциональную совместимость с различными базами геоданных [2].
Онтология в информатике, согласно современным толкованиям, является «точной спецификацией концептуализации предметной области», но с определенными ограничениями в зависимости от области интересов, и должна включать словарь терминов и некоторые спецификации их значений. Использование онтологий способствует созданию адекватных концептуальных моделей, обеспечивая качественное, контролируемое информационное интегрирование.
Онтологии - содержательные теории, которые включают общий набор распространяемых фактов, чье основное назначение - идентифицировать определенные классы объектов и отношений, которые существуют в некоторой части предметной области. Таким образом, неформально определенные онтологии - это соглашения об общедоступной концептуализации. Формальное определение основывалось бы на том, что онтология является (возможно неполной) аксиоматизацией возможных прикладных моделей [3].
Следует заметить, что специфика географического мира в достаточной мере определяет параметры создания онтологий. Чтобы адекватно представлять географический мир, необходимо иметь компьютерные представления географических знаний (в первую очередь - изображений), которые способны фиксировать не только описательные атрибуты пользовательских концепций, но также и описывать геометрические и позиционные компоненты этих концепций. Эти представления также должны фиксировать пространственные и временные зависимости между экземплярами этих концепций. В отличие от случая обычных информационных систем, большинство пространственных и временных зависимостей не представлены в ГИС и чаще всего могут просто выводиться путем использования различных географических функций. Поэтому обязательно должна быть привнесена дополнительная семантика в схему географического приложения, семантические спецификации которой, являющиеся частью онтологии этого приложения, зафиксированы разработчиком модели. Новое поколение информационных систем должно обладать способностью обрабатывать семантическую неоднородность, возникающую в результате использования разнородных источников информации.
Онтология играет существенную роль в создании ГИС, так как она позволяет устанавливать соответствия и взаимосвязи среди различных типов геоданных - пространственных сущностей и отношений. Использование онтологий будет способствовать улучшению функционирования информационных систем, благодаря тому, что удастся избежать проблем, вызванных противоречиями между онтологиями, неявно внедренными в ГИС, конфликтами между онтологическими концепциями и реализацией, и конфликтами между онтологиями «здравого смысла» пользователя и математическими концепциями программного обеспечения.
Ниже онтологии классифицированы согласно их зависимости от специфики задачи или точки зрения пользователя [3]:
- • Онтологии верхнего уровня описывают обобщенные понятия. В [3] онтология верхнего уровня описывает обобщенное понятие пространства. Например, теория, описывающая части и целое и их отношение к топологии, названная мереотопологи-ей, также относится к этому уровню.
- • Онтологии типов геоданных описывают словарь, связанный с групповым доменом концепций геоданных типа дистанционного восприятия перегона или железнодорожной станции.
- • Онтологии задачи описывают задачу или действие типа интерпретации изображения или оценки вредного воздействия.
- • Прикладные онтологии описывают концепции, зависящие как от типов геоданных, так и от задачи, и обычно являются их специализацией. Они представляют собой потребности пользователя относительно специфики приложения.
Можно заметить, что существующие концептуальные схемы баз геоданных могут быть весьма полезны для формирования онтологий, так как они - формальные документы, которые были разработаны, чтобы зафиксировать взгляд специалиста на некоторую предметную область реального мира. Существующие концептуальные схемы могут, поэтому, использоваться, чтобы создать приблизительные онтологии, в то время как существующие онтологии могут использоваться, чтобы генерировать концептуальные схемы, с помощью или без помощи опытного разработчика модели (рис. 1).
Имеются три различных уровня абстракций, на которых находятся как онтологии, так и концептуальные схемы (рис. 2).
Первый уровень - формальный, на котором в конструкции онтологий и концептуальных схем включены абстрактные концепции. В случае онтологий на этом уровне мы имеем абстракции формальных особенностей сущностей, такие, как понятия времени и пространства. В случае концептуальных схем, на этом уровне мы находим основные идеи, взятые из концептуальных моделей данных, то есть, понятия, которые широко используются в концептуальном моделировании данных: объекты, поля и связи.
Когда мы сопоставляем содержание формального уровня с географическими приложениями, мы получаем второй уровень абстракции, или уровень типов геоданных. На этом уровне, онтологии описывают словарь, который используется, чтобы представить действительное содержание знания о свойствах геоданных. Онтология географических понятий, которая описывает географическое пространство, географические объекты, и явления географического пространства, явно присутствует на этом уровне.
На прикладном уровне, онтологии более конкретны, являясь уточнением специализаций уровня типов геоданных, и формируются в соответствии с концепциями поля знания, заданного приложением. На этом уровне онтология - это способ осмысления набора концепций, позволяющего совместно и согласованно использовать его группой пользователей. В концептуальном моделировании данных на прикладном уровне примитивы концептуальной модели объединены, чтобы образовать удобочитаемые диаграммы, из которых можно получить детальные потребности приложения по организации данных. Тем самым, примитивы модели данных используются, чтобы определить концептуальную схему приложения, перемещаясь от уровня типов геоданных до прикладного уровня.
Представление пользовательских онтологий прикладной области, в этом контексте, рассматривается как существенная часть фиксации концепций информационного пространства [4]. Исследование онтологического статуса пространственных типов данных - наиболее актуальное направление в геоинформатике. В [2] было введено понятие географической информационной системы, управляемой онтологиями (ODGIS), призванной обеспечивать пользователей географической информации возможностью достигнуть соглашения по основным сущностям географического мира. Идея управления с помощью онтологий заключается в том, что существенная часть географического знания зафиксирована процедурами, которые извлекают информацию из пространственных наборов данных. То есть, для этого необходимо создать онтологии не только для объектов некоторой области, но также и для намеченных действий, которые выражены процедурами, применимыми к набору данных, предназначенному для извлечения знания. ODGIS - это структура, в которой онтологии различных пользовательских интересов могут быть скомбинированы, приводя к интеграции различных источников географической информации.
Простота растрового представления безусловно помогла в развитии теории алгоритмов обработки изображения, основанных исключительно на геометрических свойствах изображений. Однако, концепция изображений как строгой специализации именно полей неадекватна для отражения полноты их информационного содержания. Есть фундаментальное различие между цифровыми ландшафтными моделями и изображениями как представлениями непрерывных явлений. Большинство моделей ландшафта получено или из представлений на основе парадигмы поля в результате испытаний и тестов (как в случае экологических исследований), или в результате сбора стандартизированных данных некоторого мероприятия (как в воздушной фотограмметрии). Процесс измерения непосредственно зависит от онтологической привязки, сделанной исследователем априорно, так как собранные значения должны характеризовать интересующие исследователя явления (например, характеристики грунта под железнодорожным полотном).
Таким образом, существует два различных (и дополняющих друг друга) подхода к онтологическому описанию изображений, полученных в результате дистанционного сканирования или фотосъемки. Следует заметить, что ни один из них по отдельности не является достаточным, чтобы поддерживать полный процесс представления знания для данных изображения. Основная причина этого в том, что изображения имеют двойную природу: изображения - это, с одной стороны, поля на уровне измерения, но, с другой стороны, - набор типовых объектов - на уровне классификации. Поэтому, можно говорить о дуализме изображения: распознавая объекты на изображении, мы фактически измеряем части непрерывного поля. Чтобы принять во внимание этот дуализм, необходимо более полное понимание роли изображения как источника географической информации.
Как следует из вышесказанного, изображения имеют собственное онтологическое описание, отличное и независимое от онтологии прикладной области, которую специалисты используют, чтобы извлечь информацию из изображений (рис. 3).
Онтологическое описание изображений зависит от процедуры измерения. Оно имеет три различных, но взаимодействующих компонента:
-
Физическая онтология, которая описывает физический процесс создания изображения. Здесь мы интересуемся выражением знания об отношении между энергией, отраженной поверхностью Земли и измерениями, полученными сенсорным датчиком. Типичными понятиями здесь являются спектральный отраженный сигнал и обратное рассеяние.
-
Структурная онтология, включающая геометрические, функциональные и описательные структуры, которые могут быть получены на основе анализа изображения посредством методов извлечения специфических особенностей, сегментации и классификации. Типичными понятиями для этой онтологии являются такие геометрические объекты как линии и зоны и функциональные описания типа кривой спектрального отраженного сигнала, оптического потока, и градиента интенсивности света.
-
Онтология метода, состоящая из набора алгоритмов и структур данных, которые представляют многократно используемое знание в форме методов обработки изображения. Эти методы могут быть использованы, чтобы преобразовать изображение физического уровня (например, фильтруя или улучшая его) или выполнить выделение признаков и классификацию.
Алгоритмы, которые являются частью онтологии метода, выполняют преобразования данных физического уровня до структурного уровня, так что этот процесс можно назвать структурной идентификацией. Будучи примененным к изображению (или ряду изображений), этот процесс приводит к набору структур, строго связанных со свойствами устройства измерения и его взаимодействием с физическим ландшафтом.
Изображения имеют независимый от наблюдателя онтологический статус, поэтому процедуры извлечения знания из изображений требуют семантического интерфейса, который устанавливает соответствие между базовыми понятиями в прикладной онтологии (используемой прикладным исследователем) и понятиями феноменологической онтологии (которая описывает как изображение представляет реальный мир). Проведение четкого различия между изображением и пользовательскими онтологиями позволяет обеспечить два ключевых момента: (1) поддержку множественных представлений для одного и того же изображения; и (2) использование изображений для обнаружения пространственно-временных конфигураций географических явлений.
О согласованности данных. Пространственный контекст согласованности
В любой информационной системе надежность результатов запросов, анализа или рассуждения, зависит от согласованности данных. В географических информационных системах, где управление качеством геоданных зависит от пространственных особенностей объектов, проблема согласованности приобретает дополнительные сложности.
Качество данных - ключевой вопрос любой информационной системы. В географической информационной системе (ГИС) геометрические особенности геоданных определяют формирование комплекса управления качеством геоданных. Комиссией пространственного качества данных ICA [5] были определены семь компонентов пространственного качества геоданных: происхождение, позиционная точность, атрибутивная точность, завершенность, логичность [6], семантическая точность [7] и временная зависимость.
Обратим здесь основное внимание на логическую согласованность и семантические аспекты точности представления геоданных.
Независимо от источников геоданных (оцифровка карты, аэрофотосъемка или данные системы GPS) получающиеся географические наборы данных должны быть непротиворечивыми, чтобы использоваться в процессе пространственного анализа и гарантировать надежность решений, основанных на геоданных (например, при городском планировании).
Однако во многих существующих наборах геоданных ощущается нехватка геометрического и топологического структурирования, что неизбежно приводит к ошибкам, не обеспечивая должным образом надежность результатов запросов, анализа или рассуждения.
Ниже используется понятие топо-семантической согласованности, которая является частью логической согласованности, определенной в [6]. Топо-семантическая согласованность касается правильности топологических отношений между двумя объектами согласно их семантике. Например, здание в другом здании - это, конечно, ошибка, тогда как здание на участке земли - не ошибка, хотя в обоих случаях используется отношение «многоугольник в многоугольнике». Поэтому использование семантики, присущей каждому объекту, обязательно, чтобы обеспечить корректность каждого отношения.
Существующие наборы геоданных содержат ошибки (и особенно ошибки, не видимые в рабочем масштабе), которые не нарушают визуализацию, но препятствуют или делает вообще невозможным проведение пространственного анализа. Более того, пространственным моделям геоданных ГИС недостает структуризации, чтобы обеспечить пространственный анализ. Таким образом, методология проверки и коррекции согласованности жизненно необходима для реализации пространственного анализа в базах геоданных.
Проверка пространственной согласованности требует разработки процедур обнаружения несогласованности и определения ошибок согласованности. Ошибка может иметь различные уровни последствий. Некоторые ошибки могут отключить процесс анализа и тем самым быть своевременно обнаруженными, тогда как другие ошибки могут привести к ошибочным конечным результатам. В этом случае трудно выяснить, надежен ли результат или нет.
Процессы сбора геоданных потенциально могут быть источниками ошибок. Некоторые из таких ошибок могут быть обнаружены прямой экспертизой геоданных, в то время как для обнаружения других видов ошибок необходимо принять во внимание семантику объектов.
Географическое информационное моделирование сопряжено с определенными проблемами, связанными с пространственными признаками геообъектов. Реальные объекты, типа зданий или озер характеризуются формой, местоположением, отношениями с другими объектами и семантикой. Форма и местоположение являются геометрическими признаками. В процессе моделирования географической информации в первую очередь следует обратить определенное внимание именно на эти два вида признаков. Наряду с геометрическими признаками объектов очень важны пространственные отношения. Пространственные отношения обычно группируются в три категории [7]:
- • топологические отношения, которые являются инвариантными при топологических преобразованиях рассматриваемых объектов,
- • метрические отношения в терминах расстояний и направлений,
- • отношения пространственного порядка, определяющие порядок между объектами в зависимости от точки наблюдения.
Проверка пространственной согласованности должна учитывать все особенности этих категорий. Цель проверки состоит в том, чтобы гарантировать, что геометрический объект и пространственные признаки геообъектов правильно обработаны базой геоданных. На рис. 4 показана схема метода проверки пространственной согласованности. Отправные точки - окружающая среда и база геоданных.
Список свойств объектов фиксируется на основе наблюдений окружающей среды и исследования наиболее используемых пространственных моделей геоданных. Выбирая свойства из этого списка согласно модели геоданных и качественным спецификациям базы геоданных, можно сформировать список свойств, необходимых для каждой ГИС. Сформированный список свойств используется для проверки геометрической согласованности набора геоданных.
Топологическое отношение между двумя сущностями основано на анализе общих частей их форм. Достоверность любого топологического отношения основана на семантике обоих сущностей. Именно поэтому ошибки, исходящие из недостоверных топологических отношений между объектами, называют топо-семантическими ошибками.
Топологические ограничения целостности основаны на топологическом отношении. Такие отношения описывают относительную позицию объектов в пространстве.
Структура на рис. 5 представляет связи между различными частями полнофункциональной ГИС, чтобы можно было проверять наборы геоданных и исправлять пространственные ошибки. Будем рассматривать две части: база геоданных, которая содержит всю информацию относительно описания реального мира и функциональные возможности ГИС, которая содержат ряд инструментальных средств доступа к данным и обработки наборов геоданных.
ГИС содержит инструментальные средства манипулирования базой геоданных. Целесообразно различать два вида инструментальных средств: инструментальные средства обработки, то есть процессы, которые вычисляют результаты запросов, анализа, вывода, и инструментальные средства интерфейса, которые обеспечивают конечного пользователя средствами формирования этих запросов. В нашем случае этот интерфейс содержит интерфейс определения топологических ограничений, интерфейс коррекции топологических ошибок, который предлагает все возможные исправления для каждой ошибки, и интерфейс коррекции геометрических ошибок. Уровень средств обработки содержит методы доступа к данным (которые зависят от структур геоданных), ведение журнала ошибок и процесс проверки топологических ограничений (трансляция ограничений и проверка).
Обработка геопространственной информации на базе репозитория ГИС
Резко возросшие объемы геоданных, обладающих гетерогенностью, обусловили необходимость использования репозитория как интегратора разнородных ресурсов ГИС и формулирование требований к архитектуре информационных ресурсов ГИС с участием репозитория.
Пространственные данные составляют ядро большинства ГИС и оказывают наибольшее влияние на многие процессы принятия решений при управлении объектами. Данные объектов железнодорожного транспорта всегда идентифицируются своим географическим местоположениям и пространственными отношениями, поэтому ГИС и пространственный анализ данных являются важнейшими средствами поддержки процессов управления объектами.
В большинстве реализаций ГИС до настоящего времени пространственные данные сохранялись и обрабатывались в персональных или ведомственных базах геоданных, которые ограничивали совместное использование и редактирование данных. Возрастающие требования к совместной обработке пространственных данных для различных приложений выявили острую потребность в масштабируемости ГИС и создании геоинформационного пространства [8]. Роль ГИС в поддержке развития интегрированных систем управления объектами может быть усилена на базе централизованного репозитория. Под репозиторием здесь понимается предметно-ориентированная информационная корпоративная база данных, специально разработанная для поддержки принятия решений. Репозиторий строится на базе клиент-серверной архитектуры, реляционной СУБД и утилит поддержки принятия решений.
Ключевой задачей совершенствования средств обработки геоин-формационного контента является создание геоинформационного пространства, позволяющего осуществить интеграцию пространственно-распределенной информации (семантической, метрической и топологической), с которой имеет дело ГИС, с данными высокоточного спутникового позиционирования, объединив их в единой геоинформационной базе данных отрасли. Это позволит представить все виды геоинформационных ресурсов отрасли в виде геореляцион-ных структур, рассматривать их во взаимосвязи и оперативно получать информацию необходимого вида и содержания.
Создание геоинформационного пространства с концептуальной точки зрения может быть разделено на два основных направления: • разработка принципов интеграции геопространственной информации на растровой и/или векторной основе с присоединенными базами фактографических данных, метаданных, данных высокоточного спутникового позиционирования, а также пространственно-определенной вербальной информации;
• разработка принципов и подходов к многоуровневому семантическому моделированию и согласованной интеграции геопространственной и пространственно-определенной вербальной информации с одновременным использованием электронных знаковых форм представления геотекстов, а также растровой и/или векторной формы их представления.
Геоинформационное пространство, интегрированное в прикладные геоинформационные и автоматизированные системы, способствует решению ряда задач, комплексно повышая уровень безопасности, бесперебойности и надежности функционирования железнодорожного транспорта.
Можно выделить три основных сегмента потребителей данных геоинформационного пространства. Первый сегмент - задачи проектирования, реконструкции и текущего содержания объектов. Второй сегмент - задачи управления процессами, базирующимися на различных технологиях, в том числе на технологиях спутниковых радионавигационных систем (СРНС). Третий сегмент функционирования геоинформационного пространства - обеспечение систем безопасности функционирования координатной информации, которая служит вторичным информационно-управляющим контуром систем.
Каждый из этих сегментов предполагает разработку специальных методов интеграции геоинформационных ресурсов, обеспечивающих поддержку технологий управления железнодорожным транспортом.
Актуализация геоинформационного пространства, поддерживаемого инструментальной средой ГИС, в современных условиях предполагает разработку и сопровождение централизованных репозиториев, основанных на интегрированных моделях данных. Эти модели данных описывают характеристики объектов инфраструктуры и результаты функционирования подсистем объектов, отражая тем самым различные аспекты жизненного цикла объектов (рис. 6). Репозиторий может потенциально улучшить эффективность, рентабельность и координацию различных процессов управления объектами [9].
Централизованный репозиторий данных об объектах на основе ГИС построен как внешний модуль реляционной СУБД и поэтому может обеспечить широкий диапазон совместного использования данных, интеграции и сервисов управления, типа управления версиями, многопользовательского параллельного доступа и редактирования, безопасности и авторизации, а также сервисов метаданных. Репозиторий должен гарантировать согласованность и целостность данных и объединить различные форматы данных во всестороннее и непротиворечивое представление всей системы инфраструктуры. Обеспечивая единственный вход для доступа ко всем данным объектов, репозиторий может значительно улучшить сбор, организацию, управление и распределение данных всюду по жизненному циклу объекта. Интерфейс ГИС с репозиторием расширит возможности пользователей, позволив точно определить свои требования, сделать запрос и проанализировать данные объектов в пространственном контексте.

Репозиторий может обеспечить поддержку управления взаимозависимыми подсистемами инфраструктуры транспортных сетей интегрированным способом. Этими подсистемами инфраструктуры обычно управляют сепарабельно, при этом данные хранятся в отдельных и, возможно, несовместимых базах данных. Централизованный репозиторий может поддерживать перекрестные ссылки и отношения между различными подсистемами инфраструктуры, обеспечивающими взаимодействие между со-расположенными или накладывающимися объектами. Различные рабочие группы при этом будут в состоянии объединиться на основе согласованного представления данных.
Репозиторий допускает функциональную совместимость и эффективное совместное использование данных несовместимыми подсистемами управления объектами. Репозиторий может также поддержать использование распределенных источников данных и обеспечить доступ к этим источникам локально или через Интернет/интранет (в доступной через сеть архитектуре клиент-сервер) распределенным приложениям-клиентам. Можно перечислить некоторые другие преимущества централизованных репозиториев:
- • эффективное хранение, индексация, запрос и анализ данных объекта с параллельным поиском и редактированием этих данных для множественных приложений;
- • поддержка координации и упрощение процессов управления объектами, увеличивающая операционную эффективность и расширяющая коммуникации между различными департаментами и заинтересованными пользователями;
- • возможность многократного совместного использования данных и, таким образом, устранение дублирования усилий, потенциальной несогласованности и избыточности при сборе, верификации и хранении данных об объектах;
- • использование согласованных, интегрированных и стандартизированных моделей данных и форматов;
- • легко выполнимая интеграция инструментальных средств программного обеспечения, предварительно сформированных в виде отдельных модулей, в единую инструментальную среду.

Репозиторий отличается от различных словарей данных, поддерживающих ГИС, которые являются файлами или наборами файлов, ориентированных на одно конкретное приложение. Интегрированная пространственная среда разработки программного обеспечения проиллюстрирована на рис. 7. Ключевой элемент в этой среде - репозиторий метаданных, который является средством контроля всех проектных изменений так же, как и репозиторий инструментальных средств разработки программного обеспечения в непространственных средах разработки.
Проблеме качества пространственных данных, связанной с ограничениями целостности, в последнее время уделяется большое внимание. Ограничения целостности структурируются, как показано на рис. 8. Они подразделяются соответственно трем типам возможных ошибок: структурным ошибкам, геометрическим ошибкам и топо-семантическим ошибкам. Топо-семантические ограничения подразделяются на семантические ограничения и определяемые пользователем ограничения целостности.
Рис. 9 иллюстрирует архитектуру предлагаемого репозитория. В качестве инструментальных средств можно использовать любой тип инструментальных средств, доступных в интегрированной среде разработки. Репозиторий управляет всем программным обеспечением в среде и представляет собой интерфейс между пользователем и инструментальными средствами.
Рис. 10 представляет концептуальную модель репозитория, который хранит данные на метауровне. При проектировании неявно предполагается, что геометрия может иметь много графических представлений. Визуализация спецификаций включена, чтобы позволить пользователю определить графические стили для объектов в ГИС, предполагая, что наличие визуальных команд вызова программы улучшило бы ясность относительно того, что собой представляют объекты, и таким образом уменьшило бы ошибку ввода данных. Это задача, которая непосредственно контролируется репозиторием. Для этого используются метаданные, касающиеся схематического изображения и использующиеся для генерации схемы, сохраняемой на том же самом метауровне.

Центральная часть изображения модели репозитория содержит основную информацию для представления сущности и ее отношений. Репозиторий обрабатывает проекты через отношение сущность - проект этой части модели. Все записи в базе геоданных отмечены идентификатором проекта посредством значения внешнего ключа в сущности. В рабочем режиме репозиторий должен использоваться для того, чтобы проекты совместно использовали допустимые правила. Но это требует дальнейшего развития модели, так как при этом требуется обработка отношений «многие к многим» между проектом и сущностью.
Топологические ограничения неявно поддерживаются средствами ГИС, с которой связан репозиторий. Правила представлены как предложения языка определения данных в языке структурированных запросов Structured Query Language (SQL) для правил атрибута и как структурированный текст для правил отношений (связи).
Система репозитория проектируется, чтобы облегчить разработку системы не вполне подготовленными пользователями. При этом главная задача - обеспечить спецификацию реальных объектов пользователями при существующих ограничениях на способ, которым данные об этих объектах могут быть введены. Эти ограничения задаются, чтобы управлять качеством данных. Система репозитория обеспечивает пользователям интерфейс, позволяющий устанавливать статические ограничения целостности на значения атрибута и определяемые пользователем ограничения целостности на пространственные отношения. Они автоматически перетранслируются в предложения языка определения данных или ограничения, выраженные как запросы к ГИС. Таким образом, не приходится нагружать программированием пользователей. Интерфейс репозитория также обеспечивает шлюз к ГИС. Управление в этом случае переходит к ГИС. ГИС способна реагировать на результат, который указывает, что имеет место нарушение правила. Такие нарушения при вводе геоданных приводят к откату входных данных или фиксируются в файле нарушений корректности репозитория. Кроме того, могут быть собраны автоматически и также предоставляться репозиторием метаданные об авторе, дате, пространственных границах, масштабе, проекции и системе координат.
На рис. 11 изображена структура меню системы репозитория. Цель операции по выбору проекта состоит в том, чтобы находить, вводить или изменять основные детали проекта. Эта операция начинается непосредственно после инициализации системы репозитория. Однако она может быть задействована на любой стадии выполнения проекта, когда пользователь пожелает перейти на другой проект. При этом вводятся детали проекта, включая координаты и масштаб.

В отличие от традиционных моделей автоматизированного проектирования, модели ГИС обеспечивают определение и использование семантически богатых объектно-ориентированных моделей, которые поддерживаются реляционной СУБД (РСУБД), предназначенной для хранения и управления атрибутивными данными. Объединяя пространственные и непространственные данные, модели ГИС допускают эффективную автоматизированную проверку корректности данных, гарантируя качество и надежность геоданных. Кроме того, архитектура клиент - сервер большинства ГИС дает возможность тонким клиентам эффективно обращаться к геоданным по сетям Интернет/интранет, обеспечивая массовую публикацию пространственных данных в различных департаментах достаточно рентабельным способом.
Модель базы геоданных дает возможность выполнить проверку ограничений целостности на геоданные и использовать функции SQL реляционной СУБД для доступа к геоданным, обновления и управления транзакциями. Кроме того, модель позволяет определять специальные объекты, которые воплощают определяемую пользователем семантику, а также поддерживает сложные пространственные отношения типа сетей, топологий и ландшафтов.
Сервер приложений ГИС (рис. 12) представляет собой интерфейс, который позволяет управлять пространственными данными и хранить их. Важнейшее его преимущество состоит в возможности совместного доступа (чтения, записи, обновления, удаления) к используемым данным. Он распределяет пространственные данные для различного рода приложений, а также поставляет пространственные данные через глобальные сети по протоколу TCP/IP.
Сервер приложений служит интерфейсом между ГИС и РСУБД для организации совместного доступа и управления пространственными данными как таблицами. В среде разнотипных баз данных, где используется целый ряд различных баз данных, созданных организациями или отдельными пользователями, он обеспечивает общую модель хранения географической информации и значительно улучшает характеристики всей ГИС за счет распределения функций приложения ГИС между сервером базы данных и клиентом.
Сервер приложений управляет набором заданных таблиц (или системным словарем данных), которые хранят метаданные о пространственных данных, таких как пространственные ссылки, имена классов признаков и структур, и пространственную индексацию.
Репозиторий поддерживает версионирование базы геоданных, что обеспечивает слежение за хронологией обновления геоданных и откат до прежнего уровня изменений, если в этом возникает потребность. Чтобы оптимизировать использование ресурсов памяти, изменения хранятся только в дельта-таблицах. Эти таблицы используются вместо копирования всей базы геоданных. Проведенные изменения в итоге приводят к одной версии, если все изменения согласованы.
Интеллектуализация доступа к геоданным на основе семантической геоинтероперабельности
Возможность совместного использования геоданных (геоинтероперабельность) было одним из основных требований, начиная с разработки первой ГИС. Несмотря на то, что прошлые два десятилетия были очень продуктивными с точки зрения развития геоинтероперабельности, она пока еще не стала общезначимой [10]. Хотя стандарты, разработанные ISO/TC 211 и Open Geospatial Consortium (OGC) Inc. обеспечили основу для ее развития, и во многих организациях (Canadian Geospatial Data Infrastructure (CGDI), National Spatial Data Infrastructure (NSDI), Infrastructure for Spatial Information in Europe (INSPIRE), Global Spatial Data Infrastructure (GSDI) возникли пространственные инфраструктуры данных, геоинтероперабельность все же находится в стадии становления.
С другой стороны, за эти два десятилетия произошло внушительное развитие Интернета и Web. В настоящее время Web совершенствуется до Semantic Web (или Web 3.0), эволюционируя от Web-документов до Web-данных, превращаясь в международную открытую базу данных. Все это внушает определенный оптимизм в отношении реализации.
Существительное «интероперабельность» означает способность одной системы использовать части другой системы (Словарь Merriam-Вебстера, http://www.m-w.com) без специального усилия со стороны клиента; то есть она превышает возможности коммуникации (http://www.dictionary.com). С позиции информатики основная суть определения - это способность использовать информацию, полученную в результате обмена. Международная организация по стандартизации ISO 19119 предлагает такое определение (http://www. wmo.int/pages/prog/www/TEM/ET-WISC-I/ISO_191xx.doc): «Интероперабельность представляет собой способность соединяться, выполнять программы или передавать данные среди различных функциональных модулей способом, который не требует, чтобы пользователь имел знания о характеристиках этих модулей».
В соответствии с этим определением два компонента A и B могут взаимодействовать (являются интероперабельными), если A может послать основанные на взаимном понимании A и B запросы Q для использования сервисов, находящихся у B, и если B может подобным образом возвратить взаимно понятные ответы R к A.
Для географической области применимо следующее описание термина «географическая интероперабельность» (http://www.wmo.int/ pages/prog/www/TEM/ ET-WISC-I/ISO_191xx.doc): «Географическая интероперабельность - это способность информационных систем к 1) свободно обмену всех видов пространственной информации о Земле и об объектах и явлениях на, выше и ниже поверхности Земли; и 2) совместному сетевому использованию программного обеспечения, предназначенному для управления такой информацией».
Следует отметить, что это определение не предполагает, что каждый компонент использует один и тот же формат данных (совпадение форматов соответствует обычно неправильному восприятию многими людьми интероперабельности), а скорее провозглашает способность понимать форматы друг друга.
На техническом уровне интероперабельность включает коммуникацию, определенную соответствующим протоколом коммуникации, аппаратными средствами, программным обеспечением и уровнями совместимости данных. Такая интероперабельность соответствует обеспечению синтаксической интероперабельности в смысле передачи параметров, а семантическая интероперабельность имеет дело со знаниями проблемной области, необходимыми для информационных сервисов, чтобы «понять» мотивации и креативы друг друга.
Сущность интероперабельности - в реализации отношений между системами, где каждое отношение - способ коммуникации, обмена, кооперации и совместного использования ресурсов [11]. Современная ГИС может быть составлена из нескольких компонентов аппаратных средств, программного обеспечения, ресурсов, правил управления, процедур и людей, которые хранят, обрабатывают и обеспечивают доступ к географической информации. Эти компоненты традиционно предоставляют пользователям гомогенный подход, основанный на обработке отдельного продукта ГИС и использовании технологии системы как фактического стандарта. В противоположность этому ГИС, обладающая интероперабельностью, обрабатывает среды, в которых разнообразие одних и тех же компонентов сосуществует и взаимодействует.
В контексте географической информации (ГИ) интероперабельность непосредственно связана с ГИС. ГИС представляет собой основную среду для реализации геоинтероперабельности, потому что в ней в центре внимания пространственные данные, которые более сложны, чем обычные текстовые данные, сохраненные в реляционных базах данных. Характеристики географической информации не предусмотрены для отображения реляционной моделью, а объектная модель является слишком общей для независимого выполнения операций любого вида, что препятствует интероперабельности. Проблемы интероперабельности ГИ выглядят еще более серьезными, если добавить к присущей ГИ сложности геоданных институциональные и юридические осложнения [10]. Этим, по-видимому, и объясняется существование довольно большого количества необходимых стандартов.
Исследования последних лет в области интероперабельности указывают на необходимость создания моделей интероперабельности, которые могут гарантировать, что интероперабельность устанавливается между системами в соответствии с различными целями и контекстами [11].
Существует несколько подходов к формированию ГИС посредством моделей интероперабельности [10]. Каждый подход имеет преимущества и недостатки относительно достижения интероперабельности в определенном контексте. Основные преимущества моделей интероперабельности - это возможность (а) определения общего словаря, который обеспечивает единообразие семантики и возможность анализа; (b) альтернативы предложений относительно структуры решений и, наконец, (c) оценки новых идей и добавления различных опций.
Примерами моделей интероперабельности, которые были успешно применены вне специфики ГИС области, являются C4ISR Architectures Working Group’s Levels of IT Systems Interoperability (LISI) model (LISI 1998), the Enterprise Interoperability Maturity Model (EIMM) (Athena 2005), the Organisational Interoperability Maturity Model (OIMM) (Clark and Jones 1999) и the Organisational Interoperability Agility Model (OIAM) (Kingston et al. 2005). Две модели - the Levels of Conceptual Interoperability Model (LCIM) и the Intermodel5 использовались в ГИС области. Все эти модели в основном используются на самых высоких уровнях организационной интероперабельности из традиционных семи уровней: уровень нулевой интероперабельности, технический, синтаксический, семантический, прагматический, динамический и концептуальный уровни (рис. 13) [11].
Технический уровень интероперабельности обычно связывается с взаимосвязью, представлением и обменом данными, доступностью и характеристиками безопасности типа протоколов, интерфейсов, форматов документа, кодирования данных, а также как мер доступности и решений безопасности. Здесь рассматривают технические аспекты интероперабельности распределенной вычислительной среды, сетей коммуникации, непосредственно технологий и распределенных платформ вычисления. Техническая интероперабельность в основном позиционируется как связь между компьютерными системами и сервисами.
Синтаксический уровень интероперабельности обеспечивает общую структуру обмена информацией, в которой применяется установленный формат данных. В контексте ГИС синтаксическая интероперабельность определяется как спецификация общих форматов сообщения для обмена пространственными данными, образцами и связями.
Семантическая интероперабельность связана со значением совместно обрабатываемой информации, или другими словами, со смыслом данных, воспринимаемом другими людьми. Различия в информационном контексте происходят обычно из-за различных значений одного и того же реального объекта, который сохранен в различных базах данных [12].
К прагматическому уровню относятся намерения, обязанности и последствия сформулированных утверждений. Этот уровень может быть достигнут, когда взаимодействующие системы осведомлены об используемых методах и процедурах. Основная исследовательская проблема здесь связана с тем, как обеспечить механизмы прагматического уровня интероперабельности в Сервисной Ориентированной Архитектуре (SOA) [13].
Динамический тип интероперабельности имеет место, когда системы в состоянии воспринимать изменения состояния, которые происходят с предположениями и ограничениями, сделанными в течение долгого времени, и в состоянии использовать эти изменения в своих интересах. Динамическая интероперабельность может быть рассмотрена в этом случае в двух аспектах: динамическая интероперабельность данных и динамическая сетевая интероперабельность.
Установлено, что концептуальный тип интероперабельности может быть достигнут, когда концептуальная модель зарегистрирована техническими методами так, чтобы она могла интерпретироваться и оцениваться третьим лицом. В том случае, если концептуальные модели (то есть предположения и ограничения значимой абстракции действительности) зафиксированы, то достигнут самый высокий уровень интероперабельности.
Геоинтероперабельность можно представить как двунаправленный механизм в противоположность конвейеру, обрабатывающему информацию только в одном направлении - от источника к адресату. Установление семантической геоинтероперабельности выходит за пределы простой возможности получить доступ к информации географических баз данных на дисплее или напечатанной на бумаге. Оно требует больше времени, заранее должен быть известен точный словарь географических баз данных, чтобы получить соответствующую информацию. Но самое существенное, что установление семантической геоинтероперабельности предполагает, что пользователи и провайдеры должны иметь релевантное понимание семантики запросов и ответов. В контексте Semantic Web такая возможность становится все более и более доступной.
Моделирование семантики глубоко внедрено в структуру геоинтероперабельности и, таким образом, обеспечивает исчерпывающее описание семантической геоинтероперабельности в целом, которая лежит в основе развития семантической пространственной инфраструктуры данных и Semantic Web геопространственной информации.
В 2001 была выдвинута идея Semantic Web. В ее основе лежало предложение модернизировать Web от уровня документов до уровня данных и информационного моделирования. В Semantic Web данные должны быть понятными и обрабатываемыми и, поэтому, Semantic Web должна быть способной к ответу на вопросы в отличие от простой передачи документов или Web-страниц, соответствующих определенным критериям ключевого слова.
Идея создания геопространственной Semantic Web впервые была представлена в 2002 году [11]. Она должна расширить понятие Semantic Web, улучшив семантическую функциональную совместимость географический информации в Web.
За это время усилия по стандартизации ISO/TC 211 и OGC и развитие геоинформатики обеспечили в большой степени основу для создания геопространственной Semantic Web. Международные стандарты ISO/TC 211 определили онтологию геопространственных понятий, которые являются независимыми от приложений. Эта онтология -основа описания географической информации, которая включает понятия для описания геометрии, топологии, временной информации, пространственных систем справочной информации, особенностей, характеристик, поведений, отношений, качества, метаданных и сервисов (позиционирование, изображение, местоположение и т.д.).
Геоинформационный синтез пространственных данных инфраструктуры ж/д транспорта
Геоинформационный синтез (geoinformation fusion) - это процесс объединения географической информации из разнообразных источников для получения новой, более ценной информации, обладающей большей значимостью и надежностью [14]. Геоинформационный синтез - важная функция интероперабельной и доступной через Web геоинформационной системы (ГИС). Увеличение надежности распределенного доступа через Web к геоинформации, соответственно, повышает требования к эффективному и быстрому синтезу геоинформации из разнородных источников.
Первоочередной проблемой, стоящей перед любой системой геоинформационного синтеза, является семантическая разнородность, когда понятия и категории, используемые в разных геоинформационных источниках, имеют несовместимые значения. Большинство сегодняшних геоинформационных методик синтеза существенно зависят от человеческого восприятия проблемной области. В этой работе рассматриваются вопросы географического информационного синтеза с использованием индуктивного вывода. Индуктивный вывод позволяет провести рассуждения от конкретных случаев до общих правил. В контексте геоинформационного синтеза индуктивный вывод может использоваться, чтобы определить семантические отношения между категориями геообъектов из пространственных отношений между наборами определенных объектов. Однако индуктивный вывод считается не очень надежным, особенно при наличии неопределенности. Следовательно, сомнительная надежность - ключевое препятствие, стоящее перед любой автоматизированной системой геоинформационного синтеза, основанной на индуктивном выводе, поскольку геоинформации свойственна неопределенность.
Самый важный шаг в процессе информационного синтеза должен соединять онтологии разных информационных источников. При этом следует различать процесс идентификации отношений между соответствующими элементами в двух гетерогенных онтологиях, называемый «отображением», и процесс построения единственной объединенной онтологии, основанной на этих идентифицированных отношениях, называемый «интеграцией» [15].
Под отображением онтологий (ontology alignment) понимается процесс установления соответствия между концептами разных онтологий. Проще говоря, при отображении онтологий для каждого концепта, отношения или экземпляра некоторой онтологии находятся соответственные элементы в других онтологиях. Проблема отображения онтологий тесно связана с задачей синтеза данных (data fusion) и особенно актуальна при интеграции разнородных баз данных, функционирующих независимо друг от друга. Средства отображения онтологий выделяют семантически эквивалентные классы данных, например «Электровоз» и «Локомотив», которые в общем случае не совпадают, поэтому требуются дополнительные процедуры для определения сходства: синтаксические, внешние и семантические. Эта проблема также важна при реализации семантической интероперабельности в Semantic Web [16], когда каждый из взаимодействующих пользователей сети, который разработал свои онтологии, рассчитывает на согласованное использование разнородных ресурсов. В среде Semantic Web существует много примеров успешного решения проблемы синтеза данных на основе онтологий, но не преодолены пока жесткие требования специальной подготовки интегрируемых данных и семантический диссонанс при неоднократном использовании онтологий.
Исследование синтеза геоинформации предполагает использование более общих подходов, чем в случае атрибутивного информационного синтеза. ГИС с формальными представлениями геоонтологий имеет перспективы улучшения информационной интеграции на основе онтологий, если известны семантические отношения между зафиксированными онтологиями.
В основе пространственного подхода к геоинформационному синтезу всегда лежит процесс выведения семантических отношений из пространственных. Этот процесс может иметь характер индуктивного вывода, моделирующего рассуждение от конкретных случаев до общих правил. Тем самым пространственный подход к геоинформационному синтезу создает общедоступный «словарь» для того, чтобы устанавливать соответствия между онтологиями разных информационных источников, основанные на отношениях между пространственными степенями категорий, используемых в этих информационных источниках. Рис. 14 содержит простой пример информационного синтеза пространственных данных. На рис. 14 каждый набор данных включает пространственный компонент и интенсиональный компонент.

Географические степени наборов ж/д данных и данных кадастровой палаты идентичны (то есть наборы данных покрывают одну и ту же область). Таким образом, рис. 14 представляет ситуацию, когда два учреждения отобразили одну и ту же географическую область, используя разные онтологии. Отметим, что, хотя синтез сильно упрощен, процесс, проиллюстрированный рис. 14, не просто оверлей. Наборы данных были подвергнуты синтезу в том смысле, что получена некая новая информация об отношениях между категориями, представленными в каждом из входных наборов данных.
Описанный выше на простом примере процесс синтеза предполагает, что для работы любой системы в реальных условиях необходимо формализовать правила, требуемые для индуктивного процесса вывода результатов синтеза, с последующей реализацией их в системе автоматизации синтеза данных. Наверное, следует начать с представления таксономии как частично упорядоченного набора (C, <) [15], где C -множество категорий и < - упорядочение (отношение категоризации) на этих категориях. Тогда набор геоданных может быть представлен как набор S, в который входит часть области, таксономия (C, <) и функция e: C -> 2S, которая определяет, какие пространственные области маркированы категориями (2S - мощность множества S). Таким образом, e связывает каждую категорию в таксономии с уникальным набором элементов пространства S. Функцию, подобную e, принято называть функцией расширения, поскольку она обеспечивает экстенсиональную форму представления каждой категории в контексте ее набора данных.
В частности, для набора ж/д данных на рис. 14 таксономия (Сж/д, < ж/д) представлена иерархией категорий; пространственная область Sж/д представлена непосредственно картой, состоящей из выделенных подобластей; а функция расширения e ж/д представлена метками как на таксономии, так и на карте (то есть для каждой категории можно идентифицировать на карте набор местоположений, которые маркированы как определенная категория).
Другими словами, там, где пространственное расширение категории a содержится в пространственном расширением категории b, a является подкатегорией b в объединенной таксономии. Точно так же можно сформулировать правила, для пространственных отношений между пространственными формами двух категорий:
Приведенное правило позволяет создать новую категорию x П y в объединенной таксономии, которая располагается на пересечении категорий x и y. Для двух наборов данных C1 и C2 выводы из таких правил формируют отношение упорядочения, которое связывает категории в двух источниках таксономий. Вместе с теми отношениями, упорядочивающими эти источники, возникает возможность образования нового объединенного частичного порядка в Cf, который определяет категоризацию отношений между категориями в разных таксономиях C1 и C2.
Формализованные правила ввиду их достаточной простоты могут быть легко реализованы в системах автоматизации синтеза данных. Преимущество использования логик описания состоит в том, что любые несогласованности между выбранными правилами могут быть автоматически обнаружены при проверке согласованности и анализа выполнимости. Если сгенерировать отображение онтологии, то пространственные данные могут быть автоматически объединены на основании стандартных геоинформационных методик интеграции (то есть наложением двух пространственных наборов данных и приписыванием каждой объединенной области категории из объединенного частичного порядка, которая находится на пересечении двух исходных категорий объединенной области).
Комплексная система пространственных данных инфраструктуры железнодорожного транспорта
Описанные выше подходы нашли свое применение в информационном обеспечении проектирования, строительства, реконструкции и капитального ремонта объектов железнодорожной инфраструктуры. Комплексная система пространственных данных инфраструктуры железнодорожного транспорта (КСПД ИЖТ) разрабатывается в соответствии с Распоряжением президента ОАО «РЖД» от 3 декабря 2010 года № 2511р «О создании комплексной системы пространственных данных инфраструктуры железнодорожного транспорта». Гетерогенность геоданных, подлежащих комплексированию и синтезу в КСПД ИЖТ, выдвигает на передний план решение задачи геоинтероперабельности отраслевого масштаба [17] как задачи совместного согласованного использования геоданных, полученных из разных информационных источников (рис. 15).
При этом функционал КСПД ИЖТ поддерживает решение следующих задач:
- ■ Централизация и унификация процессов сбора, обработки и использования пространственных данных - ведение геоинфор-мационной базы данных (ГБД).
- ■ Информационное обеспечение процессов комплексной оценки технического состояния объектов инфраструктуры.
- ■ Планирование ремонтных работ объектов инфраструктуры по оцениваемому состоянию.
- ■ Информационная поддержка процесса проектного содержания пути - комплексное решение с учетом всей имеющейся информации.
- ■ Оценка антропогенных и природных угроз безопасности движения путем выявления мест, представляющих потенциальную опасность.
- ■ Планирование перевозок негабаритных грузов.
- ■ Информационная поддержка принятия стратегических решений путем интеграции данных об инфраструктуре, оперативности их выбора по любому заданному критерию, наглядности их представления как в графической, так и в табличной форме.
Для моделирования и распознавания объектов ж/д инфраструктуры используются данные мобильного лазерного сканирования и файлы инфракрасной съемки и фотофиксации. Моделированию и распознаванию подлежат ж/д объекты, четко определяемые по облаку точек лазерных отражений, и только внешние элементы конструкций, отображающие основной габарит.
В КСПД ИЖТ обрабатываются данные о следующих объектах/ группах объектов:
- ■ Ось пути.
- ■ Рельсы по рабочей поверхности головки рельса.
- ■ Здания и др. наземные площадные объекты.
- ■ Металлические балки для подвеса проводов (консоли) контактной сети на опорах, конструкции натяжения проводов и т. п.
- ■ Столбы опор контактной сети, фермовые конструкции, опоры ЛЭП, столбы освещения.
- ■ Линейные объекты (контактные провода, кабели, тросы и т. д.).
- ■ Трубопроводы.
- ■ Математическая основа и информационные указатели (пункты ОГС, километровые столбы, пикетажные столбы, кабелеуказатели и т. п.).
- ■ Гидрография (реки, озера, ручьи и т. п.).
- ■ Дорожные сооружения.
- ■ Платформы, будки, семафоры, светофоры, шлагбаумы.
- ■ Площадное электрооборудование ж/д пути (подстанции, будки трансформаторные, трансформаторы, трансформатор на столбе, шкаф электрический распределительный).
- ■ Автодорожная сеть.
- ■ Растительность - объекты в виде TIN-поверхности шагом 50x50 см.
- ■ Ограждения (заборы, шумоподавляющие сооружения и т. п.).
Технологическая цепочка наиболее перспективного с точки зрения авторов мобильного лазерного сканирования разбивается на шесть отдельных этапов, которые достаточно независимы, так как операции могут быть распараллелены между отдельными исполнителями. Результат выполнения каждого этапа формализован.
На первом этапе решаются технические вопросы, призванные в первую очередь устранить ошибки сканирования и искажения пространственных данных. Одним из ключевых моментов данного этапа является создание топографо-геодезического обоснования путем расстановки и последующей «увязки» временных базовых станций, т. к. это является залогом качественного и точного определения требуемых пространственно-технических параметров объектов железнодорожной инфраструктуры. Малое число видимых навигационных спутников, неудовлетворительное их взаимное расположение (особенно в высоких широтах), плохие условия приема сигнала GPS-антенной под контактным проводом и другие обстоятельства могут стать существенным фактором снижения точности сканирования и даже привести к невыполнению работ.
Кроме этого стратегия достижения заданной плотности точек мобильного лазерного сканирования и обеспечения максимального съемочного покрытия состоит в проведении лазерного сканирования одного и того же участка железной дороги по первому и второму главному пути (по маршруту «туда и обратно»). В подавляющем большинстве случаев такой метод обеспечивает и закрытие «мертвых» зон (особенности рельефа, железнодорожные составы, станционные здания и сооружения), и устранение локальных ошибок сканирования, возникающих при съемке по одному из направлений.
Основная задача следующего этапа, связанного с анализом результатов съемки и первичной обработкой данных мобильного лазерного сканирования, состоит в определении потенциально проблемных участков трассы или тех, где результаты сканирования неприемлемы для дальнейшей тематической обработки. Траекторное решение вычисляется с помощью ПО Applanix POSPac MMS, в котором имеется возможность тонкой настройки прохождения сигнала через атмосферу (компенсации ионосферных и тропосферных задержек, вычисления релятивистского эффекта, учета ошибок синхронизации и других). Данное программное обеспечение широко используется для вычисления точной траектории подвижных воздушных и наземных целей. Последующая первичная обработка производится специализированным программным обеспечением, поставляемым в комплекте со сканирующей системой. Отдельная задача, решаемая на этом этапе, - конвертирование данных в местную систему координат с соблюдением требований по секретности проведенных измерений.
На этапе классификации точек лазерного отражения и формирования цифровой модели земли происходит формирование проекта под последующую камеральную обработку. Вся трасса разбивается на блоки определенной длины, удобные для загрузки точек лазерного отражения и проведения трехмерной векторизации. Основная цель данного этапа заключается в отделении точек отражения от земли в отдельный класс, с тем чтобы можно было в дальнейшем определить такие параметры, как состояние балластной призмы, земляного полотна железнодорожного пути, водоотводных стоков.
Этап формирования трехмерных пространственных моделей, или трехмерного моделирования - наиболее трудоемкий и «творческий», зависит от пространственного воображения оператора. Тем не менее процесс построения может быть формализован по двум направлениям: 1) существует достаточное количество программных продуктов, позволяющих по данным хорошего качества векторизовать линейные объекты, типа рельсовой нити или электрических проводов; 2) использовать заранее созданные по конструкторским чертежам модели отдельных объектов инфраструктуры железнодорожного транспорта (так называемые библиотечные примитивы), например опоры контактной сети, светофоры и другие устройства. Точность векторизации с использованием библиотечных примитивов на порядок выше, кроме этого под их расстановку разработано достаточное количество утилит, позволяющих делать это полуавтоматическим образом.
Суть следующего, пятого этапа заключается в добавлении семантической информации путем конвертирования созданной ранее трехмерной модели в ГБД и наполнении ее основной семантической информацией (атрибутирование).
Задача не тривиальна, поскольку полнотелые CAD-объекты, как правило, представлены сложными внутренними структурами той программы, в которой они создаются, и которые «рассыпаются» на простые элементы (типа линий и плоскостей) при экспорте их в любые ГИС-приложения. Для решения этой задачи применяется специальное программное обеспечение компании Safe Software, позволяющее проводить подобного рода операции.
Для атрибутирования используется фотоинформация, собираемая во время лазерного сканирования, а также «выгрузки» из специализированных баз геоданных. Помимо этого каждый объект, если он представлен в виде 3D- и точечного (или линейного) примитива, наделяется уникальным идентификатором для установления однозначной связи между условным схематическим знаком на топоплане и его трехмерным отображением.
На последнем, шестом этапе производится подготовка данных для работы функциональных приложений.
Заключение
В последние годы синтез информации из множества источников и баз данных в режиме реального времени приобретает все большее значение, поскольку практически используется во многих прикладных областях. Так как большинство датчиков могут генерировать большие объемы геоинформации в короткие промежутки времени, синтез данных, получаемых с использованием датчиков, требует новых методов оптимизации совместной обработки показаний датчиков. В работе рассмотрено формализованное представление технологической возможности получения геопространственных данных в рамках единой системы сбора геопространственной информации для автоматизации мониторинга инфраструктуры ж/д транспорта в высокоточном координатном пространстве. В условиях повышающихся требований к доступности и оперативности геопространственной информации мобильное лазерное сканирование является наиболее эффективным решением современных технологий сбора и обработки геоданных для создания картографических материалов, паспортизации, мониторинга и фиксации состояния инфраструктурных транспортных объектов.
В процессе реализации проектов по проверке фактического положения объектов ж/д инфраструктуры была разработана и апробирована уникальная сквозная технология съемки и обработки пространственных данных, позволяющая, с одной стороны, минимизировать затраты на обработку, а с другой - повысить контролируемость процесса и точность синтеза геоданных.
Список литературы
1. Goodchild, M., et al., Introduction to the Varenius Project. International Journal of Geographical Information Science, 1999. 13(8): p. 731-745.
2. Fonseca, F. and M. Egenhofer. Ontology-Driven Geographic Information Systems. In 7th ACM Symposium on Advances in Geographic Information Systems. 1999. Kansas City, MO: ACM Press, N.Y.
3. Guarino, N., Formal Ontology and Information Systems, in Formal Ontology in Information Systems, N. Guarino, Editor. 1998, IOS Press: Amsterdam, The Netherlands. p. 3-15.
4. Fonseca, F., et al., Ontologies and Knowledge Sharing in Urban GIS. Computer, Environment and Urban Systems, 2000. 24(3): p. 232-251.
5. Morrison J. Spatial data quality // Elements of spatial Data Quality, Elsevier Science, 1995. Pp. 1-12.
6. Kainz W. Logical Consistency // Elements of Spatial Data Quality, Elsevier Science, 1995. Pp. 109-138.