分布式GIS技术体系 分布式锁
GIS技术在国内的研究现状及其发展趋势
0 引言
创新互联,专注为中小企业提供官网建设、营销型网站制作、响应式网站开发、展示型网站建设、网站设计等服务,帮助中小企业通过网站体现价值、有效益。帮助企业快速建站、解决网站建设与网站营销推广问题。
随着计算机技术的飞速发展、空间技术的日新月异及计算机图形学理论的日渐完善,GIS(Geographic Information System)技术也日趋成熟,并且逐渐被人们所认识和接受。近年来,GIS被世界各国普遍重视,尤其是“数字地球”概念的提出,使其核心技术GIS更为各国政府所关注。目前,以管理空间数据见长的GIS已经在全球变化与监测、军事、资源管理、城市规划、土地管理、环境研究、农作物估产、灾害预测、交通管理、矿产资源评价、文物保护、湿地制图以及政府部门等许多领域发挥着越来越重要的作用。当前GIS正处于急剧发展和变化之中,研究和总结GIS技术发展,对进一步开展GIS研究工作具有重要的指导意义。因此,本文就目前GIS技术的研究现状及未来发展趋势进行总结和分析。
1 GIS研究现状及其分析
1.1 GIS研究现状
世纪90年代以来,由于计算机技术的不断突破以及其它相关理论和技术的完善,GIS在全球得到了迅速的发展。在海量数据存储、处理、表达、显示及数据共享技术等方面都取得了显著的成效,其概括起来有以下几个方面[1]:①硬件系统采用服务器/客户机结构,初步形成了网络化、分布式、多媒体GIS;②在GIS的设计中,提出了采用“开放的CIS环境”的概念,最终以实现资源共享、数据共享为目标;③高度重视数据标准化与数据质量的问题,并已形成一些较为可行的数据标准;④面向对象的数据库管理系统已经问世,正在发展称之为“对象——关系DBMS(数据库管理系统)”;⑤以CIS为核心的“3S”技术的逐渐成熟,为资源与环境工作提供了空间数据新的工具和方法;⑥新的数学理论和工具采用CIS,使其信息识别功能、空间分析功能得以增强等等。
在GIS技术不断发展下,目前GIS的应用已从基础信息管理与规划转向更复杂的区域开发、预测预报,与卫星遥感技术相结合用于全球监测,成为重要的辅助决策工具。据有关部门估计,目前世界上常用的GIS软件己达400多种[2].国外较著名的GIS软件产品有[3]:Auotodesk系列产品、Arc/Info、MapInfo及其构件产品、Intergraph、Microstation等,还有Web环境下矢量地图发布的标准和规范,如XML、GML、SVG等等。我国GIS软件研制起步较晚,比较成熟的测绘软件主要有南方CASS,MapGIS,GeoStar,SuperMap等。尽管现存的GIS软件很多,但对于它的研究应用,归纳概括起来有二种情况:一是利用GIS系统处理用户的数据;二是在GIS的基础上,利用它的开发函数库二次开发用户专用的GIS软件。目前已成功应用包括资源管理、自动制图、设施管理、城市和区域规划、人口和商业管理、交通运输、石油和天然气、教育、军事等九大类别的一百多个领域。在美国及发达国家,GIS的应用遍及环境保护、灾害预测、城市规划建设、政府管理等众多领域。近年来,随着我国经济建设的迅速发展,加速了GIS应用的进程,在城市规划管理、交通运输、测绘、环保、农业等领域发挥r重要的作用,取得了良好的经济效益和社会效益。
1.2 当前GIS发展存在的主要问题
基于以上GIS技术现状研究,本文分析认为GIS技术在模型、数据结构等方面存在着不足,一定程度上制约了GIS技术的发展。
(1)数据结构方面存在的问题
目前通用的GIS主要有矢量、栅格或两者相加的混合系统,即使是混合系统实际上也是将两类数据分开存储,当需要执行不同的任务时采用不同的数据形式。在矢量结构方面,其缺点是处理位置关系(包括相交、通过、包含等)相当费时,且缺乏与DEM和RS直接结合的能力。在栅格结构方面,存在着栅格数据分辨率低,精度差;难以建立地物间的拓扑关系;难以操作单个目标及栅格数据存贮量大等问题[4].
(2)GIS模型存在的问题
传统GIS模型是按照计算机的方法对客观世界地理空间不自然的分割和抽象,使得人们认知地理空间的认知模型与计算机中的数据模型不能形成良好的对应关系,难以表达复杂的地理实体,更难满足客观世界的整体特征要求。在GIS软件开发中,如果语义分割不合理,将难以有效表达地理空间实体间的关系,这就导致较深层次的分析、处理操作难以实现。随着GIS应用需求领域的不断开拓及计算机技术的迅速发展,对空间数据模型和空间数据结构提出了更高的要求,使得传统的地理空间数据模型力不从心,逐渐暴露其弊端。
目前,面向对象的数据模型一定程度上解决了传统GIS数据模型的某些不足,但是OODB(面向对象数据库)目前仍未在市场以及关键任务应用方面被广泛接受,因为OODB作为一个DBS还不太成熟,如缺少完全非过程性的查询语言以及视图、授权、动态模式更新和参数化性能协调等;且OODB与RDB之间缺少应有的兼容性,因而使得大量的已建立起来的庞大的RDB客户不敢轻易地去选择OODB.
(3)其他方面亟待解决的问题
当前,GIS正处在一个大变革时期,GIS的进一步发展还面临不少问题,主要表现在以下几个方面[5]:①GIS设计与实现的方法学问题。在GIS设计与实现过程中缺乏面向对象的认知方法学和面向对象的程序设计方法学的指导,导致GIS软件系统的可靠性和可维护性差;②GIS的功能问题。当前以数据采集、存储、管理和查询检索功能为主的GIS,不能满足社会和区域可持续发展在空间分析、预测预报、决策支持等方面的要求,直接影响到GIS的应用效益和生命力;③三维GIS模型及可视化问题。目前大多数GIS软件的图形显示是基于二维平面的,即使是三维效果显示也是采用DEM的方法来处理表达地形的起伏,涉及到地底下真三维的自然和人工现象显得无能为力。
2 GIS未来发展趋势
2.1数据管理方面
(1)多比例尺、多尺度和多维空间数据的表达[6]
对于多比例尺数据的显示,将运用影像金字塔技术、细节分层技术和地图综合等技术;而为了实现GIS的动态、实时和三维可视化,出现存储真三维坐标数据的3D GIS和真四维时空GIS,这其中涉及了空间数据的海量存储、时空数据处理与分析以及快速广域三维计算与显示等多项理论与技术[7].
(2)三库一体化的数据结构方向
空间数据库向着真正面向对象的数据模型和图形矢量库、影像栅格库和DEM格网库三库一体化数据结构的方向发展[8].这种三库一体化的数据结构改变了以图层为处理基础的组织方式,实现了直接面向空间实体的数据组织,使多源空间数据的录入与融合成为了可能,从而为GIS与遥感技术的集成创造了条件。
(3)基于空间数据仓库(Spatial Data warehouse)的海量空间数据管理的研究
空间数据量非常大,而且数据大都分散在政府、私人机构、公司的各个部门,数据的管理与使用就变得非常复杂,但这些空间数据又具有极大的科学价值和经济价值,因此大多数发达国家都比较重视空间数据仓库的建立工作,许多研究机构和政府部门都参与到空间数据仓库建立的研究工作。
(4)利用数据挖掘技术进行知识发现
空间数据挖掘是从空间数据库中抽取隐含的知识、空间关系以及其他非显式的包含在空间数据库中但以别的模式存在的信息供用户使用,这是GIS应用的较高层次。由于目前空间数据的组织与管理仍局限于二维、静态、单时相,且仍以图层为处理基础,因此,当前的GIS软件和空间数据库还不能有效地支持数据挖掘。
2.2技术集成方面
(1)“3S”集成
“3S”是GPS(全球定位系统)、RS(遥感)和GIS的简称,“3S”集成是指将遥感、空间定位系统和地理信息系统这三种对地观测技术有机地集成在一起。地理信息是一种信息流,RS、GPS和GIS中任何一个系统都只侧重于信息流特征中的一个方面,而不能满足准确、全面地描述地理信息流的要求。因此,无论从物质运动形式、地学信息的本质特征还是“3S”各自的技术特征来说,“3S”集成都是科技发展的必然结果。
目前,“3S”集成还仅限于两两结合方式,这是“3S”集成的初级和基础起步阶段,其核心是GIS与RS的结合。这种两两结合虽然优于单一系统,但是仍然存在以下缺陷。将“3S”进行集成从而形成一体化的信息技术体系是非常迫切的。这种集成包括空基“3S”集成和地基“3S”集成,即在硬件方面建立具有同步获取涉谱数据和空间数据的高重复观测能力的平台,而在软件方面使GIS支持数据封装,同时解决图形和图像数据的统一处理问题。
(2)GIS与虚拟现实技术的结合
虚拟现实(Virtual Reality)是一种最有效地模拟人在自然环境中视、听、动等行为的高级人机交互技术,是当代信息技术高速发展和集成的产物。从本质上说,虚拟现实就是一种先进的计算机用户接口,通过计算机建立一种仿真数字环境,将数据转换成图形、声音和接触感受,利用多种传感设备使用户“投入”到该环境中,用户可以如同在真实世界那样“处理”计算机系统所产生的虚拟物体。将虚拟和重建逼真的、可操作的地理三维实体,GIS用户在客观世界的虚拟环境中能更有效的管理、分析空间实体数据。因此,开发虚拟GIS已成为GIS发展的一大趋势。
(3)分布式技术、万维网与GIS的结合[9]
目前,随着Internet技术的迅猛发展,其应用已经深人到各行各业,作为与我们日常生活息息相关的GIS也不例外,它们的结合产生了web GIS.当前Web GIS系统已经得到迅速的发展,到1999年1月,仅在美国出现的这类系统就有23种之多。又由于客户端可能会采用新的应用协议,因此也被认为是Internet GIS.
计算机网络技术的飞速发展,分布式计算的优势日益凸显,GIS与分布式技术结合也就成为必然,它们的结合即构成了分布式CIS.它就是指利用最先进的分布式计算技术来处理分布在网络上的异构多源的地理信息,集成网络上不同平台上的空间服务,构建一个物理上分布,逻辑上统一的GIS.它与传统GIS最大的区别在于它不是按照系统的应用类别、运行环境划分的,而是按照系统中的数据分布特征和针对其中数据处理的计算特征而分类的。
(4)移动通信技术与CIS的结合发展[10]
WAP/WML技术作为无线互联网领域的一个热点,已经显示了其巨大的应用前景和市场价值。WAP柳ML技术与GIS技术的结合产生了移动GIS(Mobile GIS)应用和无线定位服务LBS(Location一basedServices)。通过WAR/WML技术,移动用户几乎可以在任何地方、时间获得网络提供的各种服务。无线定位服务将提供一个机会使GIS突破其传统行业的角色而进人到主流的IT技术领域里。大多数的分析家都认为,到2010年,无线网络将成为全球数据传送的主要途径。GIS的未来将会由其机动性所决定。
当前用于地理信息交互的语言还不足以完成真正的“设备无关接口”的互操作。各种移动设备对于从地理信息服务器所获得的信息,其表现方式是各不相同的,用户输人方式也不相同。因此,对于不同的移动设备需要一种统一的标记语言。无线定位服务将提供一个机会使GIS突破其传统行业的角色而进人到主流的IT技术领域里:大多数的分析家都认为,到2010年,无线网络将成为全球数据传送的主要途径。GIS的未来将会由其机动性所决定。
(5)GIS与决策支持系统(DSS)的集成[11]
决策支持系统(Decision Support System,简称DSS)是以管理学、运筹学、控制论、行为科学和人下智能为基础,运用信息仿真和计算手段为基础,综合利用现有的各种数据库、信息和模型来辅助决策者或决策分析人员解决结构化和半结构化问题,甚至非结构化问题的人机交互系统。
目前,绝大多数的GIS还仅限于图形的分析处理,缺乏对复杂空间问题的决策支持,而目前绝大多数的DSS则无法向决策者提供一个友好的可视化的决策环境。因此,将GIS与DSS相集成,最终形成空间决策支持系统(SDSS),借助GIS强大的空间数据处理分析功能,并在DSS中嵌入空间分析模块,从而辅助决策者求解复杂的空间问题,这是GIS应用向较高层次的发展。其中SDSS中知识的表达、获取和知识推理以及模型库、知识库、数据库三库接口的设计是哑待解决的关键问题。
2.3 发展历程方面
自20世纪60年代世界上第一个GIS——加拿大地理信息系统(CGIS)问世以来,经过40年的发展,GIS经历了三个阶段的发展。目前,随着第三代互联网的提出与实施,以及计算机技术、数据库技术的飞速发展,GIS即将步入第四代GIS发展阶段。
第四代GIS软件将在数据组织、存储、检索和运算等方面发生革命性的变革。数据组织应该是面向空间实体的,空间位置只是实体众多属性中的一类,它应和其它属性有机地组织在一起并统一存放:“关系”概念和“关系运算”应该加以扩充,应该包括空间关系及其运算;传统的结构化查询语言应该扩充,把空间关系及其查询包括在里面;以倒排表为基础的数据库索引机制应该扩展,建立至少包括拓扑关系在内的新的索引机制;数据存储机制应该适应空间数据提取和计算的要求等。只有实现数据真正的一体化存储和处理,才能自由地、方便地、快速地实现人们所期望的处理功能。在功能上,第四代GIS软件应该具备支持数字地球(区域、城市)的能力,成为OS、DBMS之上的主要应用集成平台,它具有统一的海量存储、查询和分析处理能力、一定的三维和时序处理能力、强大的应用集成能力和灵活的操纵能力,且具有一定的虚拟现实表达。
3 结束语
通过以上对GIS现状及发展趋势的分析,可以看出,GIS作为信息产业的重要组成部分,正以前所未有的速度向前发展。把握当前GIS的技术发展现状及不足,有利于人们预见GIS的发展趋势,站在更高更远的角度去扬长避短,较好地促进GIS技术的快速发展。随着地理信息系统产业的建立和数字化住处产品在全世界的普及,GIS将深人到各行各业以至千家万户,成为人们生产、工作、学习和生活中不可缺少的工具和助手。
GIS基本技术有哪些?
引言
地理信息系统(Geographic Information System,简称GIS)是计算机科学、地理学、测量学、地图学等多门学科综合的技术[1]。GIS的基本技术是空间数据库、地图可视化及空间分析,而空间数据库是GIS的关键。空间数据挖掘技术作为当前数据库技术最活跃的分支与知识获取手段,在GIS中的应用推动着GIS朝智能化和集成化的方向发展。
1 空间数据库与空间数据挖掘技术的特点
随着数据库技术的不断发展和数据库管理系统的广泛应用,数据库中存储的数据量也在急剧增大,在这些海量数据的背后隐藏了很多具有决策意义的信息。但是,现今数据库的大多数应用仍然停留在查询、检索阶段,数据库中隐藏的丰富的知识远远没有得到充分的发掘和利用,数据库中数据的急剧增长和人们对数据库处理和理解的困难形成了强烈的反差,导致“人们被数据淹没,但却饥饿于知识”的现象。
空间数据库(数据仓库)中的空间数据除了其显式信息外,还具有丰富的隐含信息,如数字高程模型〔DEM或TIN〕,除了载荷高程信息外,还隐含了地质岩性与构造方面的信息;植物的种类是显式信息,但其中还隐含了气候的水平地带性和垂直地带性的信息,等等。这些隐含的信息只有通过数据挖掘才能显示出来。空间数据挖掘(Spatial Data Mining,简称SDM),或者称为从空间数据库中发现知识,是为了解决空间数据海量特性而扩展的一个新的数据挖掘的研究分支,是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程[2]。由于SDM的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对象的几何数据、属性数据,而且存储了空间事物或对象之间的图形空间关系,因此其处理方法有别于一般的数据挖掘方法。SDM与传统的地学数据分析方法的本质区别在于SDM是在没有明确假设的前提下去挖掘信息、发现知识,挖掘出的知识应具有事先未知、有效和可实用3个特征。
空间数据挖掘技术需要综合数据挖掘技术与空间数据库技术,它可用于对空间数据的理解,对空间关系和空间与非空间关系的发现、空间知识库的构造以及空间数据库的重组和查询的优化等。
2 空间数据挖掘技术的主要方法及特点
常用的空间数据挖掘技术包括:序列分析、分类分析、预测、聚类分析、关联规则分析、时间序列分析、粗集方法及云理论等。本文从挖掘任务和挖掘方法的角度,着重介绍了分类分析、聚类分析和关联规则分析三种常用的重要的方法。
2.1、分类分析
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类和我们熟知的回归方法都可用于预测,两者的目的都是从历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则是连续的数值。二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别。空间分类的规则实质是对给定数据对象集的抽象和概括,可用宏元组表示。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由特征(又称属性)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示字段值,c表示类别。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法(近邻学习或基于事例的学习),对应的知识表示是判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是反向传播(Back-Propagation,简称BP)算法,它的模型表示是前向反馈神经网络模型(由代表神经元的节点和代表联接权值的边组成的一种体系结构),BP算法本质上是一种非线性判别函数[3]。另外,最近又兴起了一种新的方法:粗糙集(rough set),其知识表示是产生式规则。
不同的分类器有不同的特点。有三种分类器评价或比较尺度:1) 预测准确度;2) 计算复杂度;3) 模型描述的简洁度。预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是海量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务,模型描述越简洁越受欢迎。例如,采用规则归纳法表示的分类器构造法就很有用,而神经网络方法产生的结果就难以理解。
另外要注意的是,分类的效果一般和数据的特点有关。有的数据噪声大,有的有缺值, 有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。
分类技术在实际应用非常重要,比如:可以根据房屋的地理位置决定房屋的档次等。
2. 2 聚类分析
聚类是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。它的目的是使得属于同一个组的样本之间应该彼此相似,而不同组的样本应足够不相似。与分类分析不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。基于聚类分析方法的空间数据挖掘算法包括均值近似算法[4]、CLARANS、BIRCH、DBSCAN等算法。目前,对空间数据聚类分析方法的研究是一个热点。
对于空间数据,利用聚类分析方法,可以根据地理位置以及障碍物的存在情况自动地进行区域划分。例如,根据分布在不同地理位置的ATM机的情况将居民进行区域划分,根据这一信息,可以有效地进行ATM机的设置规划,避免浪费,同时也避免失掉每一个商机。
2.3 关联规则分析
关联规则分析主要用于发现不同事件之间的关联性,即一事物发生时,另一事物也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是:事件发生的概率和条件概率应该符合一定的统计意义。空间关联规则的形式是X->Y[S%,C%],其中X、Y是空间或非空间谓词的集合,S%表示规则的支持度,C%表示规则的置信度。空间谓词的形式有3种:表示拓扑结构的谓词、表示空间方向的谓词和表示距离的谓词[5]。各种各样的空间谓词可以构成空间关联规则。如,距离信息(如Close_to(临近)、Far_away(远离))、拓扑关系(Intersect(交)、Overlap(重叠)、Disjoin(分离))和空间方位(如Right_of(右边)、West_of(西边))。实际上大多数算法都是利用空间数据的关联特性改进其分类算法,使得它适合于挖掘空间数据中的相关性,从而可以根据一个空间实体而确定另一个空间实体的地理位置,有利于进行空间位置查询和重建空间实体等。大致算法可描述如下:(1)根据查询要求查找相关的空间数据;(2)利用临近等原则描述空间属性和特定属性;(3)根据最小支持度原则过滤不重要的数据;(4)运用其它手段对数据进一步提纯(如OVERLAY);(5)生成关联规则。
关联规则通常可分为两种:布尔型的关联规则和多值关联规则。多值关联规则比较复杂,一种自然的想法是将它转换为布尔型关联规则,由于空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。—种逐步求精的挖掘优化方法可用于空间关联的分析,该方法首先用一种快速的算法粗略地对一个较大的数据集进行一次挖掘,然后在裁减过的数据集上用代价较高的算法进一步改进挖掘的质量。因为其代价非常高,所以空间的关联方法需要进一步的优化。
对于空间数据,利用关联规则分析,可以发现地理位置的关联性。例如,85%的靠近高速公路的大城镇与水相邻,或者发现通常与高尔夫球场相邻的对象是停车场等。
3 空间数据挖掘技术的研究方向
3.1 处理不同类型的数据
绝大多数数据库是关系型的,因此在关系数据库上有效地执行数据挖掘是至关重要的。但是在不同应用领域中存在各种数据和数据库,而且经常包含复杂的数据类型,例如结构数据、复杂对象、事务数据、历史数据等。由于数据类型的多样性和不同的数据挖掘目标,一个数据挖掘系统不可能处理各种数据。因此针对特定的数据类型,需要建立特定的数据挖掘系统。
3.2 数据挖掘算法的有效性和可测性
海量数据库通常有上百个属性和表及数百万个元组。GB数量级数据库已不鲜见,TB数量级数据库已经出现,高维大型数据库不仅增大了搜索空间,也增加了发现错误模式的可能性。因此必须利用领域知识降低维数,除去无关数据,从而提高算法效率。从一个大型空间数据库中抽取知识的算法必须高效、可测量,即数据挖掘算法的运行时间必须可预测,且可接受,指数和多项式复杂性的算法不具有实用价值。但当算法用有限数据为特定模型寻找适当参数时,有时也会导致物超所值,降低效率。
3.3 交互性用户界面
数据挖掘的结果应准确地描述数据挖掘的要求,并易于表达。从不同的角度考察发现的知识,并以不同形式表示,用高层次语言和图形界面表示数据挖掘要求和结果。目前许多知识发现系统和工具缺乏与用户的交互,难以有效利用领域知识。对此可以利用贝叶斯方法和演译数据库本身的演译能力发现知识。
3.4 在多抽象层上交互式挖掘知识
很难预测从数据库中会挖掘出什么样的知识,因此一个高层次的数据挖掘查询应作为进一步探询的线索。交互式挖掘使用户能交互地定义一个数据挖掘要求,深化数据挖掘过程,从不同角度灵活看待多抽象层上的数据挖掘结果。
3.5 从不同数据源挖掘信息
局域网、广域网以及Internet网将多个数据源联成一个大型分布、异构的数据库,从包含不同语义的格式化和非格式化数据中挖掘知识是对数据挖掘的一个挑战。数据挖掘可揭示大型异构数据库中存在的普通查询不能发现的知识。数据库的巨大规模、广泛分布及数据挖掘方法的计算复杂性,要求建立并行分布的数据挖掘。
3.6 私有性和安全性
数据挖掘能从不同角度、不同抽象层上看待数据,这将影响到数据挖掘的私有性和安全性。通过研究数据挖掘导致的数据非法侵入,可改进数据库安全方法,以避免信息泄漏。
3.7 和其它系统的集成
方法、功能单一的发现系统的适用范围必然受到一定的限制。要想在更广泛的领域发现知识,空间数据挖掘系统就应该是数据库、知识库、专家系统、决策支持系统、可视化工具、网络等技术的集成。
4 有待研究的问题
我们虽然在空间数据挖掘技术的研究和应用中取得了很大的成绩,但在一些理论及应用方面仍存在急需解决的问题。
4.1 数据访问的效率和可伸缩性
空间数据的复杂性和数据的大量性,TB数量级的数据库的出现,必然增大发现算法的搜索空间,增加了搜索的盲目性。如何有效的去除与任务无关的数据,降低问题的维数,设计出更加高效的挖掘算法对空间数据挖掘提出了巨大的挑战。
4.2 对当前一些GIS软件缺乏时间属性和静态存储的改进
由于数据挖掘的应用在很大的程度上涉及到时序关系,因此静态的数据存储严重妨碍了数据挖掘的应用。基于图层的计算模式、不同尺度空间数据之间的完全割裂也对空间数据挖掘设置了重重障碍。空间实体与属性数据之间的联系仅仅依赖于标识码,这种一维的连接方式无疑将丢失大量的连接信息,不能有效的表示多维和隐含的内在连接关系,这些都增加了数据挖掘计算的复杂度,极大地增加了数据准备阶段的工作量和人工干预的程度。
4.3 发现模式的精炼
当发现空间很大时会获得大量的结果,尽管有些是无关或没有意义的模式,这时可利用领域的知识进一步精炼发现的模式,从而得到有意义的知识。
在空间数据挖掘技术方面,重要的研究和应用的方向还包括:网络环境上的数据挖掘、栅格矢量一体化的挖掘、不确定性情况下的数据挖掘、分布式环境下的数据挖掘、数据挖掘查询语言和新的高效的挖掘算法等。
5 小结
随着GIS与数据挖掘及相关领域科学研究的不断发展,空间数据挖掘技术在广度和深度上的不断深入,在不久的将来,一个集成了挖掘技术的GIS、GPS、RS集成系统必将朝着智能化、网络化、全球化与大众化的方向发展。
gis的体系结构
从应用的角度,地理信息系统由硬件、软件、数据、人员和方法五部分组成。硬件和软件为地理信息系统建设提供环境;数据是GIS的重要内容;方法为GIS建设提供解决方案;人员是系统建设中的关键和能动性因素,直接影响和协调其它几个组成部分。
硬件主要包括计算机和网络设备,存储设备,数据输入,显示和输出的外围设备等等。
软件主要包括以下几类:操作系统软件 、数据库管理软件 、系统开发软件 、GIS 软件,等等。 GIS软件的选型,直接影响其它软件的选择,影响系统解决方案,也影响着系统建设周期和效益。
数据是GIS的重要内容,也是GIS系统的灵魂和生命。数据组织和处理是GIS应用系统建设中的关键环节,涉及许多问题:
——应该选择何种(或哪些)比例尺的数据?
——已有数据现势性如何?
——数据精度是否能满足要求?
——数据格式是否能被已有的GIS软件集成?
——应采用何种方法进行处理和集成?
——采用何种方法进行数据的更新和维护,等等。
方法指系统需要采用何种技术路线,采用何种解决方案来实现系统目标。方法的采用会直接影响系统性能,影响系统的可用性和可维护性。
人是GIS系统的能动部分。人员的技术水平和组织管理能力是决定系统建设成败的重要因素。系统人员按不同分工有项目经理、项目开发人员、项目数据人员、系统文档撰写和系统测试人员等。各个部分齐心协力、分工协作是GIS系统成功建设的重要保证。
GIS应用系统建设需要从以上五个方面着手。
GIS 的应用领域
地理信息系统在最近的30多年内取得了惊人的发展,广泛应用于资源调查、环境评估、灾害预测、国土管理、城市规划、邮电通讯、交通运输、军事公安、水利电力、公共设施管理、农林牧业、统计、商业金融等几乎所有领域。 (加测绘、应急、石油石化等国民经济各个领域。)
以下地理信息系统的应用领域分别回答了在各自领域内的作用
◆ 资源管理 (Resource Management)
主要应用于农业和林业领域,解决农业和林业领域各种资源(如土地、森林、草场)分布、分级、统计、制图等问题。主要回答“定位”和“模式”两类问题。
◆ 资源配置 (Resource Configuration)
在城市中各种公用设施、救灾减灾中物资的分配、全国范围内能源保障、粮食供应等到机构的在各地的配置等都是资源配置问题。GIS在这类应用中的目标是保证资源的最合理配置和发挥最大效益。
◆ 城市规划和管理 (Urban Planning and Management)
空间规划是GIS的一个重要应用领域,城市规划和管理是其中的主要内容。例如,在大规模城市基础设施建设中如何保证绿地的比例和合理分布、如何保证学校、公共设施、运动场所、服务设施等能够有最大的服务面(城市资源配置问题)等。
◆ 土地信息系统和地籍管理 (Land Information System and Cadastral Applicaiton)
土地和地籍管理涉及土地使用性质变化、地块轮廓变化、地籍权属关系变化等许多内容,借助GIS技术可以高效、高质量地完成这些工作。
◆ 生态、环境管理与模拟 (Environmental Management and Modeling)
区域生态规划、环境现状评价、环境影响评价、污染物削减分配的决策支持、环境与区域可持续发展的决策支持、环保设施的管理、环境规划等。
◆ 应急响应 (Emergency Response)
解决在发生洪水、战争、核事故等重大自然或人为灾害时,如何安排最佳的人员撤离路线、并配备相应的运输和保障设施的问题。
◆ 地学研究与应用 (Application in GeoScience)
地形分析、流域分析、土地利用研究、经济地理研究、空间决策支持、空间统计分析、制图等都可以借助地理信息系统工具完成。
◆ 商业与市场 (Business and Marketing)
商业设施的建立充分考虑其市场潜力。例如大型商场的建立如果不考虑其他商场的分布、待建区周围居民区的分布和人数,建成之后就可能无法达到预期的市场和服务面。有时甚至商场销售的品种和市场定位都必须与待建区的人口结构(年 龄构成、性别构成、文化水平)、消费水平等结合起来考虑。地理信息系统的空间分析和数据库功能可以解决这些问题。房地产开发和销售过程中也可以利用GIS功能进行决策和分析。
◆ 基础设施管理 (Facilities Management)
城市的地上地下基础设施(电信、自来水、道路交通、天然气管线、排污设施、 电力设施等)广泛分布于城市的各个角落、且这些设施明显具有地理参照特征的。它们的管理、统计、汇总都可以借助GIS完成,而且可以大大提高工作效率。
◆ 选址分析 (Site Selecting Analysis)
根据区域地理环境的特点,综合考虑资源配置、市场潜力、交通条件、地形特征、环境影响等因素,在区域范围内选择最佳位置,是GIS的一个典型应用领域,充分体现了GIS的空间分析功能。
◆ 网络分析 (Newwork System Analysis)
建立交通网络、地下管线网络等的计算机模型,研究交通流量、进行交通规则、处理地下管线突发事件(爆管、断路)等应急处理。 警务和医疗救护的路径优选、车辆导航等也是GIS网络分析应用的实例。
◆ 可视化应用 (Visualization Application)
以数字地形模型为基础,建立城市、区域、或大型建筑工程、著名风景名胜区的三维可视化模型,实现多角度浏览,可广泛应用于宣传、城市和区域规划、大型工程管理和仿真、旅游等领域。
◆ 分布式地理信息应用 (Distributed Geographic Information Application)
随着网络和Internet技术的发展,运行于Intranet或Internet环境下的地理信息系统应用类型,其目标是实现地理信息的分布式存储和信息共享,以及远程空间导航等。
GIS常用软件
国外的:
AutoCAD Map3d
ArcGIS(包括ArcGIS, MapObjects, ArcIMS、ArcSDE、ArcEngine、ArcServer等)
MapInfo
GeoMedia
MGE
SmallWorld
Grass
国内的:
Supermap
MapGIS
GeoStar
TopMap
GeoBean
VRMap
MapEngine
geobrain
新闻名称:分布式GIS技术体系 分布式锁
文章地址:http://pwwzsj.com/article/doijcsp.html