Concept-第19章翻译

 

19 内容管理
这篇文章主要讲了oracle内容管理特性的概述
 
这篇文章包括下面的内容:
*内容管理的介绍
*在oracle中XML的概述
*LOBs的概述
*oracle text的概述
*oracle Ultra Search的概述
*oracle interMedia的概述
*oracle Spatial概述
 
内容管理的介绍
Oracle数据库包括数据类型来处理internet信息的各种类型,比如:关系数据,对象关系数据,XML,文本,声音,录象,图片,以及地理空间信息。这些类型是作为数据库中的原始类型出现的。可以通过使用SQL语句来查询这些类型信息。一个单独的SQL语句能够包括属于这些数据类型中的任何一个类型的数据。
当应用程序发展需要包含的数据类型越来越丰富时,则需要处理下面的数据类型:
*简单的结构化数据
*复杂的结构化数据
*半结构化数据
*非结构化数据
 
通常情况下,关系模型能够成功地处理简单的结构化数据—使用简单的表可以容纳简单化的数据。Oracle添加对象关系特性以便应用程序能够处理负复杂的结构化数据—集合,引用,用户自定义的类型等等。队列技术,比如oracle高级流先进队列,处理信息和其他的半结构化的数据。这篇文章讨论了支持半结构化数据oracle的技术。
非结构化的数据不能够被分解为标准的组件。关于一个员工的数据能够被结构化为姓名(可能是一个字符串),一个身份证(可能是一个数字),薪水等等结构。但是,如果你处理一个张照片的话,照片本身是半结构化数据并且是由0和1组成的长的数据流。这些0和1被用来表示像素的打开或者关闭,以便你能够在显示图片,但是图片不能够分解为任何数据库的存储结构。
非结构化的数据比如:文本,图片,还是视频片段,电影,以及音频波形等所需要的存储空间非常的大—一个典型的员工记录可能是数百个字节,但是对于多媒体的数据最小的大小也要员工记录大小的上千倍大小。一些多媒体数据可能存放在操作系统文件中,但是应用系统需要从数据库中来访问这些数据。
 
在oracle中的XML的概述
XML(Extensible Markup Language,可扩展标记语言)是一种基于标签的标记语言,这样让开发者根据自己的需要来创建标签来描述需要在应用程序和系统之间交换的数据。XML是是作为业界通用的信息交换语言。由于XML采用纯文本格式,所以是易读的。因为XML是纯文本格式,XML文档和基于XML的消息能够通过一般的通信协议比如:HTTP,或者FTP很容易地传输数据。
Oracle XML DB将XML作为数据库的原生数据类型。Oracle XML DB不是一个单独的服务器。XML数据模型可以存储非结构化数据也可以存储结构化数据。应用程序能够使用标准的SQL语句和XML操作符从SQL语句中生成复杂的XML文档并且进行存储。
Oracle XML DB既支持面向内容的数据访问和面向数据的数据访问。对于那些将XML作为文档(新闻故事,文章等等)的开发者来说,oracle XML DB提供了一个可以访问的XML资料库,这个资料库可以通过标准的协议和SQL语句来访问。
开发者还可以使用 XML 处理结构化数据(例如,发票,地址等)。Oracle XML DB 具有原生的 XML 类型(native XMLType),并支持 XML Schema(XML 模式),XPath,XSLT,DOM 等技术。查询量大的系统适合采用面向数据的数据访问。
Oracle XML开发包(XDK)含用于读取,操作,转换,以及展示存储在文件系统中或者在存储在数据库中的XML文档。JAVA,C以及C++语言都可以使用XDK。不象许多其他的共享版以及试用版的XML组件,oracle XDKs产品可以提供全面的技术支持,并且具有商业发布许可。Oracle XDKs是由下面的组件组成:
*XML Parser(XML解解析器):此组件使用业界的DOM和SAX接口创建和解析XML数据,支持Java, C,C++;
*XSLT Processor(XSLT处理器):将XML数据转换或者提交其他基于文本格式的数据,比如:HTML;
*XML Schema Processor(XML模式处理器):使用XML简单的复杂的数据类型来支持Java,C,C++;
*XML Class Generator(XML类生成器):从XSL模板中自动地生成Java,以及C++类来为WEB表单或者应用程序传输XML数据;
*XML QSL工具:从SQL查询结果生成的XML文档以及DTDs,来支持Java;
*XSQL Servlet:在服务器端结合XML,SQL,以及XSLT来产生动态的WEB内容;
 
LOBs的概述
大对象(LOB)数据类型BLOB,CLOB,NLOB以及BFILE使你能够存储和操纵二进制或者是字符格式的大型非结构化的数据,比如:文本,图片,视频,以及音频波动。大对象数据类型能够提供高效的,随机的以及按块来访问这些数据的存储机制。
随着internet的快速增长以及应用程序内容的多种多样,数据库支持一个能够履行下面功能的数据类型是势在必行的:
*能够存储非结构化的数据
*为大型数据的存储访问进行了优化;
*在存储在数据库中或者是文件系统中的大型非结构化的数据提供一个统一的访问方式;
 
Oracle Text概述
Oracle Text组件能够对文档或者文本信息进行索引,从而实现快速准确地获取信息,该组件可以在internet内容管理的应用程序,电子商务编目程序,新闻服务,招聘系统等等。该组件可以索引存储在文件系统中,数据库中或者是WEB网页中的内容。
Oracle Text允许文本搜索结合常规的在数据库中的一个SQL语句搜索功能。Oracle Text 组件可以根据文档内容,元数据或者是属性等来进行查找文档。Oracle Text 的SQL API使Oracle Text 搜索简单化并且直接创建以及维护文本索引,来运行文本搜索。
Oracle Text是完全集成在oracle 数据库中的,使Oracle Text 组件也具有高性能和可伸缩性。文本索引是在数据库中,并且文本查询也运行在oracle数据库进程中。Oracle优化器能够为任何查询选择最好的执行计划,为包括文本以及结构化的标准的即席查询提供最好的性能。额外的优势包括下面:
*Oracle Text 组件 支持多语言查询和多语言索引;
*在XML文档中你可以为查询使用索引和定义段。段查询让你可以使查询范围缩小到对在整个文档中的一个文本块的查询。Oracle Text 能够自动地为你创建XML段;
*一个文本索引可以跨越许多文本列,通过跨越多个文本列为文本查询提供最好的性能;
*Oracle Text 提高了在文本查询中的常规操作的性能,如:出现频率统计;
*Oracle Text 组件支持可伸缩性特性,比如:复制;
*Oracle Text 组件支持本地分区索引;
 
Oracle文本索引类型
存在有三个文本索引类型来满足各种文本查询的需要:
*标准的索引用于对文档或者WEB页面进行传统的全文本搜索。内容索引类型提供了一个丰富的文本查询功能,来查询你需要的文本内容,而不会返回你不需要的结果;
*编目索引类型:特地为为电子商务编目设计的。这种编目索引为WEB环境提供灵活的查询和排序;
*分类索引类型:用于开发分类或者路由性的应用程序。这个索引是基于一系列的查询来创建的,其中每个查询定义了分类和路由的条件;
Oracle文本也提供了子串和前缀索引。子串索引为左截取通配符或者两边截取通配符的查询改进了性能。前缀索引为右截取通配符查询改进了性能。
 
Oracle Text文档服务
Oracle Text为查看文本提供了许多工具,不管这个文本是存储在哪里:
*Oracle Text通过Inso公司的过滤技术来支持超过150种格式类型的文档,包括所有的公共的文档格式如:XML,PDF,以及MS Office。你能够创建子定义的过滤器;
*你能够查询任何文本的HTML版本,包括格式文档,比如:PDF,MS Office等等;
*你可以查看任何文本的HTML版本,将搜索词突出显示并且在文本中使用导航来指向搜索词的上一个或者下一次;
* Oracle Text提供标记信息;比如:每个搜索词在文本中的偏移位置和长度被第三方软件使用;
 
Oracle Text查询包
CTX_QUERY PL/SQL包能够别用来产生查询反馈,出现统计信息并且创建存储在数据库中的SQL查询表达式。
 
 
Oracle Text的高级特征
使用Oracle Text,你能够基于它们的文本,元数据或者属性来查找,分类以及聚集文档。
文档分类是基于文档内容的执行某种动作。此动作可以是分配一个文档一个分类ID以方便将来的查询以及方便给用户传输文档。分类操作的结果是一个经过分类的集合,或者是一个流。例如:假设有一系列新闻文章。你可以定义一个规则来代表金融类文章。这个规则本质上是一个或者多个关于金融主题的查询语句。这个规则可能是关于股票,债券,或收入的查询。当这个文档满足分类的规则,应用程序就会采取活动,比如:给文档标记为金融类或者将文档发送给一个或者多个用户。
聚类是一种基于模式的无监控的分类方法。接口让用户选择适当的聚类算法。每个聚类包含文档集的子集。在一个聚类中的一个文档的行为和在同一个聚类中的文档的行为比不在同一个聚类中的文档具有更大的相似性。聚类能够被用来呈现在文档集中的类似的文档。
 
Oracle Ultra Search的概述
Oracle Ultra Search是基于oracle数据库服务器端和Oracle Text技术的,提供了对多个资料库进行统一的查询和定位功能,这些资料库包括:oracle 数据库,其他的ODBC兼容数据库,IMAP邮件服务,通过WEB服务器提供的HTML文档,在磁盘上的文件等等。
Oracle Ultra Search使用一个叫爬虫(crawler)的来索引文档;这些文档存储在属于他们自己的资料库中,并且爬虫(crawler)信息被用来帮助创建索引,被创建的索引被存储在被指定的oracle数据库中的防火墙内。Oracle Ultra Search为构件内容管理系统提供所需的APIs。
 
Oracle Ultra Search有以特征:
*提供了用于在数据库中进行文本查询的一个复杂的文本查询语言;
*和oracle数据库服务以及SQL查询语句完全集成;
*提供象概念查询以及主题分析等的高级查询;
*对所有常见的文件格式进行索引(超过150种格式);
*支持全球化,包括支持中文,日语,以及韩语以及Unicode
 
Oracle interMedia的概述
Oracle interMedia组件使oracle数据库以与其他企业信息集成的方式来存储,管理,以及获取图片,视频,录音数据。Oracle interMedia组件扩展了oracle数据库在在传统,网络,电子商务,以及多媒体系统中的可靠性,可用性,以及对媒体数据的管理能力。
Oracle interMedia组件提供下面的功能来管理媒体数据:
*对在数据库中的媒体数据进行存储和获取来使数据库中的媒体数据和相关的业务数据保持同步;
*支持流行的图片,视频以及音频格式;
*抽取多媒体数据的格式和应用元元素,并存储到XML文档中;
*提供了针对多媒体数据的对象访问接口和关系访问接口的服务;
*通过传统接口以及WEB接口来进行数据访问;
*通过使用指定的索引根据与多媒体数据相关的数据,多媒体元数据以及多媒体内容进行查询操作;
*图片处理功能,比如;缩略图的生成;
*通过RealNetworks和Windows Media Streaming Servers递交多媒体数据;
Oracle interMedia为Oracle JDeveloper 10g, Oracle Content Management SDK, Oracle Application Server Portal, Oracle applications, and Oracle partners提供多媒体数据的服务。
 
Oracle Spatial的概述
Oracle Spatial是设计用来对位置应用系统和地理信息系统(GIS)的用户提供更加简单,更加自然地方式来管理空间数据。当空间数据被存储在oracle数据库中时,这样会使空间数据与数据库中的其他数据的操作,获取以及相互关联更加容易。
空间数据的一个常见的例子是地图。一个地图是一个二维对象,包含点,线,以及那些代表城市的多边形,以及在那些如洲或者省的政治上的边界线。地图是一个可视化的地理信息。存在于地球表面的城市,马路以及政治边界线被显示在二维的显示器上或者纸上,保留了对象之间的相对位置和相对距离。
说明这些对象的地球位置的数据(比如:经度和纬度)是空间数据。当生成可视化地图时,空间数据被用来在一个二维纸上规划对象的位置。一个GIS系统被经常用来存储,获取以及绘制这个地理相关的空间数据。
使用Oracle Spatial组件存储的空间数据的类型(不是GIS数据)包括来自CAD的数据以及CAM系统的数据。代替操作地理规模的GIS系统,CAD/CAM处理的是更小规模的数据,比如自动引擎或者印刷电路板。
GIS系统和CAD/CAM系统的不同之处就是数据的精确性和数据的大小,而不是数据的复杂性。这些系统可能会处理数据量相同。在地理规模上,一个桥的位置偏差十分之几英寸不会对道路建设带来任何的显著的问题,而一个引擎的活塞的直径有十分之几英寸的偏差的会就会使引擎不再能够使用。
除了这个之外,数据的复杂性与 空间对象的绝对规模无关。例如;一个印刷电路板可能有上千个对象在其表面,在其小的区域内包含的信息比在道路建设蓝图上呈现的细节更加的复杂。
上述的两种系统都需要对非空间和空间属性的特征的集合进行存储,获取,更新,或者查询。比如:非空间属性有名字,土壤类型,土地使用类型,以及零件编号等。空间属性有描述空间对象形状的的几何坐标或者向量表示。
Oracle Spatial组件为方便对数据库中的空间特征的集合的存储,获取,更新以及查询提供了一个SQL模式和功能。Oracle Spatial组件是由下面组成:
*一个数据库模式(MDSYS),用来提供被支持的集合数据类型的存储结构,语法以及语义;
*一个空间数据的索引机制;
*用于进行空间选定查询,空间关联查询,以及其他空间分析操作的操作符,函数以及存储过程;
*与空间操作和优化操作有关的函数和存储过程;
*在技术上处理关于点,线,面的拓扑数据模型;
*网络数据模型,用于呈现在网络中被模型化的节点,以及连接线的容量或者对象;
*GeoRaster,用于让你存储,索引,查询,分析以及传送GeoRaster数据的一个特性,GeoRaster 数据指光栅图像(raster image)与栅格数据(gridded data)及相关的元数据

转载自:https://blog.csdn.net/daimin1983/article/details/2520507

You may also like...

退出移动版