构建和转换XML,在SQLServer中的使用

XML查询技术

XML文档以一个纯文本的形式存在,主要用于数据存储。不但方便用户读取和使用,而且使修改和维护变得更容易。

 

在 Oracle 数据库 10g 第 2 版中,Oracle 引入了一个与该数据库集成的全功能自带 XQuery 引擎,该引擎可用于完成与开发支持 XML 的应用程序相关的各种任务。XQuery 是一种用于处理 XML 数据模型的查询语言,它实际上可操作任何类型的可用 XML 表达的数据。尽管 Oracle XQuery 实施使您可以使用数据库数据和外部数据源,但在处理数据库中存储的结构化数据方面,Oracle XML DB 通常可以显著提高性能。

原文地址:

XML数据类型

XML是SQL Server中内置的数据类型,可用于SQL语句或者作为存储过程的参数。用户可以直接在数据库中存储、查询和管理XML文件。XML数据类型还能保存整个XML文档。XML数据类型和其他数据类型不存在根本上的差别,可以把它用在任何普通SQL数据类型可以使用的地方。
示例1:创建一个XML变量并用XML填充

DECLARE @doc XML
SELECT @doc='<Team name="Braves" />';

示例2:创建XML数据类型列

CREATE TABLE t1(
column1 INT,
column2 XML,
CONSTRAINT pk_column1 PRIMARY KEY(column1));

在上面的示例中,column2列是XML数据类型列。
示例3:不能将XML数据类型列设置为主键或外键

CREATE TABLE t1(
column1 INT,
column2 XML,
CONSTRAINT pk_column1 PRIMARY KEY(column2));

执行上面的代码,报错如下:
消息1919,级别16,状态1,第1 行
表't1' 中的列'column2' 的类型不能用作索引中的键列。
消息1750,级别16,状态0,第1 行
无法创建约束。请参阅前面的错误消息。
XML数据类型的使用限制
只有STRING数据类型才能转换成XML。
XML列不能应用于GROUP BY语句中
XML数据类型存储的数据不能超过2GB
XML数据类型字段不能被设置成主键或者外键或称为其一部分。
Sql_variant数据类型字段的使用不能把XML数据类型作为种子类型。
XML列不能指定为唯一的。
COLLATE子句不能被使用在XML列上。
存储在数据库中的XML仅支持128级的层次。
表中最对只能拥有32个XML列。
XML列不能加入到规则中。
唯一可应用于XML列的内置标量函数是ISNULL和COALESCE。
具有XML数据类型列的表不能有一个超过15列的主键。

SQL Server对于XML支持的核心在于XML数据的格式,这种数据类型可以将XML的数据存储于数据库的对象中,比如variables, columns, and parameters。当你用XML数据类型配置这些对象中的一个时,你指定类型的名字就像你在SQLServer 中指定一个类型一样。

本文提供的示例不仅演示了在什么场合下以及如何使用 XQuery 查询、构建和转换 XML,而且还演示了如何监控和分析 XQuery 表达式的性能执行,从而找到更高效的方法来处理同一工作负载。

类型化的XML和非类型化的XML

可以创建xml类型的变量,参数和列,或者将XML架构集合和xml类型的变量、参数或列关联,这种情况下,xml数据类型实例称之为类型化xml实例。否则XML实例称为非类型化的实例。

XML的数据类型确保了你的XML数据被完好的构建保存,同时也符合ISO的标准。在定义一个XML数据类型之前,我们首先要知道它的几种限制,如下:

基于关系数据构建 XML

 

XML数据类型方法

XML数据类型共有5种方法
query():执行一个XML查询并返回查询结果(返回一个XML数据类型)。
示例4

DECLARE @xmlDoc XML--声明XML类型的变量@xmlDoc
SET @xmlDoc='<students>
    <class name="数学" NO="8501">
        <student>
            <name>李林</name>
            <sex>男</sex>
            <age>16</age>
            <address>江苏</address>
        </student>
    </class>
</students>'--将XML实例分配给变量@xmlDoc
SELECT @xmlDoc.query('/students/class/student') AS test
--用query()查询@xmlDoc变量实例中标签<student>的子元素

查询结果如图所示
图片 1
点击查询结果
图片 2
如想查询标签

DECLARE @addr XML--声明一个XML类型变量@addr
SET @addr='/students/class/student'
SELECT @addr.exist('/students/class="江苏"') AS 返回值

结果如图所示
图片 3

注:exsit()方法的参数不必做精确定位

Value():计算一个查询并从XML中返回一个简单的值(只能返回单个值,且该值为非XML数据类型)。
Value()方法有2个参数XQuery和SQLType,XQuery参数表示命令要从XML实例内部查询数据的具体位置,SQLType参数表示value()方法返回的值的首选数据类型。
示例6

DECLARE @xmlDoc XML--声明XML类型的变量@xmlDoc
DECLARE @classID INT--声明INT类型的变量@classID
SET @xmlDoc='<students>
    <class name="数学" NO="8501">
        <student>
            <name>李林</name>
            <sex>男</sex>
            <age>16</age>
            <address>江苏</address>
        </student>
    </class>
</students>'--将XML实例分配给变量@xmlDoc
SET @classID=@xmlDoc.value('(/students/class/@NO)[1]','INT')
--将value()方法返回值赋值给变量@classID
SELECT @classID AS classID

查询结果如图所示
图片 4

注:SQLType不能是XML数据类型,公共语言运行时(CLR)用户定义类型,image,text,ntext或sql_variant数据类型,但可以是用户自定义数据类型SQL。

Modify():在XML文档的适当位置执行一个修改操作。它的参数XML_DML代表一串字符串,根据此字符串表达式来更新XML文档的内容。
示例7:在@xmlDoc的实例中,元素

DECLARE @xmlDoc XML--声明XML类型的变量@xmlDoc
SET @xmlDoc='<students>
    <class name="数学" NO="8501">
        <student>
            <name>李林</name>
            <sex>男</sex>
            <age>16</age>
            <address>江苏</address>
        </student>
    </class>
</students>'
SELECT @xmlDoc AS '插入节点前信息'
SET @xmlDoc.modify('insert <学历>本科</学历> after (students/class/student/age)[1]')
SELECT @xmlDoc AS '插入节点后信息'

查询结果插入节点后信息如图所示
图片 5

注:modify()方法的参数中insert和其他关键字必须小写,否则会报错

Nodes():允许把XML分解到一个表结构中。此方法将XML数据类型实例拆分为关系数据,并返回包含原始XML数据的行集。
示例8:依然用@locat参数的实例来示范

DECLARE @locat XML--声明XML变量@locat
SET @locat=
'<root>
    <location locationID="8">
        <step>8的步骤</step>
        <step>8的步骤</step>
        <step>8的步骤</step>
    </location>
    <location locationID="9">
        <step>9的步骤</step>
        <step>9的步骤</step>
        <step>9的步骤</step>
    </location>
    <location locationID="10">
        <step>10的步骤</step>
        <step>10的步骤</step>
        <step>10的步骤</step>
    </location>
    <location locationID="11">
        <step>11的步骤</step>
        <step>11的步骤</step>
        <step>11的步骤</step>
    </location>
</root>'--@locat变量的实例

SELECT T.Loc.query('.') AS result
FROM @locat.nodes('/root/location') T(Loc)
GO

查询结果如下图所示
图片 6

  • 一个实例的XML列不能包含超过2GB的数据。
  • 一个XML的列不能是索引。
  • XML对象不能使用Group By的子句中。
  • XML的数据类型不支持比较和排序。

在需要的情况下(例如,向 Web 服务发送结果),您可能要基于关系数据构建 XML。要在 Oracle 数据库 10g 第 2 版之前的版本中完成此任务,通常需要使用 SQL/XML 生成函数,如 XMLElement、XMLForest 和 XMLAgg()。在 Oracle 数据库 10 g 第 2 版中,XQuery 将比这些函数更为高效。具体而言,在 XQuery 表达式内部使用 ora:view XQuery 函数,您可以查询现有的关系表或视图以及即时构建 XML,从而不必通过关系数据显式创建 XML 视图。列表 1 中的 PL/SQL 代码演示了如何使用 ora:view 基于示例数据库模式 HR 的默认员工关系表中存储的数据构建 XML 文档。

引用:

XQuery简介

XQuery是一种查询语言,可以查询结构化或者半结构化的数据。SQL Server 2008中对XML数据类型提供了支持,可以存储XML文档,然后使用XQuery语言进行查询。

定义一个XML变量

列表 1:使用 ora:view 基于关系数据创建 XML

摘要

FOR XML子句

通过在SELECT语句中使用FOR XML子句可以把数据库表中的数据检索出来并生成XML格式。SQL Server 2008支持FOR XML的四种模式,分别是RAW模式,AUTO模式,EXPLICIT模式和PATH模式。

DECLARE @ClientList XML
SET @ClientList =
'<?xml version="1.0" encoding="UTF-8"?>
<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>'
SELECT @ClientList
GO
BEGIN
IF(DBMS_XDB.CREATEFOLDER('/public/employees')) THEN
DBMS_OUTPUT.PUT_LINE('Folder is created');
ELSE
DBMS_OUTPUT.PUT_LINE('Cannot create folder');
END IF;
COMMIT;
END;
/
DECLARE
XMLdoc XMLType;
BEGIN
SELECT XMLQuery(
'for $j in 1
return (
{
for $i in ora:view("HR", "employees")/ROW
where $i/EMPLOYEE_ID <= 102
return (
{xs:string($i/EMPLOYEE_ID)}
{xs:string($i/LAST_NAME)}
{xs:integer($i/SALARY)}
)} )'
RETURNING CONTENT) INTO XMLdoc FROM DUAL;
IF(DBMS_XDB.CREATERESOURCE('/public/employees/employees.xml', XMLdoc)) THEN
DBMS_OUTPUT.PUT_LINE('Resource is created');
ELSE
DBMS_OUTPUT.PUT_LINE('Cannot create resource');
END IF;
COMMIT;
END;
/

本文介绍了SQL Server 2005能够支持的XQuery的各方面特性如FLWOR语句,XQuery的操作,if-then-else结构,XML的构造函数,XQuery的内置函数,类型的转换操作符,并举例说明了上述XQuery功能的应用和操作。本文同时也对SQL Server 2005所不能支持的XQuery的特性进行了分析讨论,并提出了实际工作中的解决方案。在本文的最后章节中,详细举例介绍了三种特定的XQuery应用场景。

FOR XML RAW

将表转换成元素名称是row,属性名称为列名或者列的别名。
示例9:将Student表转换为XML格式(FOR XML RAW)
Student表的数据如图所示
图片 7
执行语句:

SELECT * FROM Student FOR XML RAW;

查询结果如图所示
图片 8
图片 9

这个例子通过使用DECLARE  声明去定义名为@ClientList 的变量,当我声明变量的时候,只需要包含XML的数据类型的名字在变量名后。

在列表 1 中的第一个 PL/SQL 过程中,您只是在 XML 信息库中创建了一个新文件夹。在该信息库文件夹中,您随后将存储此处显示的第二个 PL/SQL 过程中创建的 XML 文档。第二个 PL/SQL 过程首先发出 SELECT 语句,该语句使用 XMLQuery SQL 函数基于关系数据构建 XML。对于 XQuery 表达式(XMLQuery 在此处将其用作参数)而言,请注意嵌套的 FLWOR 表达式中使用的 ora:view XQuery 函数。在该示例中,ora:view 获取两个输入参数,即“HR”和“employees”,它们指示该函数查询属于 HR 数据库模式的员工表。因此,ora:view 将返回一个表示 HR.employees 表行的员工 XML 文档序列。但为了节省结果文档中的空间,只将前三个员工记录传递给结果序列。这是通过在 FLWOR 表达式的 where 子句中指定 $i/EMPLOYEE_ID <= 102 而实现的。请注意 FLWOR 表达式的 return 子句中使用的 xs:string()xs:integer() XQuery 类型表达式。实际上,此处使用的这两个 XQuery 表达式不仅将 XML 节点值转换为相应的类型,而且还将提取这些节点值。随后,生成的员工 XML 文档作为 employees.xml 保存到之前在列表 1 中另一个 PL/SQL 过程中创建的 /public/employees XML 信息库文件夹。要确保此操作已完成,可执行以下查询:

引用:

FOR XML AUTO

使用表名称作为元素名称,使用列名称作为属性名称,SELECT关键字后面列的顺序用于XML文档的层次。
示例10:将Student表转换为XML格式(FOR XML AUTO)
执行语句:

SELECT * FROM Student FOR XML AUTO;

查询结果如图所示
图片 10
图片 11

我设定了变量的值,然后使用select 来检索这个值。和我们想的一样,它返回了XML的文档。如下:

SELECT XMLQuery('for $i in fn:doc("/public/employees/employees.xml")
return;
$i'
RETURNING CONTENT) AS RESULT FROM DUAL;

内容目录

FOR XML EXPLICIT

允许用户显式地定义XML树的形状,不受AUTO模式中的种种限制。不能将FOR XML EXPLICIT直接用在SELECT子句中。
示例11:将xmlTest表转换为XML格式(FOR XML EXPLICIT)
XmlTest表的数据如图所示
图片 12

SELECT DISTINCT 1 AS TAG,--指定顶级层级序号1
NULL AS PARENT,--该层级没有父级
NULL AS '班级信息!1!',
NULL AS '班级信息!2!班级',
NULL AS '班级信息!2!班级类型',
NULL AS '班级信息!2!班主任',
NULL AS '学生信息!3!学号!Element',
NULL AS '学生信息!3!学生姓名!Element',
NULL AS '学生信息!3!性别!Element',
NULL AS '学生信息!3!总分!Element'--设置所有层级元素和属性命名,暂时不对这些元素赋值
--例如在“学生信息!3!总分!Element”格式中,学生信息是元素名,3表示该元素所处层级,总分表示属性名
--Element指出生成以属性单独为一行的XML格式
UNION ALL--层级之间用UNION ALL相连
SELECT DISTINCT 2 AS TAG,--指定二级层级序号2
1 AS PARENT,--父级序号是序号为1的层级
NULL,--在层级的代码中已列出了所有层级元素和属性命名,因此这里给元素和属性做赋值。这句语句对应层级代码中“NULL AS '班级信息!1!'”,说明我希望该元素作为独立成行的标签,没有赋值。
班级,--对层级中的“NULL AS '班级信息!2!班级'”赋值,将xmlTest表中的班级赋值给属性班级
班级类型,--对层级中的“NULL AS '班级信息!2!班级类型'”赋值,将xmlTest表中的班级赋值给属性班级类型
班主任,--同上
NULL,--这句语句开始对应的是层级的属性,因此在层级的代码中不做赋值,在下面层级的代码中做赋值
NULL,
NULL,
NULL
FROM xmlTest--指出上面赋值的数据源来自于xmlTest表
UNION ALL--各个层级之间用UNION ALL连接
SELECT 3 AS TAG,--指定3级层级序号3
2 AS PARENT,--父级是序号为2的层级
NULL,--对应层级的”NULL AS '班级信息!1!'“语句,不希望它有值,所以不做赋值
NULL,--这三个NULL对应层级的各个属性,在层级的代码中已经做过赋值,因此在这里不做赋值
NULL,
NULL,
学号,--对应层级1代码中的层级3属性,在层级代码3中进行赋值
学生姓名,
性别,
年级总分
FROM xmlTest
FOR XML EXPLICIT;--将上述查询转换为XML,不能漏掉,否则结果会以表格形式显示

查询结果如图所示
图片 13
图片 14
在结果图中我们发现,红框中3个班级信息列在一起,而所有学生都列在高一3班下,这不是我们想要的结果,我们希望每个班级对应自己的学生。那么如何解决此类问题呢,这涉及到排序。

注:如果层级中有多个数据完全重复,可以在该层级对应的代码前加DISTINCT关键字去除重复元素。

首先删除代码行末的FOR XML EXPLICIT语句,仅仅执行剩下的部分,使结果以表格形式呈现,那么结果如下
图片 15
这个表格每行的顺序也代表了该表格转化为XML文档后内容显示顺序。图中层级2(TAG=2)的几行,位置都在一起,这也就是为什么层级3的所有数据都在高一3班下面了。我们需要对表格每行的顺序进行调整,使学生所在行按照xmlTest表中的数据逻辑分散在班级行之下。但是根据上面的表格发现,不管按照什么字段排序,都不可能达到效果。
正确代码如下

SELECT DISTINCT 1 AS TAG,
NULL AS PARENT,
NULL AS '班级信息!1!',
NULL AS '班级信息!2!班级',
NULL AS '班级信息!2!班级类型',
NULL AS '班级信息!2!班主任',
NULL AS '学生信息!3!学号!Element',
NULL AS '学生信息!3!学生姓名!Element',
NULL AS '学生信息!3!性别!Element',
NULL AS '学生信息!3!总分!Element'
UNION ALL
SELECT DISTINCT 2 AS TAG,
1 AS PARENT,
NULL,
班级,
班级类型,
班主任,
NULL,
NULL,
NULL,
NULL
FROM xmlTest
UNION ALL
SELECT 3 AS TAG,
2 AS PARENT,
NULL,
班级,
班级类型,
班主任,
学号,
学生姓名,
性别,
年级总分
FROM xmlTest
ORDER BY [班级信息!2!班级],[学生信息!3!学号!Element]
FOR XML EXPLICIT;

对比第一次代码,我们发现上面的代码不止在行末对数据按元素属性进行了排序,还在赋值的代码中有所改动。在层级1代码中完全没有改动,因为层级1的代码作用是设置XML格式的,对数据排序没有影响。在下面几个层级的赋值部分,每个层级的代码中都对上面几个层级的元素重复赋值,这样做使结果的表格中不再有那么多属性值是NULL,可以方便排序。最后再按照元素[班级信息!2!班级]和[学生信息!3!学号!Element]排序。让我们看看结果如何。
运行上面的代码,但不运行FOR XML EXPLICIT语句,看看表格中数据内容和行顺序是否改变
图片 16
如图所示,发现行数据和学生数据的顺序显示正确。运行所有代码得到XML文档,结果如图所示
图片 17
由于XML文档内容过长,不贴图了,直接复制所有XML内容展示一下。

<班级信息>
  <班级信息 班级="高一1班" 班级类型="创新班" 班主任="李玉虎">
    <学生信息>
      <学号>20180101</学号>
      <学生姓名>李华</学生姓名>
      <性别>男</性别>
      <总分>5.680000000000000e 002</总分>
    </学生信息>
    <学生信息>
      <学号>20180103</学号>
      <学生姓名>孙丽</学生姓名>
      <性别>女</性别>
      <总分>3.390000000000000e 002</总分>
    </学生信息>
    <学生信息>
      <学号>20180108</学号>
      <学生姓名>吴伟</学生姓名>
      <性别>男</性别>
      <总分>5.280000000000000e 002</总分>
    </学生信息>
  </班级信息>
  <班级信息 班级="高一2班" 班级类型="重点班" 班主任="姜杰">
    <学生信息>
      <学号>20180102</学号>
      <学生姓名>张三</学生姓名>
      <性别>男</性别>
      <总分>6.270000000000000e 002</总分>
    </学生信息>
    <学生信息>
      <学号>20180104</学号>
      <学生姓名>袁康</学生姓名>
      <性别>男</性别>
      <总分>4.820000000000000e 002</总分>
    </学生信息>
    <学生信息>
      <学号>20180106</学号>
      <学生姓名>赵四</学生姓名>
      <性别>男</性别>
      <总分>5.680000000000000e 002</总分>
    </学生信息>
  </班级信息>
  <班级信息 班级="高一3班" 班级类型="提高班" 班主任="师从光">
    <学生信息>
      <学号>20180105</学号>
      <学生姓名>王婷</学生姓名>
      <性别>女</性别>
      <总分>7.610000000000000e 002</总分>
    </学生信息>
    <学生信息>
      <学号>20180107</学号>
      <学生姓名>周其</学生姓名>
      <性别>女</性别>
      <总分>3.480000000000000e 002</总分>
    </学生信息>
    <学生信息>
      <学号>20180109</学号>
      <学生姓名>甄诚</学生姓名>
      <性别>女</性别>
      <总分>7.020000000000000e 002</总分>
    </学生信息>
  </班级信息>
</班级信息>

将上面的结果对比一下原始xmlTest表,看看每个班级和它下属学生的层级关系是否有误。

注:写FOR XML EXPLICIT代码要注意,层级1的代码中先设置层级结构,不要先急着赋值。在下属层级的代码中对层级1中的代码进行赋值,最好重复赋值,不然就会出现文中的排序问题。如果某个层级出现重复数据,在该层级的代码前加DISTINCT关键字。解决排序问题最好的办法是对各个层级的属性重复赋值并在末尾用ORDER BY按层级属性排序。

仔细观察上面的XML文档,发现总分属性的值是个float类型,要把它转换成int,只需要把层级3中对总分的赋值代码改成CAST(年级总分 AS int)
图片 18

<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>

该查询应生成以下输出:

导言

FOR XML PATH

PATH模式提供了一种较简单的方法来混合元素及属性。在PATH模式中,列名或列别名被作为XPATH表达式来处理,这些表达式指定了如何将值映射到XML中。默认情况下,PATH模式为每一样自动生成

 


100
King
24000


101
Kochhar
17000


102
De Haan
17000

SQL Server 2005中的XML数据类型

没有名称的列

下面介绍一种简单的FOR XML PATH应用方式

SELECT 2 3 FOR XML PATH;--将2 3的值转换成xml格式

查询结果如图所示
图片 19

注:如果提供了空字符串FOR XML PATH(‘’)则不会生成任何元素。

SELECT 2 3 FOR XML PATH('');--将2 3的值转换成xml格式并去掉<row>

查询结果如图所示
图片 20
示例12:利用xmlTest表和mainTeacher表查询出xmlTest表中成绩>=700分的学生的班主任信息和学生信息,并转化成XML格式
XmlTest表数据如下图所示
图片 21
MainTeacher表数据如下图所示
图片 22
执行下面的语句

SELECT xmlTest.学号 AS '学生信息/@学号',--@符号表示该名称为属性名,斜杠表示子层级
xmlTest.学生姓名 AS '学生信息/@姓名',
xmlTest.班级 AS '学生信息/@班级',
mainTeacher.姓名 AS '学生信息/班主任信息/姓名',
mainTeacher.教师编号 AS '学生信息/班主任信息/教师编号',
mainTeacher.性别 AS '学生信息/班主任信息/性别',
mainTeacher.年龄 AS '学生信息/班主任信息/年龄',
mainTeacher.联系电话 AS '学生信息/班主任信息/联系电话'
FROM xmlTest,mainTeacher
WHERE xmlTest.年级总分>=700
AND xmlTest.班主任=mainTeacher.姓名
FOR XML PATH('result');--将根目录名改为result

查询结果如下所示

<result>
  <学生信息 学号="20180105" 姓名="王婷" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>
<result>
  <学生信息 学号="20180109" 姓名="甄诚" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>

接下来我们看看如何定义一个XML的列

在下面的例子中,我将创建一个商店客户的表,表中存储了ID和每个商店的客户信息。

USE AdventureWorks2008R2
GO
IF OBJECT_ID('dbo.StoreClients') IS NOT NULL
DROP TABLE dbo.StoreClients
GO
CREATE TABLE dbo.StoreClients
(
StoreID INT IDENTITY PRIMARY KEY,
ClientInfo XML NOT NULL
)
GO

接下来插入数据到这个表中,包括XML的文档和片段。我将声明一个XML的变量,然后用这个变量插入这个文档到表的数据行里面。

DECLARE @ClientList XML
SET @ClientList =
'<?xml version="1.0" encoding="UTF-8"?>
<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>'
INSERT INTO dbo.StoreClients (ClientInfo)
VALUES(@ClientList)
GO

尽管变量将整个XML文档插入了进来,但是它是被当做一个单一的值插入到表列里面来。

正如以上所述,创建和插入都是很直接简单的,接下来我们看一下如何创建一个XML的参数

定义一个XML参数

例如,我定义@StoreClients 作为一个输入参数,并且配置它为XML的类型

USE AdventureWorks2008R2
GO
IF OBJECT_ID('dbo.AddClientInfo', 'P') IS NOT NULL
DROP PROCEDURE dbo.AddClientInfo
GO
CREATE PROCEDURE dbo.AddClientInfo
@StoreClients XML
AS
INSERT INTO dbo.StoreClients (ClientInfo)
VALUES(@StoreClients)
GO

然后我们再看看在存储过程中如何使用XML作为参数:

DECLARE @ClientList XML
SET @ClientList =
'<?xml version="1.0" encoding="UTF-8"?>
<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>'
EXEC dbo.AddClientInfo @ClientList

过程也是很直接,先将XML数据赋值给变量,然后将变量作为参数执行SP,这是查询你会发现数据已经在表中了。

现在我们要学习一下XML类型支持的方法:query(``), value().

在这之前我们要知道一种表达式,就是XQuery,它是一种强大的脚本语言,用来获取XML的数据。SQLServer 支持这种语言的子集,所以我们能使用这种语言的表达式来检索和修改XML的数据。

在以上 XQuery 中,fn:doc XQuery 函数用于访问 Oracle XML DB 信息库中存储的单个 XML 文档。但如果要处理一些具有相同或相似结构的 XML 文档(存储在同一 XML 信息库文件夹中),应该怎么做?这种情况下,另一个用于处理 XML 信息库资源的 XQuery 函数(即 fn:collection)可能会派上用场。本文稍后将介绍几个有关如何使用 fn:collection XQuery 函数的示例。

类型化vs.非类型化的XML数据类型

TYPE命令

SQL Server支持TYPE命令将FOR XML的查询结果作为XML数据类型返回。
示例13:依然是上面的例子,将查询结果作为XML数据类型返回。

CREATE TABLE xmlType(xml_col XML);
--首先创建一个表xmlType,只有一列xml数据类型的xml_col
INSERT INTO xmlType
SELECT(--将上面的查询语句全部复制到括号中,末尾加上TYPE,表示将XML文档作为xml数据类型,并插入到表xmlType中
SELECT xmlTest.学号 AS '学生信息/@学号',
xmlTest.学生姓名 AS '学生信息/@姓名',
xmlTest.班级 AS '学生信息/@班级',
mainTeacher.姓名 AS '学生信息/班主任信息/姓名',
mainTeacher.教师编号 AS '学生信息/班主任信息/教师编号',
mainTeacher.性别 AS '学生信息/班主任信息/性别',
mainTeacher.年龄 AS '学生信息/班主任信息/年龄',
mainTeacher.联系电话 AS '学生信息/班主任信息/联系电话'
FROM xmlTest,mainTeacher
WHERE xmlTest.年级总分>=700
AND xmlTest.班主任=mainTeacher.姓名
FOR XML PATH('result'),TYPE
);
SELECT * FROM xmlType;--查询xmlType表

查询结果如图所示
图片 23
双击打开查看XML

<result>
  <学生信息 学号="20180105" 姓名="王婷" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>
<result>
  <学生信息 学号="20180109" 姓名="甄诚" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>
注意:

因为XQuery是一种非常复杂的语言,我们只是涉及了一部分他的组件,如果想要更进一步的理解它如何应用,请查看MSDN XQuery language reference.

那我们现在先来通过例子来看一下query()和value 两个方法是如何使用XML数据的。需要注意的是我接下来的测试环境是SQLServer2008 R2。实例中包含了ClientDB 数据库、ClientInfoCollection 的XML数据以及ClientInfo 表。

USE master;
GO

IF DB_ID('ClientDB') IS NOT NULL
DROP DATABASE ClientDB;
GO

CREATE DATABASE ClientDB;
GO

USE ClientDB;
GO

IF OBJECT_ID('ClientInfoCollection') IS NOT NULL
DROP XML SCHEMA COLLECTION ClientInfoCollection;
GO

CREATE XML SCHEMA COLLECTION ClientInfoCollection AS 
'<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" 
xmlns="urn:ClientInfoNamespace" 
targetNamespace="urn:ClientInfoNamespace" 
elementFormDefault="qualified">
  <xsd:element name="People">
    <xsd:complexType>
      <xsd:sequence>
        <xsd:element name="Person" minOccurs="1" maxOccurs="unbounded">
          <xsd:complexType>
            <xsd:sequence>
              <xsd:element name="FirstName" type="xsd:string" minOccurs="1" maxOccurs="1" />
              <xsd:element name="LastName" type="xsd:string" minOccurs="1" maxOccurs="1" />
              <xsd:element name="FavoriteBook" type="xsd:string" minOccurs="0" maxOccurs="5" />
            </xsd:sequence>
            <xsd:attribute name="id" type="xsd:integer" use="required"/>
          </xsd:complexType>
        </xsd:element>
      </xsd:sequence>
    </xsd:complexType>
  </xsd:element>
</xsd:schema>';
GO

IF OBJECT_ID('ClientInfo') IS NOT NULL
DROP TABLE ClientInfo;
GO

CREATE TABLE ClientInfo
(
  ClientID INT PRIMARY KEY IDENTITY,
  Info_untyped XML,
  Info_typed XML(ClientInfoCollection)
);

INSERT INTO ClientInfo (Info_untyped, Info_typed)
VALUES
(
  '<?xml version="1.0" encoding="UTF-8"?>
  <People>
    <Person id="1234">
      <FirstName>John</FirstName>
      <LastName>Doe</LastName>
    </Person>
    <Person id="5678">
      <FirstName>Jane</FirstName>
      <LastName>Doe</LastName>
    </Person>
  </People>',
  '<?xml version="1.0" encoding="UTF-8"?>
  <People xmlns="urn:ClientInfoNamespace">
    <Person id="1234">
      <FirstName>John</FirstName>
      <LastName>Doe</LastName>
    </Person>
    <Person id="5678">
      <FirstName>Jane</FirstName>
      <LastName>Doe</LastName>
    </Person>
  </People>'
);

Listing 1: 创建测试环境和数据

查询 XMLType 数据

XML数据类型的方法

FOR XML的嵌套查询

示例14:在示例12的查询结果中查询班主任联系电话

SELECT (
SELECT xmlTest.学号 AS '学生信息/@学号',
xmlTest.学生姓名 AS '学生信息/@姓名',
xmlTest.班级 AS '学生信息/@班级',
mainTeacher.姓名 AS '学生信息/班主任信息/姓名',
mainTeacher.教师编号 AS '学生信息/班主任信息/教师编号',
mainTeacher.性别 AS '学生信息/班主任信息/性别',
mainTeacher.年龄 AS '学生信息/班主任信息/年龄',
mainTeacher.联系电话 AS '学生信息/班主任信息/联系电话'
FROM xmlTest,mainTeacher
WHERE xmlTest.年级总分>=700
AND xmlTest.班主任=mainTeacher.姓名
FOR XML PATH('result'),TYPE).query('result/学生信息/班主任信息/联系电话') AS '优秀教师联系方式';

SELECT里面依然套用了示例13中被套用的代码,外面用了query方法,查询结果如下图所示
图片 24

<联系电话>15963002120</联系电话>
<联系电话>15963002120</联系电话>

The XML query() Method

query方法,通常被用来返回一个指定XML子集的无类型的XML实例,如下,用括号加单引号来实现表达式,语法:

db``_object``.query('``xquery_exp``')

当我们调用这个方法时,用真实数据库对象替换掉引号内的表达式。通过实例来比较一下结果有什么不一样。

SELECT Info_untyped.query('/People')
  AS People_untyped
FROM ClientInfo;

Listing 2: 使用query(``) 来获得<People>元素中的值

在这种情况下,将返回标签下所有的元素,包括子元素属性以及它们的值。

<People>
  <Person id="1234">
    <FirstName>John</FirstName>
    <LastName>Doe</LastName>
  </Person>
  <Person id="5678">
    <FirstName>Jane</FirstName>
    <LastName>Doe</LastName>
  </Person>
</People>

Listing 3: 结果集返回了/People 的内容

假如打算检索类型化的列中的<People> 元素的内容,我需要修改XQuery的表达式。如Listing 4

SELECT Info_typed.query(
  'declare namespace ns="urn:ClientInfoNamespace";
  /ns:People') AS People_typed
FROM ClientInfo;

Listing 4: 使用query(``) 来检索类型化的XML列,然后你运行这个语句,就会得到结果如Listing5

<People xmlns="urn:ClientInfoNamespace">
  <Person id="1234">
    <FirstName>John</FirstName>
    <LastName>Doe</LastName>
  </Person>
  <Person id="5678">
    <FirstName>Jane</FirstName>
    <LastName>Doe</LastName>
  </Person>
</People>

Listing 5: 展示结果

如上,我们发现两种结果是很接近的,唯一的区别就是类型化的列里面包含了涉及的命名空间。

如果我们打算获得子下一级,子元素的内容,我们需要修改表达式,通过添加/Person 到路径名称中,如下:

SELECT 
  Info_untyped.query(
    '/People/Person') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person') AS People_typed
FROM ClientInfo;

Listing 6: 检索 <Person> 元素

<Person id="1234">
  <FirstName>John</FirstName>
  <LastName>Doe</LastName>
</Person>
<Person id="5678">
  <FirstName>Jane</FirstName>
  <LastName>Doe</LastName>
</Person>

Listing 7: 这个结果集是非类型化数据的结果

<ns:Person xmlns:ns="urn:ClientInfoNamespace" id="1234">
  <ns:FirstName>John</ns:FirstName>
  <ns:LastName>Doe</ns:LastName>
</ns:Person>
<ns:Person xmlns:ns="urn:ClientInfoNamespace" id="5678">
  <ns:FirstName>Jane</ns:FirstName>
  <ns:LastName>Doe</ns:LastName>
</ns:Person>

Listing 8: 这个结果集是类型化数据的结果

如果我们打算去得到指定的<Person>下面的某一个元素,需要加入涉及的id属性。下面对比类型和非类型的两种情况下指定元素属性时如何获取。

SELECT 
  Info_untyped.query(
    '/People/Person[@id=1234]') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person[@id=5678]') AS People_typed
FROM ClientInfo;

Listing 9: 检索数据,指定元素

前面的没有变化,按照元素来添加表达式,然后用中括号,在中括号内添加了@id的值,结果如下

<Person id="1234">
  <FirstName>John</FirstName>
  <LastName>Doe</LastName>
</Person>

Listing 10: id为1234非类型化数据结果返回值。

对于类型化的列,我使用的id为5678.注意,这次不再需要在属性名称前加上命名空间的前缀了,只需要在元素名字前引用就足够了。

<ns:Person xmlns:ns="urn:ClientInfoNamespace" id="5678">
  <ns:FirstName>Jane</ns:FirstName>
  <ns:LastName>Doe</ns:LastName>
</ns:Person>

Listing 11: id为5678的数据结果

更进一步的展示结果,向下一级

SELECT 
  Info_untyped.query(
    '/People/Person[@id=1234]/FirstName') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person[@id=5678]/ns:FirstName') AS People_typed
FROM ClientInfo;

结果

<FirstName>John</FirstName>

<ns:FirstName xmlns:ns="urn:ClientInfoNamespace">Jane</ns:FirstName>

Listing 14: 名字的结果的展示

当然还可以通过数字索引的方式展示:

SELECT 
  Info_untyped.query(
    '/People/Person[1]/FirstName') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person[2]/ns:FirstName') AS People_typed
FROM ClientInfo;

Listing 15: 使用数字索引来引用元素下的结果

XQuery 使您可以操作基于 XML 模式以及非基于模式的数据。以下示例演示了如何使用 XMLTable 函数从 OE 演示数据库模式中查询基于 PurchaseOrder XML 模式的 XMLType 表。

XQuery入门

XML索引

由于XML数据类型最大可存储2GB的数据,因此需要创建XML索引来优化查询性能。

XML的value()方法

就如同query()方法一样简便,很多时候当你想去检索一个特定的元素或属性的时候,而不是获取XML的元素,那就可以使用value()了。这种方法只会返回一个特定的值,不作为数据类型。因此一定要传递两个参数XQuery表达式和T-SQL数据类型。下面看语法:

db``_object``.value('``xquery_exp``', '``sql_type``')

SELECT 
  Info_untyped.value(
    '(/People/Person[1]/FirstName)[1]', 
    'varchar(20)') AS Name_untyped,
  Info_typed.value(
    'declare namespace ns="urn:ClientInfoNamespace";
    (/ns:People/ns:Person[2]/ns:FirstName)[1]',
    'varchar(20)') AS Name_typed
FROM ClientInfo;

Listing 16: 检索<FirstName> 的值

在Listing16中,我指定了[1]在Xquery表达式的后面,所以结果集将只返回第一个人的名字。

Name_untyped         Name_typed
-------------------- --------------------
John                 Jane

Listing 17: <FirstName>的两个结果

当然,我们也可以检索每个实例的id的属性值,并且指定Int类型返回。

SELECT 
  Info_untyped.value(
    '(/People/Person/@id)[1]', 
    'int') AS Name_untyped,
  Info_typed.value(
    'declare namespace ns="urn:ClientInfoNamespace";
    (/ns:People/ns:Person/@id)[2]',
    'int') AS Name_typed
FROM ClientInfo;

Listing 19: 检索两个实例的id属性值

Name_untyped         Name_typed
-------------------- --------------------
1234                 5678

Listing 20: 返回两个id的属性

除了在表达式中定义你的XQuery表达式,你也能聚合的功能来进一步定义你的查询和操作数据。例如,count()功能,我们来获取每个列中<Person> 元素的个数。

SELECT 
  Info_untyped.value(
    'count(/People/Person)', 
    'int') AS Number_untyped,
  Info_typed.value(
    'declare namespace ns="urn:ClientInfoNamespace";
    count(/ns:People/ns:Person)',
    'int') AS Number_typed
FROM ClientInfo;

Listing 21: 使用count功能来检索元素个数

结果如下:

Number_untyped Number_typed
-------------- ------------
2              2

Listing 22: 每列数据中<Person> 元素的数量

另外一个常用的功能是concat(``), 它可以连接两个或多个XML元素下的数据。你可以指定你想连接的每一个部分。示例:

SELECT 
  Info_untyped.value(
    'concat((/People/Person/FirstName)[2], " ", 
      (/People/Person/LastName)[2])', 
    'varchar(25)') AS FullName
FROM ClientInfo;

Listing 23: 使用concat(``)来连接数值

FullName
-------------------------
Jane Doe

Listing 24: 连接后的返回值

名和姓被连接起来,组成一个单一的值。都来自于同一个<Person> 下,当然也可以来自不同。

SELECT ttab.COLUMN_VALUE AS OrderTotal FROM purchaseorder,
XMLTable(
'for $i in /PurchaseOrder
where $i/User = "EABEL"
return;

{$i/Reference}

{fn:sum(for $j in $i/LineItems/LineItem/Part
return ($j/@Quantity*$j/@UnitPrice))}

'
PASSING OBJECT_VALUE
) ttab;

XPath2.0简介

主XML索引

主XML索引对XML列中XML实例内的所有标记,值和路径进行索引。创建主XML索引时,相应XML列所在的表必须对该表的主键创建了聚集索引。

总结

 

我们基本上了解了XML在SQLServer 中的简单应用,从定义到使用方法。也看到了query()检索子集,也能使用value()检索独立的元素属性的值。当然除此之外还有向exist(``) andnodes() 这样方法,配合语法都以应用,这部分就不再展开讲了,大同小异。有不明白的可以私聊。更多使用方法还请访问MSDN来获取(搜索XQuery language reference)。

在以上示例中,您在 XMLTable 函数的 PASSING 子句中使用 OBJECT_VALUE 虚拟列将 purchaseorder 表作为上下文项传递给此处使用的 XQuery 表达式。XQuery 表达式计算用户 EABEL 请求的每个购买订单的总计,并为处理的每个订单生成一个 OrderTotal XML 元素。要访问生成的 XML,请使用 SELECT 列表中的 COLUMN_VALUE 虚拟列。最终的输出应如下所示:

XQuery简介

辅助XML索引

为了增强主XML索引的性能,可以创建辅助XML索引。只有创建了主XML索引后才能创建辅助XML索引。辅助XML索引分3种:PATH,VALUES和PROPERTY辅助XML索引。

ORDERTOTAL
-------------------------------------------------------------

EABEL-20021009123338324PDT
1328.05


EABEL-20021009123335791PDT
2067.15


EABEL-20021009123336251PDT
289.6


EABEL-20021009123336382PDT
928.92

XQuery的优点

创建索引

为表中某个列创建索引,要求该列是XML数据类型。

ALTER TABLE Student
ADD xml_test XML;--对Student表添加一个XML数据类型字段xml_test
--对Student表的xml_test字段创建主XML索引,命名为学生信息表
CREATE PRIMARY XML INDEX 学生信息表
ON Student(xml_test)
GO
--对Student表的xml_test字段创建PATH辅助XML索引,记得写上主索引名
CREATE XML INDEX 辅助学生信息表
ON Student(xml_test)
USING XML INDEX 学生信息表 FOR PATH
GO

注:辅助索引的命名不能与主索引相同。

要获得相同的最终结果,可以改用 XMLQuery 函数。但如果将上一个示例中使用的 XQuery 表达式参数传递给 XMLQuery(如下所示):

XQuery的应用领域

修改和删除索引(ALTER INDEX 和 DROP INDEX)
ALTER INDEX ALL ON Student--重建所有索引
REBUILD WITH(FILLFACTOR=80,SORT_IN_TEMPDB=ON,STATISTICS_NORECOMPUTE=ON);
--删除索引
DROP INDEX 学生信息表 ON Student
GO

注:删除主索引,与其相关的所有辅助索引也会被删除。因此上面语句中删除学生信息表索引后,辅助学生信息表索引也被删除了。

SELECT XMLQuery('for $i in /PurchaseOrder
where $i/User eq "EABEL"
return 
{$i/Reference}

{fn:sum(for $j in $i/LineItems/LineItem/Part
return ($j/@Quantity*$j/@UnitPrice))}

'
PASSING OBJECT_VALUE
RETURNING CONTENT)
FROM purchaseorder;

在服务器端使用XQuery的优点

OPENXML函数

OPENXML是一个行集函数,用于检索XML文档。在试用OPENXML函数之前,一定要先用系统存储过程sp_xml_preparedocument分析文档,该存储过程在分析完XML文档后会返回一个句柄,使用OPENXML检索文档时要将该句柄作为参数传给OPENXML。
示例15

--定义两个变量@Student和@StudentInfo
DECLARE @Student int
DECLARE @StudentInfo xml
--使用SET为@StudentInfo赋值
SET @StudentInfo='
<row>
<姓名>祝红涛</姓名>
<班级编号>2019382910</班级编号>
<成绩>89</成绩>
<籍贯>沈阳</籍贯>
</row>
'
--使用系统存储过程sp_xml_preparedocument分析由@Student变量表示的XML文档,将分析得到的句柄赋值给@Student变量
EXEC sp_xml_preparedocument @Student OUTPUT,@StudentInfo
--在SELECT语句中使用OPENXML函数返回行集中的指定数据
SELECT * FROM OPENXML(@Student,'/row',2)
WITH(
姓名 varchar(8),
班级编号 varchar(10),
成绩 int,
籍贯 varchar(20)
);

结果如图所示
图片 25
在上述语句中,sp_xml_preparedocument存储过程语句用了2个参数,其中@Student是一个int型变量,该存储过程会将句柄存储在@Student变量中作为结果数据,@StudentInfo是一个XML类型的变量,存储了将要进行分析的XML文档。
OPENXML函数的语句中,使用了3个参数,其中@Student代表已经经过sp_xml_preparedocument存储过程分析的文档的句柄,’/row’使用XPath模式提供了一个路径,代表要返回XML文档中该路径下的数据行,2是一个可选数据参数,表示将这些数据行以元素为中心映射。

则 XQuery 表达式返回的空序列将与 purchaseorder 表联接,从而包含在查询总结果集中。实际上,这意味着输出将不仅包含为用户 EABEL 请求的订单生成的 OrderTotal 元素,而且还包含为 purchaseorder 表中存储的所有其他订单生成的空行(默认情况下,purchaseorder 表包含 132 行)。从结果集中排除空行的方法之一是在 SELECT 语句的 WHERE 子句中使用 existsNode SQL 函数,而不是在 XQuery 表达式中使用 WHERE 子句,如下所示:

当使用XML Schemas时如何执行XQuery

SELECT XMLQuery('for $i in /PurchaseOrder
return 
{$i/Reference}

{fn:sum(for $j in $i/LineItems/LineItem/Part
return ($j/@Quantity*$j/@UnitPrice))}

'
PASSING OBJECT_VALUE
RETURNING CONTENT) AS ordertotal
FROM purchaseorder
WHERE existsNode(OBJECT_VALUE, '/PurchaseOrder[User = "EABEL"]') = 1;

XQuery表达式的结构

以上查询与本部分开头的 XMLTable 示例生成相同的输出。

XPath 2.0表达式

查询 Oracle XML DB 信息库中的 XML 数据

FLWOR语句

为访问 Oracle XML DB 信息库中存储的 XML 数据,Oracle XQuery 引入了 fn:doc 和 fn:collection XQuery 函数。使用 fn:doc,您可以查询 XML 信息库中存储的单个 XML 文档,而 fn:collection 使您可以访问同一信息库文件夹中存储的多个 XML 文档。

For

正如本文之前(参阅使用关系数据构建 XML部分)介绍的示例所演示,使用 fn:doc 非常简单直接。它获取表示信息库文件资源 (URI) 的字符串并返回该 URI 指向的文档。要了解 fn:collection XQuery 函数的作用,同一文件夹中至少应有两个信息库文件。如果已经运行了列表 1 中的代码,则已经创建了 /public/employees 信息库文件夹并在其中存储了 employees.xml 文件。因此,您将需要在该文件夹中至少再创建一个 XML 文件,然后才能试用 fn:collection。列表 2 中的 PL/SQL 代码基于 SCOTT/TIGER 演示数据库模式的 dept 和 emp 表存储的关系数据构建 XML,然后将生成的 XML 文档作为 acc_dept.xml 保存到 /public/employees 信息库文件夹。要运行列表 2 中的 PL/SQL 过程,请确保以 SCOTT/TIGER 的身份登录。

Where

列表 2:基于关系数据构建 XML 并将其保存到 XML 信息库

order by

DECLARE
XMLdoc XMLType;
BEGIN
SELECT XMLQuery(
'for $j in ora:view("SCOTT", "dept")/ROW
where $j/DEPTNO = 10
return ( 
{$j/DEPTNO,
$j/DNAME}
 {
for $i in ora:view("SCOTT", "emp")/ROW
where $i/DEPTNO = $j/DEPTNO
return (

{$i/EMPNO,
$i/ENAME,
$i/SAL}
)} 

)'
RETURNING CONTENT) INTO XMLdoc FROM DUAL;
IF(DBMS_XDB.CREATERESOURCE('/public/employees/acc_dept.xml', XMLdoc)) THEN
DBMS_OUTPUT.PUT_LINE('Resource is created');
ELSE
DBMS_OUTPUT.PUT_LINE('Cannot create resource');
END IF;
COMMIT;
END;
/

return

此时,/public/employees 信息库文件夹应包含两个文件:acc_dept.xml(由列表 2 中的 PL/SQL 代码生成)和 employees.xml 文件(由列表 1 中的代码生成)。由于这些 XML 文档存储在同一信息库文件夹中,因此可以使用 fn:collection 函数访问两个 XML 文档中存储的员工信息。然而,尽管这些 XML 文档均包含员工 XML 元素(这些元素实际上具有相同结构),但 XML 文档本身的结构迥然不同。在 employees.xml 中,文档根元素为 EMPLOYEES,而 acc_dept.xml 将 DEPARTMENT 用作根元素。要解决此问题,可以通过 XQuery 使用 XPath // 构造,从而导航到 XML 文档中的某个节点,而不必指定该节点的确切路径。以下示例演示了如何在 XQuery 表达式中使用 XPath // 构造:

FLWOR表达式vs. XPath表达式

SELECT XMLQuery(
'for $i in fn:collection("/public/employees")//EMPLOYEE
where $i/SAL >= 5000
order by $i/ENAME
return;
$i'
RETURNING CONTENT) FROM DUAL;

XQuery的操作

该构造应生成以下输出:

数学运算符

102
De Haan
17000


7839
KING
5000


100
King
24000


101
Kochhar
17000

比较运算符

您可以看到,以上输出包含从 employees.xml 和 acc_dept.xml 中获取的员工 XML 元素,这些元素表示薪酬大于或等于 5,000 美元的员工。

普通比较运算符

将 XML 分解为关系数据

数值比较运算符

如果应用程序处理关系数据而非 XML,而您需要访问的数据以 XML 格式存储,则将 XML 分解为关系数据可能会非常有用。继续进行上一部分的示例,您可以使用 SQL 函数 XMLTable 将员工 XML 元素分解为虚拟表的单个列,如下所示:

节点比较运算符

SELECT emps.empno,emps.ename, emps.sal FROM 
XMLTable(
'for $i in fn:collection("/public/employees")//EMPLOYEE
where $i/SAL >= 5000
return;
$i'
COLUMNS empno NUMBER PATH '/EMPLOYEE/EMPNO',
ename VARCHAR2(30) PATH '/EMPLOYEE/ENAME',
sal NUMBER PATH '/EMPLOYEE/SAL') emps;

节点顺序比较运算符

该查询将生成以下输出:

逻辑操作符

EMPNO ENAME SAL
----- -------------- ----------
7839 KING 5000
100 King 24000
101 Kochhar 17000
102 De Haan 17000

if-then-else语句

查询外部数据源

使用XQuery构造XML

使用 XQuery,可以基于 XML 数据以及可以用 XML 表示的非 XML 数据生成 XML 文档,无论其位置如何:无论是存储在数据库中、置于网站上、即时创建还是存储在文件系统中。但要注意,Oracle XML DB 为针对数据库中存储的数据进行的 XML 操作提供了非常高的性能和可伸缩性。因此,如果您能够完全控制所处理的数据,则最好将它移动到数据库中。

XQuery构造器 vs. FOR XML语句

正如您从前面的示例中了解到的,在 Oracle XQuery 实施中,doc 和 collection XQuery 函数用于访问 Oracle XML DB 信息库中存储的 XML 文档。可以通过 XMLTable 和 XMLQuery SQL 函数中的 PASSING 子句动态绑定外部数据源。考虑以下示例。假设您的公司要为那些致力于 XQ 项目的员工支付奖金。因此,财务部发布了 empsbonus.xml 文件,其中包含有资格获得奖金的员工列表以及该列表中输入的每个员工的奖金数额。empsbonus.xml 文件可能如下所示:

XQuery内置函数

100
1200


101
1000

数据访问

在实际情况中,以上的 XML 文件可能置于网站上(因此可以通过互联网获得)、以文件形式存储在本地文件系统中,或以文件资源形式存储在 Oracle XML DB 信息库中。就本示例而言,该文件位于网站上。为简单起见,可以在目录(Web 服务器在其中存储可从 Web 看到的文档)中创建一个员工文件夹,然后在该文件夹中插入 empsbonus.xml 文件,以便可以通过以下 URL 访问 empsbonus.xml 文件:

字符串的处理

http://localhost/employees/empsbonus.xml

聚集函数

接下来,假设您需要基于 empsbonus.xml 文档中存储的数据创建一个报表。在该报表中,您可能不但要包含列表中显示的奖金数额以及每个员工的员工 ID,还要包含他/她的全名。因此,可以首先使用以下查询生成一个新的 XML 文档(假设您以 HR/HR 的身份连接):

上下文函数

SELECT XMLQuery(
'for $k in 1
return (
 {for $i in ora:view("employees")/ROW,
$j in $emps/EMPLOYEES/EMPLOYEE
where $i/EMPLOYEE_ID = $j/EMPNO
return (
{xs:string($i/EMPLOYEE_ID)}
{xs:string(fn:concat($i/FIRST_NAME, " ", $i/LAST_NAME))}
{xs:integer($j/BONUS)}
)} )'
PASSING xmlparse (document httpuritype
('http://localhost/employees/empsbonus.xml').getCLOB()) as "emps"
RETURNING CONTENT).getStringVal() as RESULT FROM DUAL;

关系类型表达式

以上查询是一个有关如何使用 XQuery 基于 XML 和非 XML 数据(以不同的方式从不同的数据源中检索)生成 XML 文档的示例。具体而言,使用 ora:view() 函数访问 HR 演示模式中的默认 employees 关系表,并使用 PASSING 子句中的 httpuritype() 函数借助于 HTTP 访问 empsbonus.xml 文档。然后,在 FLWOR 表达式的 return 子句中构建新的 XML 文档。最后,将获得以下 XML 文档:

类型声明表达式


100
Steven King
1200


101
Neena Kochhar
1000

如for语句中的xs:TYPE

解决性能问题

类型检查表达式

正如您从前面的部分中了解到的,XQuery 是一种用于查询 Oracle 数据库存储的 XML 内容的高效方法 - 无论您是处理本地存储的 XMLType 数据还是查询基于关系数据构建的 XML 视图。但根据对数据使用的存储类型的不同,XQuery 表达式的执行性能可能迥然不同。尤其是,Oracle XML DB 可以优化基于由 ora:view 函数创建的 SQL/XML 视图而构建的 XQuery 表达式。对于 XMLType 表或列中存储的 XML 数据,只能对使用结构化(对象-关系)存储技术存储的基于 XML 模式的 XMLType 数据进行 XQuery 优化。

xs:TYPE实例

所选择的存储模型并非是影响 XQuery 表达式执行性能的唯一因素。在某些情况下,XQuery 表达式本身的结构也可能导致性能问题。要监控 XQuery 表达式的性能,可以打印并检查关联的 EXPLAIN PLAN。在 SQL*Plus 中,只需设置 AUTOTRACE 系统变量,即可打印 SQL 优化程序使用的执行路径。但要执行该操作,请确保创建 PLUSTRACE 角色,然后将其授予连接到数据库所使用的用户。有关如何执行此操作的信息,请参阅 Oracle 数据库 10g 第 2 版 (10.2) 文档中《SQLPlus 用户指南和参考》一书中的“调整 SQLPlus”一章。以下示例演示了如何通过检查 EXPLAIN PLAN 生成的执行计划来获得好处。假设您已经将 PLUSTRACE 角色授予默认用户 OE,以 OE/OE 的身份登录并运行以下查询:

类型转换函数

SET AUTOTRACE ON EXPLAIN
SELECT count(*)
FROM oe.purchaseorder, XMLTable(
'for $i in /PurchaseOrder/User
where $i = "CJOHNSON"
return $i'
PASSING OBJECT_VALUE) ptab;

隐式类型转换

这将生成以下输出:

显式类型转换

COUNT(*)
----------
9
Execution Plan
---------------------------------------------
Plan hash value: 4046110317
--------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 226 | 29 (0) | 00:00:01 |
| 1 | SORT AGGREGATE | | 1 | 226 | | |
| 2 | NESTED LOOPS | | 10782 | 2379K | 29 (0) | 00:00:01 |
|* 3 | TABLE ACCESS FULL | PURCHASEORDER | 1 | 226 | 5 (0) | 00:00:01 |
| 4 | COLLECTION ITERATOR P| XMLSEQUENCEFROMX| | | | |
Predicate Information (identified by operation id):
---------------------------------------------------
3 - filter(SYS_CHECKACL("ACLOID","OWNERID",xmltype('...

值类型构造器

您可能对为以上查询生成的执行计划并不满意。尤其是,所处理的行数可能非常大。由于 SQL 调整的主要目标是避免访问对结果没有任何影响的行,因此可能要继续调整查询以优化性能。对查询中包含的 XPath 表达式进行重新建模后,可以再次重试它,如下所示:

cast as xs:TYPE ?操作符

SELECT count(*)
FROM oe.purchaseorder, XMLTable(
'for $i in /PurchaseOrder
where $i/User = "CJOHNSON"
return $i/User'
PASSING OBJECT_VALUE) ptab;
这次,输出应如下所示: 
COUNT(*)
----------
9
Execution Plan
---------------------------------------------------
Plan hash value: 3411896580
---------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
----------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 29 | 7 (0) | 00:00:01 |
| 1 | SORT AGGREGATE | | 1 | 29 | | |
| 2 | NESTED LOOPS | | 1 | 29 | 7 (0) | 00:00:01 |
| 3 | FAST DUAL | | 1 | | 2 (0) | 00:00:01 |
|* 4 | TABLE ACCESS FULL | PURCHASEORDER | 1 | 29 | 5 (0) | 00:00:01 |
Predicate Information (identified by operation id):
---------------------------------------------------
4 - filter("PURCHASEORDER"."SYS_NC00022$"='CJOHNSON' AND
SYS_CHECKACL("ACLOID","OWNERID",xmltype('...

访问关系性的列和变量

您可以看到,以上显示的查询生成相同的最终结果,但它们的执行计划并不相同。查看最后一个示例中的 XQuery 表达式,您可能会注意到它迭代顶层 PurchaseOrder 元素,其中的每个 PurchaseOrder 元素都表示基于 PurchaseOrder XMLType 模式的表中的一行。这意味着实际上重写 XQuery 表达式,以迭带基础对象表(用于存储分解的 PurchaseOrder 文档)中的行。与查询要迭代不表示基础表中的单个行的 XML 元素相比,该方法的性能更好一些。

不支持的特性和工作中的解决方案

但在某些情况下,很难发现 XQuery 表达式的哪个构造将使某些查询的性能更好。这就是为什么最好在开发阶段使用调整工具的原因。

最佳实践和指导方针

将动态变量绑定到 XQuery 表达式

XML数据的修改

另一种可以显著提高 XQuery 表达式执行性能的技术是使用绑定动态变量。使用绑定变量(而不是将变量串联为字符串)可以使 Oracle 重用 SQL 语句,从而减少分析开销并显著提高应用程序的性能。可以在 XMLQuery 和 XMLTable SQL 函数中使用 PASSING 子句将动态变量绑定到 XQuery 表达式。该技术使您可以根据客户端代码中计算的参数动态生成 XML。列表 3 中的示例演示了如何在从 PHP 脚本执行的 XQuery 查询中使用绑定变量。

插入操作

列表 3:使用绑定变量

删除操作符

//File:BindVars.php
$user = 'hr';
$pswd = 'hr';
$db ='(DESCRIPTION=
(ADDRESS_LIST=
(ADDRESS=(PROTOCOL=TCP)(HOST=localhost)(PORT=1521))
)
(CONNECT_DATA=(SID=orclR2)(SERVER=DEDICATED))
)';
$empno=100;
$conn = oci_connect($user, $pswd, $db);
$sql = 'SELECT XMLQuery('."'".'for $i in ora:view("employees")/ROW
where $i/EMPLOYEE_ID = $empno
return (
{$i/EMPLOYEE_ID,
$i/EMAIL,
$i/JOB_ID}
)'."'".'PASSING XMLElement("empno", :empno) AS "empno"
RETURNING CONTENT).GetStringVal() AS RESULT FROM DUAL';
$query = oci_parse($conn, $sql);
oci_bind_by_name($query, ":empno", $empno, 3);
oci_execute($query);
oci_fetch($query);
$str = oci_result($query, 'RESULT');
print $str;
?>

Update操作符

列表 3 中显示的脚本应生成以下输出(注意,浏览器中可能不会显示标记):

XQuery应用场景

100
SKING
AD_PRES

场景1:性能评价系统

XQuery 与 XSLT

场景2:病例系统

尽管 Oracle 在 Oracle XML DB 中提供了一个自带 XSLT 处理器,但在很多情况下(尤其是在处理大型文档时),XQuery 对于构建 XML 更高效。此外,XQuery 表达式通常比为同一作业设计的 XSLT 样式表更具可读性,并且更清楚。与 XSLT 一样,XQuery 不但可用于将一个 XML 文档转换为另一个 XML 文档,而且还可用于将 XML 转换为另一种基于文本的格式,如 HTML 或 WML。

场景3:资产管理系统

在本文前面的查询 XMLType 数据部分中,您看到了一个有关使用 XQuery 将一个 XML 文档转换为另一个 XML 文档的示例。具体而言,该示例使用 XQuery 表达式计算示例数据库模式 OE 的 purchaseorder 表中存储的订单的订单总计,然后为处理的每个订单生成了一个 OrderTotal XML 元素。实际上,您可以使用 XSLT 执行相同操作。为此,您首先需要创建一个应用于 PurchaseOrder XML 文档的 XSLT 样式表,以生成相应的 OrderTotal 元素。对于此示例,可以使用列表 4 中所示的 XSLT 样式表。

结论

列表 4:使用 XSLT 计算小计总和 (Quantity * UnitPrice)

导言

http://www.w3.org/1999/XSL/Transform" version="1.0">



























XML是被用来作为一种文档格式而发展起来的。然而,XML所具有的其它特征,比如可扩展性、支持国际标准、表示结构化和半结构化数据的能力,以及人和机器对其简单的可读性,使得它成为一种广泛应用的、平台无关的数据表示格式。由于XML获得了广泛的认可,因此很多用户都用XML来解决复杂的商业问题,例如那些涉及到数据集成的问题。有许多案例都推荐将信息直接存储到XML文档,这比将信息先存到数据表中然后再将这些信息组成XML消息要有效的多。要查看更多关于这些案例的信息,可以查阅“微软SQLserver2005 XML最佳实践”白皮书中相关文档。XML在存储文档和半结构化数据表示方面的应用已经让XML发展成为一种可以在服务器端存储简单数据管理的数据存储格式。

为方便起见,您可能需要将此 XSL 样式表保存在数据库中,然后再开始使用它。例如,您可以将样式表作为文件资源保存在 Oracle XML DB 信息库中。执行该操作的方法之一是将样式表作为文件保存到本地文件系统中,然后使用以下某个互联网协议将它移动到 XML 信息库:FTP、HTTP 或 WebDAV。假设您已经将列表 4 中的 XSLT 样式表作为 orderTotal.xsl 保存在 /public 信息库文件夹中,现在可以按以下示例所示将它用作 XMLTransform SQL 函数的参数(假设您以 OE/OE 的身份登录):

 

SELECT XMLTRANSFORM(OBJECT_VALUE,
xdbUriType('/public/orderTotal.xsl').getXML()).GetStringVal() AS RESULT FROM
purchaseorder WHERE existsNode(OBJECT_VALUE, 
'/PurchaseOrder[User = "EABEL"]') = 1;

可是这种发展也导致了一个问题-从XML数据中提取出来的信息要作为BLOBs类型存储到关系型数据库中,需要一种查询语言来提取XML所表达的信息,并使其符合关系型数据库中的要求。Microsoft  SQL Server  2000提供了OpenXML,它可以被用来查询,从被设计时,就满足了从XML数据映射到关系型数据格式的要求,但它并没有完全支持XML数据模型(见表1)。关系数据模型和XML数据模型在很多方面都不一样。下表简单列举了两种数据模型的主要区别。

以上查询将处理用户 EABEL 请求的所有订单(即存储在 XMLType 的默认 PurchaseOrder 表中的订单)并将生成与查询 XMLType 数据部分中的 XQuery 查询相同的输出。

 

将列表 4 中的 orderTotal XSLT 样式表与查询 XMLType 数据部分中的示例使用的 XQuery 表达式进行比较,您可能会注意到,XQuery 方法要比 XSLT 方法更具吸引力。至少在使用 XQuery 时,您只需编写很少的代码即可获得相同的最终结果。

表1   关系型数据模型与XML数据模型之间的区别

查询 RSS 新闻提供

图片 26

由于 RSS 新闻提供本质上是一个托管的 XML 文件(RSS 新闻阅读器从中获取头条新闻或其他内容),因此可以像处理任何其他可以通过 Web 获得的 XML 文档那样来处理它。正如您在本文前面的查询外部数据源部分中所见,可以使用 XQuery 查询任何可以通过 URL 访问的 XML。您通过 XMLTable 和 XMLQuery SQL 函数中的 PASSING 子句动态绑定所有外部 XML 数据源。以下是一个查询 RSS 新闻提供的 XQuery 示例:

 

SELECT XMLQuery(
'for $i in $h//channel
return;

{$i/lastBuildDate}

{for $j in $h//item
where ora:contains($j, "PHP")
return  {($j/title, $j/link)}}

'
PASSING xmlparse (document httpuritype
('http://www.oracle.com/technology/syndication/rss_otn_news.xml').getCLOB()) as "h"
RETURNING CONTENT).getStringVal() as RESULT FROM DUAL;

 

该 XQuery 应生成一个 XML 文档,其中包含 Oracle 技术网 (OTN) 最近发布的与 PHP 技术相关的头条新闻列表。所生成的 XML 文档可能如下所示:

不断增加处理越来越多样化的结构数据的需求和数据间隐含约束的必要性是扩展关系型数据模型以支持XML文档存储的最重要的两个原因。另外,SQL语言在处理半结构化或者标记信息时的局限性也促使了XQuery语言的发展。XQuery语言在设计的时候已经考虑到XML数据的特性和处理XML数据的相关问题。

Tue, 01 Nov 2005 19:37:42 GMT


http://www.oracle.com/technology/xe


http://www.oracle.com/technology/pub/articles/oracle_php_cookbook


http://www.oracle.com/technology/tech/php/zendcore/index.html

SQL Server 2005通过内置XML数据类型支持XML数据的本地化存储。XQuery 1.0版本是经World Wide Web Consortium (W3C) XML查询工作组定义,基于XML数据的公式化查询语言。XQuery,像SQL一样,是一种声明性的查询语言,就如同我们在下面的文章中将会看到的一样,能通过基本的SQL和XPath知识来轻松地理解它。

但在开发实际应用程序时,您将很可能需要 XQuery 表达式直接生成 HTML 标记,而不是仅仅生成一个如上所示的 XML 文档。这样,您便可以构建一个更灵活、可维护性更高的应用程序,原因是在这种情况下,所有 RSS 处理(从提取必要的数据到将它包装在 HTML 标记中)都将转移到数据库。这使您不必编写负责 RSS 处理的应用程序代码。实际上这意味着您不必在诸如 RSS 新闻提供的结构已经更改的情况下修改应用程序代码。相反,您只需修改用于 RSS 处理的 XQuery 表达式。

本文基于XQuery 1.0在SQL Server 2005中的实践,同时也基于XQuery 1.0 2004年的工作草图。本文的第一部分提出了新的XML数据类型的总述以及它的相关特点,接下来的部分,分别地介绍XQuery的多样操作,XQuery的内置函数,关系型表达式,以及SQL Server 2005不支持的部分。最后,介绍最近的最佳应用和指导,XML数据的修正以及XQuery的应用事例的信息。

总结

引用:

您已经在本文了解到,XQuery 是一个综合的查询语言,它提供了一种用于查询、构建和转换 XML 数据的高效方法。尽管 Oracle XQuery 实施使您可以操作任何可以用 XML 表示的数据(无论它存储在数据库中、位于网站上还是存储在文件系统中),但将处理的数据移动到数据库中始终是一个不错的主意。对于数据库中存储的数据,Oracle XML DB(对 XPath 重写使用同一机制)只能显著优化处理那些基于以下数据构建的 XQuery 表达式:这些数据包括关系数据、对象-关系数据或使用结构化(对象-关系)存储技术存储的基于 XML 模式的 XMLType 数据。

SQL Server 2005中的XML数据类型

(责任编辑:铭铭)

SQL Server 2005引入的新XML数据类型使得用户具有在数据库中存储XML文档和段落的能力。一个XML数据类型可以用来创建列,用来创建存储过程或者存储函数中的参数,或用来创建变量。另外,用户可以关联一个XML类型的列和一个XML Schema集来创建一个新的类型化的XML列。集合中的XML Schema被用来验证和类型化XML实例。

原文:Oracle XQuery查询、构建和转换XML 返回数据库首页

 

类型化vs.非类型化的XML数据类型

XML数据类型与XML schema集相关联,为XML实例增加了Schema的强制性约束。如果XML数据被关联到一个XML Schema集合,它就被称为类型化的XML。否则,就叫做非类型化的XML。

 

SQL Server 2005中XML数据类型实现了ISO SQL-2003标准化XML数据类型。它不仅能够存储结构良好的XML1.0文档,也能存储根节点为文本的所谓的XML内容段落,也能存储包含任意数目根元素的内容。针对具有良好格式数据的检查已经完成,这些检查不必把XML数据类型绑定到XML Schemas。那些没有良好格式的数据不能被检查。

 

当Schema是不可知的时候,非类型化的XML就很有用。当Schema可知,但它的变化非常快以至于很难保持的时候,或者当存在多个Schema,最后的绑定取决于外部的需求时,非类型化的XML也很有用。另外,当XML Schema中包含数据库引擎不支持的XML Schema结构时,非类型化的XML也很有用。在这些情况下,你可以使用在公共语言运行时(CLR)用户自定义功能中的System.XML验证器来提供有效性验证。

 

如果在XML Schemas集中,你有XML Schemas来描述你的XML数据,你能够通过关联XML Schema集和XML列用来提供类型化的XML数据。XML Schema被用来验证数据的有效性;在编译查询或者数据编辑语句期间执行比非类型化XML更加精确的类型检查;或者被用来优化存储和查询的处理效率。

 

类型化的列,参数和变量能够存储XML文档(Document)或者内容段落(Content),在声明的时候,你可以通过开关指定你存储的类型(文档或者内容,默认的是内容)。另外,你必须同时提供一个XML Schema集。如果每个XML实例只有一个根元素,那么指定为文档类型,否则指定为内容类型。在静态类型推断期间,XQuery编译器使用文档(Document)标志信息来推断单个的根元素。

引用:

XML数据类型的方法

XML数据类型支持五种方法来操作XML实例。XML数据类型的方法描述如下:

query() 方法携带一个对若干个XML节点求值的XQuery表达式,允许用户查询一个XML文档中的段落。这个方法的返回值一个非类型化XML文件类型的值。

 

value() 方法是用来从一个XML文档数据值中提取关系型数值。这个方法携带一个用来识别单个XML节点的XQuery表达式并返回期望得到的SQL类型。XML节点的返回值被转换为指定的SQL类型。

 

exist()方法允许用户在XML文档中执行查询以确认一个XQuery表达式的结果是否为空。当XQuery表达式返回一个非空的结果时,这个方法的返回值为1;当表达式返回空时,方法返回值为0;当XML实例本身为NULL时,就返回NULL值。

 

使用XML数据类型的nodes()方法可以较容易的把一个XML文档分解为关系型数据。nodes()方法接受一个XQuery表达式,并返回一个行集(Rowset),行集中的每一行都描述一个由查询表达式所标识出来的上下文节点。XML数据类型的其他方法,如query(), value(),exist(),和 nodes(),都能调用nodes()方法返回的上下文节点。

modify()方法能用来对一个XML文档的内容进行修改。它支持XML DML语句,从而实现在一个XML实例中插入、更新或者删除一个或多个节点。当它遇到一个NULL值时,它会报错。

详细内容,查阅“微软SQLserver2005 XML最佳实践”白皮书。

XQuery入门

XQuery是一种用于XML查询的新语言,支持基于XPath2.0的数据浏览和采集。本章节为我们初步展示了XQuery语言各方面的内容,比如XQuery和XPath之间的关系,XQuery的优点,XQuery的应用领域,XQuery中XML Schema的规则等等。

 

XPath2.0简介

XPath1.0,是由W3C工作组定义,用于在单个XML文档中定位节点的语言。XPath1.0使用基于路径的规则来标识XML文档中的节点。同时它定义了XSLT 1.0和XPointer的核心规则。XPath 1.0有处理字符串、布尔值和浮点数的内置函数。它定义了根据设置的过滤标准来过滤节点的语法。XPath 1.0正在升级为XPath 2.0以支持更多的系统类型,提供更多的功能。XQuery 1.0基于对XPath 2.0,增加了排序、重装、构造功能,而且实现了XPath2.0未能实现的数据浏览和过滤方面的性能。

 

XQuery简介

XQuery是一个可以定义、类型化、函数化的语言,是XML查询组专为从XML格式中查询数据而设计的语言。XQuery具有与XML标准系列中XPath 2.0和XSLT 2.0一样的数据模型和XML Schema类型系统。设计XQuery用于处理非类型化XML文档(不包括关联数据的schema),类型化XML schema,或者两者的混合体。如同上文提到的,XQuery 1.0基本上是XPath2.0的扩展集。XQuery 1.0除了拥有XPath2.0的特点外,它还拥有下面的性能:

•        在FLWOR语句中增加了order by语句,它可以对文档数据进行重新排序。

•        在FLWOR语句中增加了let语句,它能够指定表达式的结果以实现更多的应用(SQL Server 2005中不支持)。

•        在查询语句的嵌缀部分,可以指定静态的上下文节点(比如命名空间的绑定前缀namespace prefix bindings)。

•        提供构造新节点的功能。

•        允许用户自定义函数(SQL Server 2005中不支持)。

•        能够创建modules/libraries(SQL Server 2005中不支持)。

XQuery的优点

•        当前的SQL和XPath知识是很容易学习的。

•        相比XSLT的查询语句,XQuery查询语句代码更简洁。

•        当XML数据是类型化的,那么XQuery是一个强类型语言,它能够通过避免非法的类型转换以及确认类型是否可以在查询操作中使用,来提高查询语句的执行效率。

•        XQuery能当作弱类型语言使用,为非类型化数据提供更强的功能。SQL Server 2005提供了同时支持强类型和弱类型两种关系的静态类型。

•        因为XQuery执行查询需要的代码比XSLT少,所以它的执行效率也高。

•        XQuery正在成为W3C工作组的推荐语言,同时它也将会被主流的数据库提供商所支持。

在本文中,关于在编写XQuery1.0语言时需要特别注意的地方:

•        XQuery规范是基于当前开发环境进行阐述,将来可能会发生变化。而SQL Server 2005是W3C工作草图所实现的稳定部分,不会发生变化。

 

XQuery的应用领域

一般,XQuery的应用领域分类如下:

•        查询和分析数据:XQuery在查询大容量数据时表现出色,而且能够过滤、分类、排序以及转换需要的信息。典型的XML文档查询的应用包括描述半结构化信息,定义name-value包,分析日志,处理日志以及监控应用的日志来查找潜在的应用错误和安全方面的问题等等。

•        XQuery的集成应用:当团队开始摒弃自己私有的集成应用方法,而开始采用标准的以集成应用为基础的方法时候,满足把单个应用中内部定义使用的数据转换为标准的可以格式化转换的数据的需求就成为头等重要的问题。因为XQuery能够构造并转换XML数据,所以XQuery就满足了这个需求。在集成应用领域,一个典型的XQuery应用是把本地使用的XML数据库/关系型数据资源的词汇表,翻译为另外一个应用者的本地XML数据库/关系型格式数据语言。

 

在服务器端使用XQuery的优点

对比起在客户端处理XML过程,在服务器端使用XQuery来处理XML过程要具备更多的优点。其中一些优点可以总结如下:

•        减少网络负载:在服务器端处理XML数据,只把结果传递到客户端,减少了网络负载。

•        更加安全:只有当使用客户端XML进程时才把客户端需要的数据传递到客户端,避免在网络上传输完整数据而带来的风险。

•        更易维护:在服务器段处理XML能使得浏览器独立于客户端代码,这能够更容易的维护客户端。

•        性能的改进:在服务器端使用XQuery写的查询语句可以使用SQL查询器进行优化。这样优化处理的性能要高于在客户端重新获得数据并进行数据过滤。此外,还可以通过为XML数据类型的列创建索引来得到更强大的性能。

 

当使用XML Schemas时如何执行XQuery

关联一个XML数据类型的XML schema集能被以下的关系引擎使用:

•        在插入操作中来实例化XML。

•        在修改操作中来实例化XML。

•        在进行最早的静态类型错误检查和改进查询性能时,XML schema中的类型信息被用来确定最佳的查询计划和避免很多运行时的检错。

•        XML schema中描述的类型信息被SQL Server用来优化存储。

引用:

XQuery表达式的结构

SQL Server 2005中的一个XQuery表达式包括两个部分—前缀(prolog)和主体(body)。前缀能逐个声明包含的命名空间。命名空间的声明可以通过映射前缀和命名空间的URI,使你能够用前缀来替代查询体中的命名空间的URI。通过默认声明命名空间(declare default namespace)的声明,你不用绑定元素名称的默认命名空间就可以引用元素的名称。

 

XQuery表达式的主体包含了定义查询结果的查询表达式。比如,它可以是一个FLWOR表达式(参见本文章节的“FLWOR语句”),一个XPath 2.0 表达式(参见本文章节的“XPath 2.0表达式”),或者另外一个XQuery表达式比如一个构造或算术表达式。

 

实例:在XQuery头中声明默认的命名空间

下面是从所有职员中查找一个JobCandidateID等于3的应聘者。查询中只定义了一个默认命名空间,而没有使用任何一个命名空间前缀。

SELECT Resume.query('

        declare default namespace  "";

        /Resume/Employment

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

实例:使用“WITH XMLNAMESPACES”语句声明命名空间

SQL Server同样支持 SQL-2003的标准扩展,允许用户在SQL的每一个SQL查询要素上绑定XML命名空间,这样就可以避免重复声明同样的XML数据类型的方法。下面的查询显示了前面查询实例修改后的版本。这个查询使用WITH XMLNAMESPACES 语句声明了一个命名空间。

WITH XMLNAMESPACES( '' AS  "RES")

SELECT Resume.query('

        /RES:Resume/RES:Employment

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

XPath 2.0表达式

XQuery使用XPath2.0表达式查找一个文档中的节点,在一个文档中移动节点或者在文档间移动节点位置。定义移动路径的XPath是一个彼此分离的步骤组成的有序队列。每一个步骤包含一个axis,一个node test和多个步骤判断。

 

Axis说明了移动的方向,和上下文节点的关系。SQL Server2005中支持的axes是child, descendant, parent, attribute, self 以及descendant-or-self。

 

一个node test说明了步骤选择的这些节点所必需满足的条件。节点的条件可以基于节点名称或者节点类型来说明。

 

步骤判断可以用动作(predicates)或者重新引用(dereference)。一个动作就充当一个在相等框架下定义的一个节点队列中的节点过滤器;一个重新引用反映出一个节点队列中各节点的属性以及元素是否与参照节点的一致。作为重新引用的输入,该节点队列必须包含IDREF或者IDREFS类型的元素或者属性。重新引用可以产生一个新队列,其各节点ID类型的属性值都匹配取自输入队列中元素和属性的IDREF值。

 

XPath表达式的步骤是可以关联求值的。每个步骤执行时都为下一步设置了赋值的上下文项。Path表达式中的一个上下文项就是一个节点,它被选择作为XPath表达式中每个步骤执行的返回值。根据前一步所获得的上下文节点能够关联求得当前的步骤。XPath表达式执行完所有步骤的返回结果就将是一个根据path表达式排列的文档中节点的有序队列。

 

下面的表达式用AdventureWorks数据库中的表[HumanResources].[JobCandidate]来举例说明了path表达式的概念。下面的path表达式选择了address类型节点中值为Home的节点。

//child::ns:Addr.Type[.="Home"]/parent::node()

Path表达式:

•        child 是axis的定义。

•        :: 是 axis 的分隔符。

•        ns 是命名空间前缀。

•        Addr.Type 是 node test。

•        [.=”Home”] 是一个指向上下文节点的动词表达式。

XQuery同样支持缩写语法来说明axis。下面的表格列举了axis以及相应的缩写语法。

表 2  axes缩写语法

图片 27

 

 

示例:从历史职业中选择工作单位的名称

下面所示的XPath表达式选择了Emp.OrgName文本类型的,同时也是Resume/Employment子节点的节点。在这里,text()用来选择Emp.OrgName元素文本类型的子节点:

/Resume/Employment/Emp.OrgName/text()

引用:

FLWOR语句

FLWOR语句组成了XQuery表达式的主体,它与SQL的SELECT语句很相似。FLWOR(发音同“flower”)是FOR, LET, WHERE, ORDER BY, RETURN的缩写。XQuery的FLWOR表达式可以进行重复声明、变量绑定、过滤、排序以及返回结果的操作。SQL Server 2005中支持FOR, WHERE, ORDER BY和 RETURN:

For

FLWOR表达式中的for语句支持用户定义一个变量来遍历某个输入序列。该输入序列可以使用XPath表达式、原子值序列、分隔符序列或结构化函数。因此,这里的for语句与SQL SELECT FROM语句类似,但与编程语言中的“for”语句不同。

 

绑定变量同样可以使用for语句声明。

 

示例:使用for语句从简历中检索所有的家庭地址

下面的查询得出了JobCandidateID等于3的应聘者的address节点值等于Home的元素。

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address/RES:Addr.Type[.="Home"]/..

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

Where 

FLWOR表达式中使用Where语句可以筛选一个迭代的结果。

 

示例:使用where语句选择所有的家庭地址

下面的查询得出了JobCandidateID等于3的应聘者的address节点值等于Home的元素。

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address

        where $A/RES:Addr.Type[.="Home"]

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

order by

Order by关键字可以对返回结果集进行排序。Order by关键字可以使用一个排序表达式,这个表达式必须返回一个原子值。一般,你可以进行升序或者降序排列。默认的排序顺序是升序。

 

示例:使用order by语句对查询出来的历史职业进行升序排序

下面的查询对JobCandidateID等于3的应聘者所从事过的职业根据其工作时间进行了升序排序。

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        order by $EMP/RES:Emp.StartDate

        return 

        $EMP 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

return

Return语句,和SQL中的SELECT语句类似,能够指定查询的结果。你可以在return语句中使用任何一个有效的XQuery表达式。你同样也可以通过在return部分中说明元素的构造、属性等来构造XML结构。

 

示例:使用return语句选择历史职业

下面的查询得出了JobCandidateID等于3的应聘者所从事过的所有职业的开始日期,结束日期,工作单位名称,工作职位。

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        order by $EMP/RES:Emp.StartDate

        return

          <Employment>

                { $EMP/RES:Emp.StartDate }

                { $EMP/RES:Emp.EndDate }

                { $EMP/RES:Emp.OrgName }

                { $EMP/RES:Emp.JobTitle }

          </Employment>

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

目前在SQL Server 2005中,XQuery还不支持let语句。这方面更多内容可参见本文章节“不支持的特性和工作中的解决方案”。

 

FLWOR表达式vs. XPath表达式

当计划进行的查询在for变量和for语句体之间包含一个JOIN操作时,序列可以用XPath表达式表达,但会导致执行效率低,这个时候应该使用FLWOR语句来定义该序列。只有当下面列举条件中的一个或者多个得到满足时,才适合使用FLWOR表达式。

•        如果想对一个作为某表达式返回结果的序列值进行迭代,你可以通过在for语句中绑定一个继承结果集值的变量来实现。实例都是由在for语句范围内并且保持复制的新元素构成。

•        当你要对for语句的结果序列进行过滤,而过滤是基于一个谓词且该谓词还无法使用简单的XPath表达式进行说明时,使用where语句就能够实现对结果集的过滤。示例如下:

DECLARE @result xml

SET @result = '<Result />'

SELECT @Result.query('

for $i in (1, 2, 3), $j in (3, 4, 5)

where $i < $j

return sum($i $j)

') as Result

•        如果你想基于一个简短表达式对结果集进行排序,那么可以使用order by语句实现。

•        当你要使用for语句的返回结果来定义返回结果集的类型时,使用return语句可以实现。

在所有其他案例中,推荐使用XPath表达式。

 

XQuery的操作

作为一种功能性语言,在SQL Server2005中支持XQuery的多种数据类型的函数和操作,可分类如下:

•        数学运算

•        比较运算

•        逻辑运算 

表 3 SQL Server2005支持的运算符

图片 28

 

 

数学运算符

SQL Server 2005支持五个数学运算符,分别是 、b、*、div和 mod。目前,还不支持idiv。

 

示例:转换表store中选定的信息的值

本示例中,假定数据库AdventureWorks中有表[Sales].[Store],下面的查询以日圆形式返回CustomerID等于3的仓库的年销售额和年收入,以平方米形式返回仓库的存储面积。

SELECT Demographics.query('

        declare namespace ST="";

        for $S in /ST:StoreSurvey

        return

          <StoreDetails

             SalesInYen ="{ $S/ST:AnnualSales*106.8100  }"

             RevenueInYen = "{ $S/ST:AnnualRevenue*106.8100  }"

             StoreAreaInSqMeters = "{ $S/ST:SquareFeet*0.0929  }">

          </StoreDetails>

') as Result

FROM [Sales].[Store]

WHERE CustomerID = 3

 

比较运算符

SQL Server 2005支持四种比较操作符—普通比较运算符、数值比较运算符、节点比较运算符和节点顺序比较运算符。

 

普通比较运算符

普通比较运算符可以进行原子值、序列或者两者的比较。普通比较运算符是=、 !=、<、>、<=和>=。普通比较必须是可以量化的,意思就是说任何比较的结果都是现实存在的。

 

示例:选择address类型节点值不等于Home的元素

下面的查询得出了JobCandidateID等于3的应聘者的所有address类型节点值不等于Home的元素:

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address

        where $A/RES:Addr.Type[.!="Home"]

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

数值比较运算符

数值比较运算符可以进行原子值的比较。SQL Server 2005种支持的数值运算符是eq、ne、lt、gt、le和ge。目前XQuery还未能与其2004年7月份的设计书所设计的一样实现对非类型化的原子值的比较。在XQuery说明书中,非类型化原子值是被定义为能替代字符串类型的新类型。这么设计是因为我们考虑到,实现普通比较运算符和数值比较运算符结合,要比仅仅能够比较数值要重要的多。

 

示例:选择GPA超过3.5的教育背景

下面的查询得出了JobCandidateID等于2的应聘者的所有GPA超过3.5的教育背景。

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where xs:decimal($ED/RES:Edu.GPA) gt 3.5 

        return 

        $ED 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

节点比较运算符

你可以使用节点比较运算符来确定2个节点是否代表同一类节点。节点比较运算符是二元操作符,每个操作元都是node类型。

 

示例:比较确定两个address节点的类型

下面查询比较了2个address节点,确定它们在XML文档中是否代表同一类节点。

SELECT Resume.query('

        declare namespace RES="";

        if ( (/RES:Resume/RES:Address)[1] is (//RES:Address)[1] )

        then

                <Result>Nodes are equal</Result> 

        else

                <Result>Nodes are not equal</Result> 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

引用:

节点顺序比较运算符

你可以使用节点顺序比较运算符来确定一个XML文档中两个节点的顺序。SQL Server 2005中支持的节点顺序比较运算符是>>和<<,两者都是二元操作符。>>操作符当左边操作元在XML文档中位于右边操作元的前面时,返回true;<<操作符当左边操作元在文档中位于右边操作元的后面时,返回true。

示例:比较两个address节点的顺序

下面的查询比较了JobCandidateID等于3的应聘者的两个address节点的顺序。

SELECT Resume.query('

        declare namespace RES="";

        if ( (/RES:Resume/RES:Address/RES:Addr.Type[.="Home"])[1] << (/RES:Resume/RES:Address/RES:Addr.Type[.="Permanent"])[1] )

        then

                <Result>Home address precedes Permanent address</Result> 

        else

                <Result>Home address follows Permanent address</Result> 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

逻辑操作符

SQL Server 2005中支持的XQuery逻辑操作符是and和or。使用任何由这两个操作符组成的逻辑表达式的返回值都是true或者false。

 

示例:使用and操作符来创建一个逻辑表达式

下面的query返回了所有已经获得工商专业学士学位的应聘者。

SELECT Resume.query('

        declare namespace RES="";

        /RES:Resume/RES:Education[RES:Edu.Level="Bachelor" and RES:Edu.Major="Business"]

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

if-then-else语句

和其他函数语言一样,XQuery支持if-then-else语句。你可以使用if-then-else语句来实现基于条件表达式返回值的操作。

 

示例:使用一个条件表达式

下面的查询得出了JobCandidateID等于3的应聘者简历中所有的address节点元素。

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address

        return 

                if ( $A/RES:Addr.Type eq "Home" )

                then

                        <Result>Home Address</Result> 

                else

                        <Result>Other Address</Result> 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

引用:

使用XQuery构造XML

XQuery构造器能够在查询中创建XML结构。可以调用构造器的参数包括元素、属性、处理指令、文本节点和注释。下面举例说明了如何创建XML。

 

示例:使用常量表达式

下面的查询使用常量表达式构造了某应聘者的一个历史职业的XML结构。

SELECT Resume.query('

          <Employer IndustryCategory="ITServices">

                <Organization>ABC Technologies</Organization>

                <JobTitle>Software Engineer</JobTitle>

                <StartDate>2001-10-01</StartDate>

                <EndDate>2003-05-09</EndDate>

          </Employer>

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

示例:使用动态数据

下面的查询通过查询JobCandidateID等于3的应聘者的数据,构造了一个历史职业的XML结构。

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        return

          <Employer Organization = "{ $EMP/RES:Emp.OrgName }" >

                { $EMP/RES:Emp.StartDate }

                { $EMP/RES:Emp.EndDate }

                { $EMP/RES:Emp.JobTitle }

          </Employer>

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

示例:使用常量给计算元素和属性构造器命名

下面的查询得出了JobCandidateID等于3的应聘者的从业经历。

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        return

          element Employer

          {

                attribute Organization { $EMP/RES:Emp.OrgName },

                element StartDate { string($EMP/RES:Emp.StartDate) },

                element EndDate { string($EMP/RES:Emp.EndDate) },

                element JobTitle { string($EMP/RES:Emp.JobTitle) }

          }

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

引用:

XQuery构造器 vs. FOR XML语句

某些应用需要根据行集来构造XML。在服务器端,XML的构造可以通过FOR XML语句或者XQuery构造器或者操作XML DML。推荐使用FOR XML和XQuery构造器来构造XML的原因如下:

•        如果XML的数据来自多个列和行,那么FOR XML是唯一的选择。

•        如果单个XML实例需要重新构造,那么可以使用XQuery和FOR XML。但XQuery可能更有效,因为FOR XML需要XML实例中更多的XML数据类型信息。

•        你可以使用多个XML DML语句来构造一个XML实例。但这个方法的执行效率明显低于XQuery构造器。

•        在SQL Server 2005中,FOR XML语句可以使用新类型把查询的结果直接构造成一个XML数据类型的实例。

 

XQuery内置函数

SQL Server 2005中的XQuery实现了对XQuery 1.0和XPath 2.0内置函数子集的支持。这些函数包括数据访问函数、字符串处理函数、聚集函数、上下文函数、算数函数、布尔值函数、节点函数和序列函数。下面将分析对其中的部分函数。

 

数据访问

你可以使用数据访问函数来提取字符串或者类型化节点的值。XQuery支持两种类型的数据访问函数:string()提取节点中的字符串值;data()提取类型化节点值。如果节点不是文本节点,不是属性节点,也不是元素节点,那么data()函数抛出一个状态错误。如果节点是一个非类型化XML实例的文档节点,那么data()返回文档的字符串值。如果节点是一个复合类型元素,data()返回一个状态错误。

 

示例:使用string()函数

参见章节“使用XQuery构造XML”中的示例“使用常量给计算元素和属性构造器命名”,示例是一个查询,通过使用string()函数和计算元素构造器来构建应聘者的职业经历的XML。

 

示例:使用data()函数

下面的查询通过使用data()函数和计算元素构造器来构建应聘者的职业经历的XML。

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where xs:decimal( data($ED/RES:Edu.GPA) ) gt 3.5 

        return 

          element Education

          {

                element Level { data($ED/RES:Edu.Level) },

                element Degree { data($ED/RES:Edu.Degree) },

                element GPA { data($ED/RES:Edu.GPA) },

                element GPAScale { data($ED/RES:Edu.GPAScale) }

          }

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

字符串的处理

XQuery支持四个字符串处理函数:

•        concat()连接两个或者多个字符串。

•        contains() 确定第一个操作元中是否包含和第二个操作元一样的字符串。搜索字符串的长度要小于4000(Unicode码)。

•        substring() 提取输入字符串在另外一个字符串中的位置。

•        string-length() 计算字符串的长度. 

SQL Server 2005目前的版本只支持Unicode codepoint的整理。

 

示例:使用concat() 和substring()函数

下面的查询通过连接开始日期,结束日期,工作单位名称和职位来构建应聘者职业经历的XML:

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        return

          <Employment>

          {

                concat( substring(string($EMP/RES:Emp.StartDate),1,10)," to ",

                  substring(string($EMP/RES:Emp.EndDate),1,10), ", ",

                  string($EMP/RES:Emp.OrgName), ", ",

                  string($EMP/RES:Emp.JobTitle) )

          }

          </Employment>

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

示例:使用contains()函数

下面的查询举例说明了contains()函数的用法,查询显示Edu.Degree节点元素值中包含字符串science的应聘者的教育信息。

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where contains($ED/RES:Edu.Degree, "Science")

        return

          element Education

          {

                element Level { data($ED/RES:Edu.Level) },

                element Degree { data($ED/RES:Edu.Degree) },

                element GPA { data($ED/RES:Edu.GPA) },

                element GPAScale { data($ED/RES:Edu.GPAScale) }

          }

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

引用:

聚集函数

聚集函数输入一个节点序列,然后返回序列的聚集值。在SQL Server 2005中,XQuery目前支持的聚集函数是count()、min()、max()、avg()和sum()。其中,只有支持gt操作的类型(i.e.、三个内置算数基本类型、日期类型、xs:string、xs:boolean和xdt: untypedAtomic)才能使用min()和max()函数。三个函数不支持混合类型的序列。更进一步,xdt:untypedAtomic被认为是xs:double类型。

 

然后,输入的表达式必须是三个内置算数函数类型或者untypedAtomic(但不能是混合型,xdt:untypedAtomic被认为是xs:double类型)的子类型,才能使用avg()和sum()函数。

 

最后,count()函数返回序列中节点的数量。

 

示例:使用count()函数

下面的查询使用count()函数得出了文档中employment、education和address节点的数量。

SELECT Resume.query('

        declare namespace RES="";

        <Employment>Element count is { count(/RES:Resume/RES:Address) }</Employment>,

        <Education>Element count is { count(/RES:Resume/RES:Education) }</Education>,

        <Address>Element count is { count(/RES:Resume/RES:Address) }</Address>

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

示例:使用min()函数

下面的查询使用min()函数得出了GPA值最小的education节点。

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where $ED/RES:Edu.GPA = min(/RES:Resume/RES:Education/RES:Edu.GPA)

        return 

        $ED 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

示例:使用max()函数

下面的查询使用max()函数得出了GPA值最大的education节点。

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where $ED/RES:Edu.GPA = max(/RES:Resume/RES:Education/RES:Edu.GPA)

        return 

        $ED 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

示例:使用avg()函数

下面的查询使用avg()函数计算了纽约和波士顿的每周平均最高和最低的温度。

DECLARE @Weather xml

SET @Weather = '

<WeatherInfo>

        <NewYork>

                <Temp Date="2004-11-01" High="55" Low="45" />

                <Temp Date="2004-11-02" High="58" Low="42" />

                <Temp Date="2004-11-03" High="60" Low="40" />

                <Temp Date="2004-11-04" High="51" Low="47" />

                <Temp Date="2004-11-05" High="54" Low="41" />

                <Temp Date="2004-11-06" High="55" Low="43" />

                <Temp Date="2004-11-07" High="58" Low="47" />

        </NewYork>

        <Boston>

                <Temp Date="2004-11-01" High="53" Low="45" />

                <Temp Date="2004-11-02" High="56" Low="42" />

                <Temp Date="2004-11-03" High="54" Low="41" />

                <Temp Date="2004-11-04" High="52" Low="45" />

                <Temp Date="2004-11-05" High="52" Low="36" />

                <Temp Date="2004-11-06" High="54" Low="41" />

                <Temp Date="2004-11-07" High="56" Low="44" />

        </Boston>

</WeatherInfo>'

 

SELECT @Weather.query('

        <WeatherInfo>

                <NewYork>

                        <AvgHigh>{ avg(/WeatherInfo/NewYork/Temp/@High) }</AvgHigh>

                        <AvgLow>{ avg(/WeatherInfo/NewYork/Temp/@Low) }</AvgLow>

                </NewYork>

                <Boston>

                        <AvgHigh>{ avg(/WeatherInfo/Boston/Temp/@High) }</AvgHigh>

                        <AvgLow>{ avg(/WeatherInfo/Boston/Temp/@Low) }</AvgLow>

                </Boston>

        </WeatherInfo>

') as Result

 

示例:使用sum()函数

下面的查询使用sum()和count()函数计算了纽约和波士顿的每周平均最高和最低的温度。

DECLARE @Weather xml

SET @Weather = '

<WeatherInfo>

        <NewYork>

                <Temp Date="2004-11-01" High="55" Low="45" />

                <Temp Date="2004-11-02" High="58" Low="42" />

                <Temp Date="2004-11-03" High="60" Low="40" />

                <Temp Date="2004-11-04" High="51" Low="47" />

                <Temp Date="2004-11-05" High="54" Low="41" />

                <Temp Date="2004-11-06" High="55" Low="43" />

                <Temp Date="2004-11-07" High="58" Low="47" />

        </NewYork>

        <Boston>

                <Temp Date="2004-11-01" High="53" Low="45" />

                <Temp Date="2004-11-02" High="56" Low="42" />

                <Temp Date="2004-11-03" High="54" Low="41" />

                <Temp Date="2004-11-04" High="52" Low="45" />

                <Temp Date="2004-11-05" High="52" Low="36" />

                <Temp Date="2004-11-06" High="54" Low="41" />

                <Temp Date="2004-11-07" High="56" Low="44" />

        </Boston>

</WeatherInfo>'

 

SELECT @Weather.query('

        <WeatherInfo>

                <NewYork>

                        <AvgHigh>{ sum(/WeatherInfo/NewYork/Temp/@High) div count(/WeatherInfo/NewYork/Temp/@High) }</AvgHigh>

                        <AvgLow>{ sum(/WeatherInfo/NewYork/Temp/@Low) div count(/WeatherInfo/NewYork/Temp/@Low) }</AvgLow>

                </NewYork>

                <Boston>

                        <AvgHigh>{ sum(/WeatherInfo/Boston/Temp/@High) div count(/WeatherInfo/Boston/Temp/@High) }</AvgHigh>

                        <AvgLow>{ sum(/WeatherInfo/Boston/Temp/@Low) div count(/WeatherInfo/Boston/Temp/@Low) }</AvgLow>

                </Boston>

        </WeatherInfo>

') as Result

上下文函数

你可以使用上下文函数来获得某上下文节点的上下文关系属性。SQL Server 2005中实现了两个上下文函数—last() 和 position()。last()函数可以确定一个序列中节点的数量,而position()函数可以获得一个上下文节点的位置。毫无疑问,在SQL Server 2005中,last() 和 position()函数只能被各节点间关系独立的上下文使用。

 

示例:使用last()函数

下面的查询使用last()函数获得某应聘者的最后一个address节点。

SELECT Resume.query('

        declare namespace RES="";

        /RES:Resume/RES:Address[last()]

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

示例:使用position()函数

下面的查询使用position()函数获得某应聘者的最后一个address节点。

SELECT Resume.query('

        declare namespace RES="";

        /RES:Resume/RES:Address[position()<=2]

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

关系类型表达式

XQuery根据类型的信息可以支持不同类型的表达式和操作。这些表达式可以分类为类型声明表达式、类型检测表达式和类型构造表达式。这些表达式将是下部分主要探讨的内容。

 

类型声明表达式

如for语句中的xs:TYPE

你可以使用as语句来说明for语句中使用的捆绑变量的类型。

当绑定变量实际的值不是变量本身的类型时,会返回一个类型错误。

示例:使用“as xs:TYPE”语句

下面的查询将address节点序列绑定在变量$A,变量定义为类型元素(RES:Address):

SELECT Resume.query('

        declare namespace RES="";

        for $A as element(RES:Address) in /RES:Resume/RES:Address

        return        

                $A

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

类型检查表达式

xs:TYPE实例

使用instance of可以识别XML文档中单个节点的类型。

示例:使用"instance of xs:TYPE" 

下面的查询检查确定一个用xPath表达式标识的address节点的类型是否是element()类型:

SELECT Resume.query('

        declare namespace RES="";

        if ( (/RES:Resume/RES:Address)[1] instance of element() )

        then

                <Result>Selected node is an Element</Result> 

        else

                <Result>Selected node is not an Element</Result> 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

类型转换函数

隐式类型转换

对于包含算数操作符或者功能符合的表达式,XQuery引擎实现了对表达式中数字类型和非类型化原子值的隐式类型转换。当一个表达式返回数字类型不是期望的类型时,就需要进行类型转换。而类型转换就是把表达式的返回类型转换为需要的类型。

 

示例:隐式类型转换

下面的查询完成了对小数和double值得操作。在本示例中,表达式只有先把xs:decimal转换成xs:double 才能进行相加。

DECLARE @result xml

SET @result = '<Result />'

SELECT @Result.query('

        <Result>{ xs:decimal("10.55") xs:double(1.5e1) }</Result>

') as Result

显式类型转换

 

值类型构造器

在XML Schema 规范中对所有的内置类型定义了构造函数。这些构造函数不仅可以构造类型化的值还可以进行类型转换。XQuery还可以用于为输入的schemas定义类型。

 

示例:使用值类型构造器实现值的构造

下面的查询得出了所有StartDate大于xs:date类型构造的值的Employment节点:

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        where $EMP/RES:Emp.StartDate gt xs:date("1995-01-01")

        return        

                $EMP

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

示例:使用值类型构造器实现类型转换

下面的查询得出了JobCandidateID等于2的应聘者的所有GPA大于或者等于3.8的Education节点。本示例使用xs:decimal类型的值构造器实现了把Edu.GPA的值从xs:string类型转换为xs:decimal类型:

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where xs:decimal( data($ED/RES:Edu.GPA) ) ge 3.8 

        return

          element Education

          {

                element Level { string($ED/RES:Edu.Level)},

                element StartDate { string($ED/RES:Edu.StartDate)},

                element EndDate { string($ED/RES:Edu.EndDate)},

                element Degree { string($ED/RES:Edu.Degree)},

                element GPA { string($ED/RES:Edu.GPA)},

                element GPAScale { string($ED/RES:Edu.GPAScale)}

          }

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

引用:

cast as xs:TYPE ?操作符

在SQL Server 2005中,XQuery支持cast as TYPE ?操作符,能够完成显式类型转换。使用xs:TYPE()构造器也可以完成显式类型转换,而且写起来也比cast as TYPE ?操作符更简洁。

示例:使用“cast as TYPE ?”操作符

下面的查询为JobCandidateID等于3的应聘者创建了一个XML文档,其数据选自该应聘者的Education节点:

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        return

          element Education

          {

                element Level { $ED/RES:Edu.Level cast as xs:string? },

                element StartDate { $ED/RES:Edu.StartDate cast as xs:date? },

                element EndDate { $ED/RES:Edu.EndDate cast as xs:date? },

                element Degree { $ED/RES:Edu.Degree cast as xs:string? },

                element GPA { $ED/RES:Edu.GPA cast as xs:decimal? },

                element GPAScale { $ED/RES:Edu.GPAScale cast as xs:decimal? }

          }

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

示例:使用“xs:TYPE()”操作符

下面的查询内容和结果都同前一个示例,但用xs:TYPE()操作符替代了cast as xs:TYPE ?操作符:

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        return

          element Education

          {

                element Level { xs:string($ED/RES:Edu.Level) },

                element StartDate { xs:date($ED/RES:Edu.StartDate) },

                element EndDate { xs:date($ED/RES:Edu.EndDate) },

                element Degree { xs:string($ED/RES:Edu.Degree) },

                element GPA { xs:decimal($ED/RES:Edu.GPA) },

                element GPAScale { xs:decimal($ED/RES:Edu.GPAScale) }

          }

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

引用:

访问关系性的列和变量

当使用XQuery来写查询语句的时候,极少情况下会遇到在查询中需要访问关系性的列和变量。但SQL Server 2005为了满足这种需求,提供了两个函数—sql:column()和 sql:variable()。函数sql:column()可以在查询中访问关系表中非XML的列。在特定情况下可以使用该函数,比如将XML和多个表中非XML的列的信息进行聚集,使用非XML列的值来过滤某XQuery的返回值等等。datetime、CLR用户自定义函数或者XML不能调用函数sql:column()和 sql:variable()。

 

示例:使用sql:column()函数

下面的查询创建了一个XML文档,数据来自非XML类型的列Name和CustomerID,还来自XML类型的列Demographics中的元素YearOpened、NumberOfEmployees、AnnualSales和AnnualRevenue。

SELECT Demographics.query('

        declare namespace ST="";

        element CustomerInfo

        {

                element CustomerID { sql:column("Store.CustomerID") },

                element Name { sql:column("Store.Name") },

                element YearOpened { string((/ST:StoreSurvey/ST:YearOpened)[1]) },

                element NumberOfEmployees { string((/ST:StoreSurvey/ST:NumberEmployees)[1]) },

                element AnnualSales { string((/ST:StoreSurvey/ST:AnnualSales)[1]) },

                element AnnualRevenue { string((/ST:StoreSurvey/ST:AnnualRevenue)[1]) }

        }

') as Result

FROM [Sales].[Store] Store 

WHERE Store.CustomerID = 4

 

示例:使用sql:variable()函数

在下面的存储过程中,通过在XQuery的where语句中使用变量@AddrType的值对数据进行过滤,返回了满足过滤条件的应聘者的home address节点:

CREATE PROCEDURE [GetCandidateAddress]

        @JobCandidateID [int],

        @AddrType [varchar](20)

AS

BEGIN

        SET NOCOUNT ON;

 

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address

        where $A[ RES:Addr.Type = sql:variable("@AddrType") ]

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = @JobCandidateID

 

END

 

示例:结合使用XML数据类型的exist()方法和sql:variable()函数

下面的查询返回了所有获得商业专业学士学位的应聘者的简历:

DECLARE @EducationLevel varchar(20)

SET @EducationLevel = 'Bachelor'

 

DECLARE @major varchar(20)

SET @major = 'Business'

 

SELECT JobCandidateID, Resume

FROM [HumanResources].[JobCandidate]

WHERE Resume.exist ('

        declare namespace RES="";

        /RES:Resume/RES:Education[ RES:Edu.Level = sql:variable("@EducationLevel") and RES:Edu.Major = sql:variable("@major") ]') = 1

不支持的特性和工作中的解决方案

目前SQL Server 2005中,XQuery不支持的特性如下:

•        Let 语句:作为FLWOR表达式一部分的let语句,能为表达式的返回值绑定一个变量。解决方案-可以用inline表达式代替let语句使用。

•        Range表达式(to操作符):Range表达式能够使用to操作符来构架自增的整数序列。比如,一个range表达式(6to10),它可以构架队列(6, 7, 8, 9, 10)。解决方案—你可以列出序列的所有值,以代替使用to操作符。

•        类型信息:目前还不支持基于类型系统的某些特性,如表达式typeswitch、treat as、 castable和validate。

•        Typeswitch表达式类似与其它程序语言中的switch-case结构。在switch-case语句中,每个分支都是基于switch输入的条件的值;而在typeswitch表达式中,每个分支都是基于typeswitch输入的条件的类型。解决方案—使用if then else和instance of语句来代替。

•        Treat as表达式能够将表达式返回的静态类型转换为指定的静态类型,并且当表达式的返回静态类型与指定静态类型不匹配时,会报一个静态类型错误。它不能转换表达式返回的动态类型或者值。解决方案—无。

•        Castable表达式能够检查确认一个原子值是否可以转换为指定的类型。解决方案—使用表达式“empty(data($x)) or not(empty(T($x)))” 代替“$x castable as T?”。

•        Validate表达式在目前范畴内,是把基于schema定义的条件有效化。解决方案—使用Transact-SQL转换schema collection,来替代使用validate表达式。

•        可重用性(Reusability):与其它程序语言一样,它可以编写可重用性的函数,和已知的用户自定义函数一样,包含可以调用和整合的查询。另外,它还可以把用户自定义的函数如模块的聚集进行打包。查询能够通过引入模块,调用模块中的函数。模块能够在查询的前缀部分进行引入。SQL Server 2005对这个特性没有解决方案。

•        Built-in functions:目前在SQL Server 2005中,还不支持下面列举的内置函数。关于这些函数的更多内容,参见网站W3C.org的《XQuery 1.0和XPath 2.0的函数与操作符》(XQuery 1.0 and XPath 2.0 Functions and Operators)。

•        访问符(accessors):fn:node-name(), fn:nilled(), fn:base-uri(), fn:document-uri()。

•        错误函数(error function): fn:error().

•        跟踪函数(trace function): fn:trace().

•        数值函数(functions on numeric values): abs(), round-half-to-even()。

•        字符串处理函数(string-handling functions): codepoints-to-string(), string-to-codepoints(), compare(), string-join(), normalize-space(), normalize-unicode(), upper-case(), lower-case(), translate(), escape-uri(), starts-with(), ends-with(), substring-before(), substring-after(), matches(), replace(), tokenize()。

•        统一资源标识的函数和操作符(functions and operators for anyURI): resolve-uri()。

•        时间段、日期、时间的函数和操作符(functions and operators on durations, dates, and time): years-from-duration(), months-from-duration(), days-from-duration(), hours-from-duration(), minutes-from-duration(), seconds-from-duration(), year-from-dateTime(), month-from-dateTime(), month-from-dateTime(), day-from-dateTime(), hours-from-dateTime(), minutes-from-dateTime(), seconds-from-dateTime(), timezone-from-dateTime(), year-from-date(), month-from-date(), day-from-date(), timezone-from-date(), hours-from-time(), minutes-from-time(), seconds-from-time(), timezone-from-time(), adjust-dateTime-to-timezone(), adjust-date-to-timezone(), adjust-time-to-timezone(), subtract-dateTimes-yielding-yearMonthDuration(), subtract-dateTimes-yielding-dayTimeDuration(), subtract-dates-yielding-yearMonthDuration(), subtract-dates-yielding-dayTimeDuration(). 类型xdt:dayTimeDuration 和 xdt:yearMonthDuration也不支持。

•        QNames相关函数(functions related to QNames): resolve-QName(), QName(), namespace-uri-for-prefix(), in-scope-prefixes()。

•        节点函数(functions on nodes): name(), lang(), root(). 解决方案–使用 of root()代替。

•        序列的函数和操作符(functions and operators on sequences): fn:boolean(), fn:index-of(), fn:exists(), insert-before(), remove(), reverse(), subsequence(), unordered(), zero-or-one(), one-or-more(), exactly-one(), deep-equal(),two-argument version of id(), idref(), doc(), collection()函数和集合, intersect和except 操作符。解决方案 – 使用not(not()) 代替fn:boolean(),使用 not(empty())代替fn:exists(). 使用重复说明代替zero-or-one(),使用[1]代替exactly-one()。

•        上下文函数(context functions): current-dateTime(), current-date(), current-time(), default-collation(), implicit-timezone()。

•        位置变量(positional variable):位置变量可以使用at语句定义为一个FLWOR语句中的某部分,它能够标识某表达式返回结果中的节点位置。

•        改变顺序(order):使用order by语句来改变“empty greatest | least”顺序是不支持的。

•        其它特征:下面的特征也不提供支持:

•        Idiv操作符。

•        不支持从外部导入schema。

•        不支持外部变量。

•        不支持无边界的保存条件。

•        不支持不同类型序列的串联,如节点和数据。

•        不支持保存0时间。

•        不支持使用一个简单类型的内容来访问一个元素中的文本节点。

•        不支持在一个类型化XML数据类型应用中访问xsi:*属性。

最佳实践和指导方针

•        尽可能利用可以使用的类型的特点。它能够提高执行效率和通过静态类型来监测错误。

•        如果你想提取XML数据类型的部分属性并在关系性查询中使用它们,那么使用XQuery可以提高性能。通常,有用的属性都在关系性数据表中都作为索引保存,以提高性能。

•        使用递增定义,如[1]或者FLWOR来避免错误匹配基数而导致的静态错误。

•        使用外部转换来避免静态类型错误。

•        索引的使用:如果你要使用繁琐的XPath表达式来查询,就创建一个PATH索引。当XQuery查中的XPath表达式使用模糊路径(e.g., /a/* or //b)来查询元素或者属性时,就使用一个VALUE索引。当查询中包含对XML文档进行某已知属性的所有节点查询的时候,就使用PROPERTY索引。

•        当涉及的大部分类型都是同一个命名空间时,使用默认命名空间。或者,使用一个前缀。

最佳实践的更多内容,参见Microsoft Developer Network (MSDN)的《XML在微软SQL Server 2005上的最佳实践》(XML Best Practices for Microsoft SQL Server 2005)和《XML数据类型的最佳应用》(Performance Optimizations for the XML Data Type)

引用:

XML数据的修改

SQL Server 2005支持对存储在数据库中的XML数据进行修改。目前,W3C XQuery工作草图还没有为XML文档的修改定义一个规范。为了提供修改XML文档的支持,微软研发了XML数据修改语言(XML Data Modification Language  DML)。XML文档可以使用XML数据类型的modify方法修改,并且可以使用XML DML语句指定修改。

XML DML分别使用insert、 delete和 replace value of关键字对XML文档进行插入、删除和更新操作。一个类型化XML文档的修改是以根据对XML数据类型定义的schema约束进行的有效检查为前提的。

 

下面的表和XML文档举例说明了XML DML的操作:

表:

CREATE TABLE [CandidateInfoXMLDataType]

(

        [JobCandidateID] [int] IDENTITY(1,1) NOT NULL,

        [Resume] [xml] NOT NULL,

        [ModifiedDate] [datetime] NOT NULL DEFAULT (getdate())

)

XML实例:

<JobCandidate>    

        <Name>      

                <FirstName>Mike</FirstName>      

                <MiddleName></MiddleName>      

                <LastName>Chen</LastName>    

        </Name>    

        <Address>      

                <Address1>34 181st Place SE</Address1>      

                <Address2>Apt 3344</Address2>      

                <City>Redmond</City>

                <State>WA</State>      

                <Country>US</Country>      

                <PhoneNumber>9870909023</PhoneNumber>    

        </Address>    

        <Education>      

                <BachelorDegree>BS</BachelorDegree>      

                <MasterDegree>MS</MasterDegree>    

        </Education>    

        <Skills>      

                <Skill>ASP.NET</Skill>      

                <Skill>SQL</Skill>      

        </Skills> 

        <Employement>

                <Employer>

                        <OrgName>ABC Technologies</OrgName>

                      <Location>NY, US</Location>

                        <StartDate>20/02/2000</StartDate>

                        <EndDate>10/04/2004</EndDate>

                        <JobTitle>Project Leader</JobTitle>

                        <Responsibility>Responsible for design,development,testing activities</Responsibility>

                </Employer>

        </Employement>

</JobCandidate>

 

插入操作

你可以使用insert关键字在XML文档中插入多个节点。Insert关键字接受XQuery表达式标识的待插入的节点,并支持XQuery表达式来标识插入位置的参照节点。

另外,你还可以使用into, after和before关键字来标识相对于参照节点的新节点的位置。当你使用into关键字,新节点将作为参照节点的子节点被插入。如果你包含into关键字,你同时要使用as first或者as last关键字来标识插入节点的位置和参照节点的当前子节点的位置关系。你可以使用after和before关键字将新节点作为参照节点的同级节点插入参照节点后或者前的位置。

如果参照表达式(表达式2)不能静态地标识某个节点,那么插入操作失败,并返回一个静态错误。

 

语法:

insert 

        Expression1 (

                        {{{as first | as last} into} | after | before}

        Expression2 )

示例:插入一个新技能

下面的存储过程允许用户插入特定应聘者的某个新技能。本存储过程使用sql:variable()函数来访问XML DML语句中的Transact-SQL变量。更多关于如何在XML中绑定非XML关系型数据的内容,参见《关系型列和变量的访问》(Accessing Relational Columns and Variables)。

 

下面的存储过程假定用户要把一个字符串类型的技能值作为第二个参数传递到存储过程中。本存储过程可以修改为接受一个包含多个技能元素的XML片段,这样就实现了一次调用存储过程就完成多个技能节点的插入。

 

/* Stored procedure to insert a new skill element for a candidate */

CREATE PROCEDURE [InsertSkillInfo]

        @JobCandidateID [int],

        @Skill [varchar](200)

AS

BEGIN

        SET NOCOUNT ON;

 

        UPDATE [CandidateInfoXMLDataType]

        SET Resume.modify('

        insert element Skill {sql:variable("@Skill")}

        as last

        into (/JobCandidate/Skills)[1]

        ')

        WHERE JobCandidateID = @JobCandidateID

END

 

删除操作符

Delete关键字可以在XML文档中删除多个节点。Delete关键字接受在XML文档中删除使用XQuery表达式标识的多个节点。

 

语法

delete表达式

示例:删除一个技能

下面举例说明了使用delete关键字删除某特定应聘者的单个技能。

下面的存储过程假定用户要把一个字符串类型的技能值作为第二个参数传递到存储过程中。本存储过程可以修改为接受一个包含多个技能元素的XML片段,这样就实现了一次调用存储过程就完成多个技能节点的删除。

 

/* Stored procedure to delete a specified skill element for a candidate */

CREATE PROCEDURE [DeleteSkillInfo]

        @JobCandidateID [int],

        @Skill [varchar](200)

AS

BEGIN

        SET NOCOUNT ON;

 

        UPDATE [CandidateInfoXMLDataType]

        SET Resume.modify('

        delete (/JobCandidate/Skills/Skill[.=sql:variable("@Skill")])

        ')

        WHERE JobCandidateID = @JobCandidateID

END

本存储过程可以简单的修改为接收包含多个技能元素的XML段落,这样用户就可以在一次调用存储过程中完成多个技能节点的删除。

引用:

Update操作符

Replace value of关键字可以修改现存节点的值。为了修改现在节点的值,你必须定义一个XQuery表达式来标识那些需要更新值的节点,还要定义一个表达式来标识节点的新值。

 

当修改一个非类型化XML文档时,新节点值的表达式必须返回唯一的一个类型化节点。对于一个类型化XML文档来说,新节点值的表达式的类型必须是原表达式的类型或者子类型。

 

语法:

replace value of 

   Expression1 

with

   Expression2

Example: Updating a skill

示例:更新一个技能

下面举例说明了如何使用replace value of关键字来更新某特定应聘者的一个现存技能值。

/* Stored procedure to update a specified skill element for a candidate */

CREATE PROCEDURE [UpdateSkillInfo]

        @JobCandidateID [int],

        @SkillOld [varchar](200),

        @SkillNew [varchar](200)

AS

BEGIN

        SET NOCOUNT ON;

 

        UPDATE [CandidateInfoXMLDataType]

        SET Resume.modify('

        replace value of  (/JobCandidate/Skills/Skill[.=sql:variable("@SkillOld")]/text())[1]

        with sql:variable("@SkillNew")

        ')

        WHERE JobCandidateID = @JobCandidateID

END

与delete操作符不同,update 和 insert操作符只能在每次操作中操作一个节点。

 

XQuery应用场景

场景1:性能评价系统

某工作单位的人力资源部门需要一个性能评价系统来处理典型的公司绩效考核。通常,评价记录包含的信息都是使用自然语言描述的,如职员在评估期间关键项上的表现,说明下一个评估期间的主要项内容,表明员工的培训需求等等。XML是最适合处理这类信息的。职员的评价信息被保存在类型化XML的列中,使用XQuery可以让用户在系统中查询并分析职员的历史表现。更进一步说,XML DML可以修改评价记录。

 

现在,让我们假定工作单位的培训部门正在进行一个ASP.NET培训,并希望邀请所有需要培训的员工加入ASP.NET的培训课堂。下面的查询选择了所有在评价过程中确定需要接受ASP.NET培训的职员。

 

SELECT Appraisal.query('

        for $PA in /PerformanceAppraisal,

    $Skill in $PA/TrainingNeeds/Technical/Skill 

        where contains($Skill, "ASP.NET")

        return

        element Employee

        {

          element EmpID { data($PA/Employee/EmployeeID) },

          element EmpName { data($PA/Employee/EmployeeName) },

          element EMail { data($PA/Employee/EMailID) },

          element Skill { data($Skill) }

        }

') as Result

FROM [EmployeePerformanceAppraisal]

WHERE Appraisal.exist('/PerformanceAppraisal/TrainingNeeds/Technical/Skill/text()[contains(.,"ASP.NET")]') = 1

 

场景2:病例系统

某医院需要一个能获取病人病情的系统。病例包括病人个人信息,保险信息,病情描述,医生诊断,治疗情况等等。可以根据不同需要对病例进行查询分析。XML格式上满足是存储病例内容,如症状,检验报告和包含描述信息的治疗过程。病例可以存储到XML类型的列中。医院可以使用XQuery来分析这些信息。

 

下面的表和XML文档举例说明了在病例场景中XQuery的应用。

表:

CREATE TABLE [MedicalRecords](

        [PatientID] [int] IDENTITY(1,1) NOT NULL,

        [PatientRecord] [xml] NOT NULL,

        [ModifiedDate] [datetime] NOT NULL DEFAULT (getdate())

,

PRIMARY KEY CLUSTERED 

(

        [PatientID] ASC

) ON [PRIMARY]

) ON [PRIMARY]

GO

CREATE PRIMARY XML INDEX idx_PatientRecord on [MedicalRecords] (PatientRecord)

GO

CREATE XML INDEX idx_PatientRecord_Path on [MedicalRecords] (PatientRecord) USING XML INDEX idx_PatientRecord FOR PATH

 

XML实例:

<PatientRecord>

  <PatientDetails>

    <Name>Robert</Name>

    <Gender>Male</Gender>

    <Age>5</Age>

    <InsuranceInfo>

                <Company>Blue Cross Blue Shield</Company>

                <ID>D8456798</ID>

        </InsuranceInfo>

  </PatientDetails>

  <HospitalDetails>

    <Name>KK Hospital</Name>

    <Department>Pediatrics</Department>

  </HospitalDetails>

  <AdmissionDetails>

    <RegistrationNo>D4321</RegistrationNo>

    <DateAdmitted>2004-05-02</DateAdmitted>

    <DateDischarged>2004-05-08</DateDischarged>

  </AdmissionDetails>

  <ProblemDetails>

        <Symptoms>

                <Symptom>Abdominal pain</Symptom>

                <Symptom>Dehydration</Symptom>

        </Symptoms>

    <Diagnosis>Diarrhea</Diagnosis>

        <TreatmentInfo>

          <Therapy>Oral Rehydration Therapy</Therapy>

          <PrescriptionDetails>

            <Item>Pepto-Bismol</Item>

            <Item>Electrolyte Solutions</Item>

      </PrescriptionDetails>

        </TreatmentInfo>

  </ProblemDetails>

</PatientRecord>

现在,让我们假定某医生对查看有“发烧”和“腹痛”症状的病例感兴趣。下面的查询得到了全部有“发烧”和“腹痛”症状的病例。

 

SELECT PatientID, PatientRecord.query('

        element PatientName { data(/PatientRecord/PatientDetails/Name) },

        element MedicalInfo { /PatientRecord/ProblemDetails }

') as Result

FROM [MedicalRecords]

WHERE PatientRecord.exist('/PatientRecord/ProblemDetails/Symptoms/Symptom/text()[contains(.,"Fever")]') = 1

AND PatientRecord.exist('/PatientRecord/ProblemDetails/Symptoms/Symptom/text()[contains(.,"Abdominal Pain")]') = 1

 

场景3:资产管理系统

某工作单位的信息技术部门需要开发一个应用来管理硬件设备和软件程序资产。这个应用必需跟踪的硬件的信息包括设备编号,用户信息,处理器/内存/BIOS/主板/声卡等系统信息,系统自带的软件,买卖信息和版本信息;应用必需维护的公司的软件信息包括软件类型,买入的授权号等等。应用还必需扩展支持未来可能出现的新资产类型。资产管理系统还可以用来生成报表,如硬件使用情况,软件授权号使用情况和硬件设备的维护费用。在这个场景中,需用在一个表中的同列中保存由不同schema说明的信息。多个schema的非类型化XML可以用来保存信息。一个schema collection的类型化XML也可以保存信息。存储成XML数据类型的资产信息可以使用XQuery来查询。

 

现在,让我们假定信息技术部门计划选择预装了微软Windows® XP 和微软 Office 2000软件的计算机系统。下面的查询选择了预装了Windows XP 和 Office 2000的硬件设备列表。

 

SELECT AssetID, AssetDetails.query('

        <Asset>

        {

          element UserName { data(/AssetInfo/UserInfo/Name) },

          element ComputerName { data(/AssetInfo/SystemInfo/ComputerName) },

          element OS { data(/AssetInfo/SystemInfo/OS) }

        }

        </Asset>

') as Result

FROM [Assets]

WHERE Category = 'Hardware'

AND AssetDetails.exist('/AssetInfo/SystemInfo/OS/text()[contains(.,"Windows XP")]') = 1

AND AssetDetails.exist('/AssetInfo/SoftwaresInstalled/Software/text()[contains(.,"Office 2000")]') = 1

引用:

结论

本文为对SQL Server 2005中XQuery的基本知识感兴趣的读者提供学习信息。SQL Server 2005中,XQuery语言的不同特性,包括不支持的特性,都在本文中进行了讨论。文章中也示范了XQuery语言不同特性的应用实例。文中的XQuery应用场景可以帮助用户确定何种情况下适宜使用XQuery。

更多信息:

《XML在微软SQL Server 2005中的最佳实践》(XML Best Practices for Microsoft SQL Server 2005)

《微软SQL Server 2005对XML的支持》(XML Support in Microsoft SQL Server 2005)

《XML数据类型的性能优化》(Performance Optimizations for the XML Data Type )

引用:

版权说明

本文只是一个初步的文档,在软件随后发布的最终商业版中,本文描述的部分内容可能会有所变化。

包含在本文中的内容,代表了微软公司在这些问题上最新的观点,直到正式发布软件为止。因为微软必须根据市场条件的变化做出响应,因此本文不应作为微软任何部门的承诺,并且微软不能保证在正式版本发布后,本文中任何信息的准确性。

这个白皮书仅用于提供信息之目的。微软公司对这个文件的信息不做任何担保、明示、暗示或者法律相关责任。

遵守所有适用的版权法是用户的义务。在不限制版权法所规定权利的前提下,未经微软公司明确的书面许可,不得以任何目的、任何形式或任何手段(电子、机械、影印、录制或其他手段)对本文档的任何部分进行复制、储存或引入检索系统、或传播。

Microsoft 可能已拥有与本文档中涉及的主题相关的专利、专利申请、商标、版权或其他知识产权。除非得到 Microsoft 的明确书面许可协议,提供本文档并不表示授予使用这些专利、商标、版权或其他知识产权的任何许可。

除非另作说明,否则文中描述的公司、组织、产品、域名、电子邮件地址、图标、人员、地点和事件都是虚构的,无意联系或暗示与任何真实的公司、组织、产品、域名、电子邮件地址、图标、人员、地点和事件有所联系。  

©2005 微软公司。版权所有。

Microsoft和ActiveX是微软公司在美国和/或其他国家(地区)的注册商标或商标。

此处涉及的真实公司名称和产品名称可能是其各自所有者的商标。

本文由星彩网app下载发布于星彩彩票app下载,转载请注明出处:构建和转换XML,在SQLServer中的使用

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。