一般使用者在取得XML档案时,并不会去理解它是一个需要或不需要XSD档案的内容,而是在操作Power Query汇入外部档案时,直接选择XLM档案进行汇入,这解析的工作就交给Power Query啰~
透过Power Query的操作,我们可以从导览器的画面上,就可判别与解读。譬如:我们从曾经介绍过的[MLB球队(v).xml]为例,就是一个不需要XSD的资料档案,在与览画面时可预览到资料输出的内容。\
若此时直接点按[载入]按钮,当然就是将资料原汁原味的预设载入到Excel空白工作表啰!不过,若是试图汇入一个含有XSD档案的XML档案,则有可能汇入时的导览画面不尽相同。譬如,这是一个含有XML结构叙述的[MLB球队(s).xml]档案:
从导览画面中仅有3个资料栏位的预览以及仅有一笔资料记录的呈现,就肯定让不懂XML的使用者茫然而无头绪。若是不明究里的直接在此点按下方的[载入]按钮,看到输出到Excel工作表的结果,当然就更加疑惑啰!
我们就再度进入Power Query编辑器的操作,来为大家实务演练后续的资料处理。此例,在汇出至Excel工作表的操作画面,您可以在右侧[查询与连线]工作窗格里点按两下刚刚输出只有1笔资料列的查询,开启Power Query查询编辑器视窗。
这时候您所看到的输出画面,便是由Power Query解析出这个XML档案资料结构的叙述。其中,「MLB球队」栏位其实代表的是XML档案中的一个节点(Node),而其内容显示着Table,则表示此节点是一个资料表格或资料集,因此,此资料栏位名称左侧便是一个资料表的资料型态图示。而第二个栏位:「http://www.w3.org/2001/XMLSchema-instance」则是XML的命名空间(Namespace),用于定义XML结构的标準,而从此资料栏位名称左侧的图示也可以看出这是一个资料型态为资料表的栏位。至于第三个栏位:「Attribute:generated」则是XML节点属性(Attribute),名称为generated,表示资料生成的时间戳记,因此,此资料栏位名称左侧便是一个日期时间的资料型态图示。
至于后续怎么操作,就在后续文章,透过Power Query查询编辑器的操作,以及查询步骤和M语言程式码来跟大家说个明白。
前一篇:<<学习XML档案格式与实作系列:(4/6) 解析XML档案开头的定义>>
下一篇:<<学习XML档案格式与实作系列:(6/6) 展开XML内容的查询过程>>