A amostra de Data Analysis fornece um exemplo de Projeto de Data Analysis que foi preenchido anteriormente com alguns exemplos de dados XML. É possível usar esse projeto para explorar a perspectiva do Data Analysis e suas visualizações. Nessas visualizações, é possível analisar os dados carregados, criar um Modelo de Destino e, por fim, gerar um subfluxo. O subfluxo pode ser usado para transformar os dados XML de entrada na nova representação do Modelo de Destino para processamento adicional.
A amostra de Data Analysis usa o Perfil de Data Analysis da Série de Livros predefinido pela IBM. O Perfil de Data Analysis da Série de Livros contém o esquema de série de livros (BookSeries.xsd, conforme mostrado na imagem a seguir). Também contém um glossário que é usado para substituir alguns termos XML por uma forma mais legível. Por exemplo, MediaType="MONO" se torna "Monograph" nas visualizações de Data Analysis para facilitar a interpretação dos dados.
A amostra de Projeto de Data Analysis contém diversos arquivos XML com séries de livros (em um diretório bookxml). Esses arquivos são carregados anteriormente no Projeto de Data Analysis.
<?xml version="1.0" encoding="UTF-8"?> <schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" targetNamespace="book-ns" xmlns:tns="book-ns"> <complexType name="Paper"> <sequence> <element name="Title" type="xsd:string"></element> <element name="Author" type="xsd:string" maxOccurs="unbounded" minOccurs="1"> </element> </sequence> </complexType> <complexType name="Section" mixed="true"> <sequence> <element name="Title" type="xsd:string"></element> <element name="Author" type="xsd:string" maxOccurs="unbounded" minOccurs="0"> </element> <element name="Editor" type="xsd:string" maxOccurs="unbounded" minOccurs="0"> </element> <element name="Paper" type="tns:Paper" maxOccurs="unbounded" minOccurs="0"> </element> </sequence> <attribute name="secType" type="xsd:string" use="required"></attribute> </complexType> <complexType name="Volume"> <sequence> <element name="Title" type="xsd:string"></element> <element name="Editor" type="xsd:string" maxOccurs="unbounded" minOccurs="1"> </element> <element name="volumeInfo" type="tns:VolumeInfo" maxOccurs="1" minOccurs="0"></element> <element name="Section" type="tns:Section" maxOccurs="unbounded" minOccurs="1"> </element> <element name="Media" type="tns:Media" maxOccurs="unbounded" minOccurs="0"> </element> <element name="Appendix" type="tns:AppendixType" maxOccurs="unbounded" minOccurs="0"> </element> </sequence> </complexType> <complexType name="Series"> <sequence> <element name="Title" type="xsd:string"></element> <element name="seriesInfo" type="tns:SeriesInfo" maxOccurs="1" minOccurs="1"></element> <element name="Volume" type="tns:Volume" maxOccurs="unbounded" minOccurs="1"> </element> </sequence> </complexType> <element name="BookSeries" type="tns:Series"></element> <complexType name="SeriesInfo"> <sequence> <element name="Editor" type="xsd:string"></element> <element name="PubDate" type="xsd:int"></element> </sequence> </complexType> <complexType name="Media"> <sequence> <element name="Title" type="xsd:string"></element> </sequence> <attribute name="mediaType" type="xsd:string" use="required"></attribute> </complexType> <complexType name="AppendixType"> <sequence> <element name="Bibliography" type="tns:Bibliography" maxOccurs="1" minOccurs="0"></element> <element name="References" type="tns:RefList" maxOccurs="1" minOccurs="0"></element> </sequence> </complexType> <complexType name="Bibliography"> <sequence> <element name="entry" type="tns:BibEntry" maxOccurs="unbounded" minOccurs="1"></element> </sequence> </complexType> <complexType name="RefList"> <sequence> <element name="Reference" type="xsd:string" maxOccurs="unbounded" minOccurs="1"></element> </sequence> </complexType> <complexType name="BibEntry"> <sequence> <element name="Name" type="xsd:string"></element> <element name="Author" type="xsd:string"></element> </sequence> </complexType> <complexType name="VolumeInfo"> <sequence> <element name="VolPubDate" type="xsd:string"></element> <element name="VolPubLoc" type="xsd:string"></element> </sequence> </complexType> </schema>