Sobre a amostra de Data Analysis

A amostra de Data Analysis fornece um exemplo de Projeto de Data Analysis que foi preenchido anteriormente com alguns exemplos de dados XML. É possível usar esse projeto para explorar a perspectiva do Data Analysis e suas visualizações. Nessas visualizações, é possível analisar os dados carregados, criar um Modelo de Destino e, por fim, gerar um subfluxo. O subfluxo pode ser usado para transformar os dados XML de entrada na nova representação do Modelo de Destino para processamento adicional.



Fluxo de trabalho de Data Analysis

Fluxo de trabalho de Data Analysis

A amostra de Data Analysis usa o Perfil de Data Analysis da Série de Livros predefinido pela IBM. O Perfil de Data Analysis da Série de Livros contém o esquema de série de livros (BookSeries.xsd, conforme mostrado na imagem a seguir). Também contém um glossário que é usado para substituir alguns termos XML por uma forma mais legível. Por exemplo, MediaType="MONO" se torna "Monograph" nas visualizações de Data Analysis para facilitar a interpretação dos dados.

A amostra de Projeto de Data Analysis contém diversos arquivos XML com séries de livros (em um diretório bookxml). Esses arquivos são carregados anteriormente no Projeto de Data Analysis.

BookSeries.xsd

<?xml version="1.0" encoding="UTF-8"?>
<schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" 
        targetNamespace="book-ns" xmlns:tns="book-ns">
    <complexType name="Paper">
    	<sequence>
    		<element name="Title" type="xsd:string"></element>
    		<element name="Author" type="xsd:string" maxOccurs="unbounded"
    			minOccurs="1">
    		</element>
    	</sequence>
    </complexType>

    <complexType name="Section" mixed="true">
    	<sequence>
    		<element name="Title" type="xsd:string"></element>
    		<element name="Author" type="xsd:string"
    			maxOccurs="unbounded" minOccurs="0">
    		</element>
    		<element name="Editor" type="xsd:string"
    			maxOccurs="unbounded" minOccurs="0">
    		</element>
    		<element name="Paper" type="tns:Paper" maxOccurs="unbounded"
    			minOccurs="0">
    		</element>
    	</sequence>
    	<attribute name="secType" type="xsd:string" use="required"></attribute>
    </complexType>

    <complexType name="Volume">
    	<sequence>
    		<element name="Title" type="xsd:string"></element>
    		<element name="Editor" type="xsd:string"
    			maxOccurs="unbounded" minOccurs="1">
    		</element>
            <element name="volumeInfo" type="tns:VolumeInfo" maxOccurs="1" minOccurs="0"></element>
            <element name="Section" type="tns:Section"
    			maxOccurs="unbounded" minOccurs="1">
    		</element>
    		<element name="Media" type="tns:Media" maxOccurs="unbounded"
    			minOccurs="0">
    		</element>
    		<element name="Appendix" type="tns:AppendixType"
    			maxOccurs="unbounded" minOccurs="0">
    		</element>
    	</sequence>
    </complexType>
    
    <complexType name="Series">
    	<sequence>
    		<element name="Title" type="xsd:string"></element>
            <element name="seriesInfo" type="tns:SeriesInfo" maxOccurs="1" minOccurs="1"></element>
            <element name="Volume" type="tns:Volume"
    			maxOccurs="unbounded" minOccurs="1">
    		</element>
    	</sequence>
    </complexType>
    
    <element name="BookSeries" type="tns:Series"></element>

    <complexType name="SeriesInfo">
    	<sequence>
    		<element name="Editor" type="xsd:string"></element>
    		<element name="PubDate" type="xsd:int"></element>
    	</sequence>
    </complexType>

    <complexType name="Media">
    	<sequence>
    		<element name="Title" type="xsd:string"></element>
    	</sequence>
    	<attribute name="mediaType" type="xsd:string" use="required"></attribute>
    </complexType>

    <complexType name="AppendixType">
    	<sequence>
    		<element name="Bibliography" type="tns:Bibliography" maxOccurs="1" minOccurs="0"></element>
    		<element name="References" type="tns:RefList" maxOccurs="1" minOccurs="0"></element>
    	</sequence>
    </complexType>

    <complexType name="Bibliography">
    	<sequence>
    		<element name="entry" type="tns:BibEntry" maxOccurs="unbounded" minOccurs="1"></element>
    	</sequence>
    </complexType>
    
    <complexType name="RefList">
    	<sequence>
    		<element name="Reference" type="xsd:string" maxOccurs="unbounded" minOccurs="1"></element>
    	</sequence>
    </complexType>
    
    <complexType name="BibEntry">
    	<sequence>
    		<element name="Name" type="xsd:string"></element>
    		<element name="Author" type="xsd:string"></element>
    	</sequence>
    </complexType>

    <complexType name="VolumeInfo">
    	<sequence>
    		<element name="VolPubDate" type="xsd:string"></element>
    		<element name="VolPubLoc" type="xsd:string"></element>
    	</sequence>
    </complexType>
</schema>

Voltar para o início da Amostra