Dans ce glossaire figurent les définitions de la terminologie etRelationship Resolution.
A
- acquisition file processor (AFP)
- Voir utilitaire de conversion de fichier UMF.
- AFP (acquisition file processor)
- Voir utilitaire de conversion de fichier UMF.
- alerte
- Message ou autre indication qui signale qu'un évènement est survenu. Voir
également alerte de rôle et alerte d'attribut.
- alerte d'attribut
- Alerte qui identifie les entités qui concordent avec un ensemble d'attributs définis.
- alerte de rôle
- Alerte qui identifie une seule ou deux entités contenant des rôles
que l'utilisateur a désignés comme intéressants ou conflictuels.
- attribut
- Caractéristique ou trait qui décrit une personne, un organisme, un lieu ou
un élément. Voir également entité et identité.
- attribution intégrale
- Fonction d'audit de la base de données d'entités par laquelle des détails spécifiques
sont stockés sur l'emplacement d'où proviennent les identités. En accumulant ces renseignements de contexte, il est possible
de remonter au système source original de toutes les données de la base de données d'entités.
B
- base de données de la console de configuration
- Base de données qui stocke les paramètres de configuration de la console
de configuration. Voir également base de données du moniteur d'application et base de données
d'entités.
- base de données d'entités
- Base de données qui stocke les identités, entités, et données servant aux relations, résolutions et alertes. Il se peut que
la base de données d'entités stocke également les paramètres de configuration, routage et supervision si les utilisateurs
n'ont pas choisi de créer une base de données de moniteur d'application et une base de données de console de configuration distinctes.
Voir également base de données de moniteur d'application et base de données
de console de configuration.
- base de données du moniteur d'application
- Base de données qui stocke les informations de routage et supervision des
pipelines. Voir également base de données d'entités et base de données
de console de configuration.
C
- caractéristique
- Trait ou propriété définis par l'utilisateur et associés
à une identité qui ne s'exprime habituellement pas sous forme de nom, numéro,
adresse ni adresse électronique. Cet attribut permet d'enrichir le produit en définissant des attributs d'entité
personnalisables, significatifs pour leurs sources de données. Voir également attribut et identité.
- CME Admin (Central Messaging Engine Administrator)
- Voir moniteur d'application.
- code de rôle
- Identificateur unique d'un rôle. Voir également rôle.
- code de source de données
- Identificateur, défini par l'utilisateur, de la source de données.
- compte
- Voir identité.
- compte de source de données
- S'il sagit de se référer à l'instance spécifique dans une source de données, voir identité.
- S'il sagit de se référer à l'ID unique d'une instance spécifique dans une source de données, voir ID externe.
- concordance principale
- Voir générateur de candidats.
- conflit
- Voir alerte de rôle.
- console de configuration
- Interface graphique servant à configurer le système, superviser les
données et acheminer les messages, et consulter les rapports.
D
- degrés de séparation
- Mesure de la relation entre deux entités. La mesure
est un entier positif supérieur ou égal à zero qui définit le nombre minimum
d'entités impliquées dans une chaîne de relations, entité
racine non comprise. Par exemple, si deux entités sont apparentées, elles sont
séparées d'1 degré, et ont une relation d'1 degré. Voir également relation.
- démon
- Programme à exécution automatique qui accomplit des fonctions permanentes ou périodiques, telles que le contrôle du réseau.
- détacher
- Processus qui consiste à découpler d'une entité une identité entrante et à vérifier de nouveau
qu'elle devrait encore être associée à cette entité.
- divulgation
- Relation définie par l'utilisateur entre deux identités dans deux entités distinctes.
- document d'entrée UMF
- Série de segments UMF qui structurent les données entrantes à charger, modifier ou interroger dans la base de données d'entités.
- document de sortie UMF
- Série de segments UMF qui structurent les données de résultat.
- document UMF
- Série de segments UMF qui structurent les données.
- DQM
- Voir gestion de la qualité des données.
E
- élément
- (1) Voir attribut et type d'attribut.
- (2) Dans les langages de balisage tels que SGML, XML et HTML, unité élémentaire
composée d'une balise initiale, d'une balise finale, des attributs associés et de leurs valeurs, ainsi que
de tout texte figurant entre les deux.
- éléments UMF
- Balises et valeurs XML qui définissent les données au sein d'un segment UMF ou d'un
document UMF.
- entité
- Collection d'une ou plusieurs identités représentant les mêmes personne, organisme, lieu ou élément. Voir
également identité.
F
- fiche
- Représentation en mémoire d'une seule ligne d'un tableau ou autres données.
- fiche de source de données
- Voir identité.
- fichier UMF
- Fichier qui contient des documents UMF. Voir également document UMF.
G
- GDA (general data acquisition)
- Voir utilitaire de conversion de base de données UMF.
- general data acquisition (GDA)
- Voir utilitaire de conversion de base de données UMF.
- générateur d'alerte d'attribut
- Ensemble d'attributs, que le client définit, dont le pipeline se
sert pour les comparer avec les attributs d'identité entrants. Si les attributs concordent,
le pipeline déclenche une alerte d'attribut.
- générateur de candidats
- Ensemble d'attributs configuré servant à élaborer la liste de
candidats. Voir également liste de candidats et attributs.
- gestion de la qualité des données (DQM)
- Processus de pipeline qui vérifie dans les
données si les valeurs obligatoires, les types de données valides et les codes valides sont présents, et
corrige en outre les données en fournissant des valeurs par défaut, en formatant les numéros et dates et en ajoutant des nouveaux codes si cela a été configuré.
La gestion de la qualité des données inclut le traitement de standardisation
d'adresse et de nom. Voir également standardisation d'adresse et standardisation de nom.
H
- hachage
- Chaîne alphanumérique qui est générée à partir d'une autre valeur en vue de
faciliter la recherche et la comparaison de valeurs au sein de la base de données d'entités.
I
- identité
- Collection d'attributs issus d'une source de données et représentant une personne,
un organisme, un lieu ou un élément.
- ID externe
- Clé unique qui identifie une identité dans la source de données. Un ID externe
se compose généralement d'un ID unique de la source de données, et d'un ID unique de
l'identité au sein de sa source de données originale. Par exemple, l'ID externe
d'une identité dans le fichier clientèle d'une banque peut indiquer le nom de la banque
(pour la source de données) et le numéro de compte (pour l'identité dans la
source de données), par exemple Banque XXX, 0123456789.
L
- liste de candidats
- Listes des entités possédant le potentiel de concorder avec la fiche d'identité entrante.
La liste de candidats s'élabore en récupérant les entités qui partagent certains attributs (numéros et adresses par exemple) avec l'identité entrante, en fonction des attributs indiqués dans le générateur de candidats. Au cours du processus
de re-résolution, la liste des entités est confrontée à la nouvelle
entité composite.
M
- mappage de donnée
- Un mappage défini entre les données d'un fichier UMF et les tableaux
et colonnes correspondants de la base de données d'entités. Sans mappage de données, vous ne pouvez charger de données
dans la base de données d'entités.
- messages de sortie
- Voir documents de sortie UMF.
- message UMF
- Voir document UMF.
- modèle d'entité
- Ensemble d'attributs, choisis par l'utilisateur, qui définissent une entité dans le système.
Voir également attributs et entité.
- moniteur d'application
- Composant qui supervise les erreurs, statuts et statistiques de pipelines
et qui envoie des informations de routage aux pipelines. Bien que le moniteur d'application soit installé
avec le pipeline, il est également possible de l'installer séparément.
N
- NCE (net change engine)
- Voir utilitaire Net change.
- noeud
- Dans une configuration de réseau, la machine physique qui contient
des unités fonctionnelles apparentées.
- noeud CME Admin
- Voir console de configuration.
- noeud de pipeline
- Machine physique qui contient des processus de pipeline en cours de fonctionnement.
Voir également pipeline.
- non résolution
- Processus qui consiste à séparer les identités résolues en deux entités séparées.
P
- pipeline
- Composant qui effectue la standardisation de nom, la gestion de la qualité des données,
la standardisation d'adresse et la résolution d'entité. Le pipeline génère également les alertes,
en fonction des configurations système. Voir également standardisation de nom, gestion de la
qualité des données, standardisation d'adresse et résolution
d'entité.
- programmes d'acquisition
- Outils et programmes qui acquièrent les données, les convertissent en un format reconnu (si nécessaire), puis soumettent les données converties au pipeline en vue de leur traitement. Ces programmes
peuvet être configurés pour s'exécuter en mode de traitement par lots ou en mode temps réel.
Q
- Qutil
- Voir utilitaire de file d'attente.
R
- recherche CPS (Cleansed Pipeline Search)
- Synonyme de recherche.
- recherche permanente
- Voir générateur d'alerte d'attribut.
- référence de source de données
- Voir référence externe.
- référence externe
- Identificateur complémentaire d'une identité dans une source de données. Par exemple,
une source de données d'employés peut utiliser le numéro de l'employé comme ID externe
et son numéro de sécurité sociale comme référence externe. Souvent toutefois,
la référence externe est réglée sur la même valeur que l'ID externe
car l'identificateur complémentaire n'est pas nécessaire pour identifier précisément une
identité.
- règle
- Ensemble d'instructions conditionnelles qui permettent aux ordinateurs d'identifier
les relations et d'exécuter en conséquence les réponses automatisées.
- règle de DQM
- Règle qui définit comment les données sont traitées par les processus
et fonctions de gestion de la qualité des données (DQM). Les règles DQM concernent des segments UMF précis.
Quand vous définissez une règle DQM, vous définissez la fonction DQM, les paramètres spécifiques,
et l'ordre dans lequel la règle est traitée. Voir également gestion de la qualité des données et segment
UMF.
- règle de fusion de correspondance
- Voir règle de résolution.
- règle de résolution
- Ensemble de critères qui définit comment des entités comparées sont résolues
ou apparentées.
- règles d'alerte de rôle
- Règle, configurée par l'utilisateur, qui identifie des rôles qui ne peuvent ni exister
dans une même entité, ni être reliés entre plusieurs entités.
- règles de conflit
- Voir règles d'alerte de rôle.
- relation
- Lien entre des entités. Une relation se crée en fonction des données
découvertes, des données divulguées, ou des deux. Voir également entité.
- re-résolution
- Processus de ré-évaluation d'entités par rapport aux entités, relations
ou résolutions existantes, puis de résolution adéquate de ces résolutions.
- résolution d'entité
- Processus qui compare des identités et détermine si elles
représentent la même entité ou deux entités différentes. S'il est établi que
deux identité représentent les mêmes personne, organisme, lieu ou élément, elles sont résolues
en une même entité ; sinon, elles demeurent irrésolues en deux
entités distinctes.
- résolution de relation
- Voir résolution d'entité.
- résolution d'identité
- Voir résolution d'entité.
- rôle
- Classification d'une identité qui en définit l'essence ou
le but. Vous pouvez associer plusieurs rôles à une identité.
S
- score de relation
- Valeur qui est attribuée au cours de la résolution d'entité à l'issue de l'application
des règles de résolution, et qui établit le degré auquel les deux identités comparées
sont apparentées. Ce score est fixe, à savoir qu'il n'est pas modulé
une fois le processus de résolution d'entité terminé. Voir également score de résolution.
- score de résolution
- Valeur qui est attribuée au cours de la résolution d'entité à l'issue du traitement
de concordance et discordance, et qui établit la probabilité que les identités comparées
représentent la même entité. Ce score sert à résoudre une nouvelle identité
en une entité existante. Voir également score de relation.
- score de ressemblance
- Voir score de résolution.
- segment de fiche UMF
- Voir segment UMF.
- segment UMF
- Partie d'un document UMF qui structure les données de la source de données.
- service
- Programme qui effectue une fonction primaire au sein d'un serveur
ou logiciel similaire.
- service Web
- Application modulaire autonome et auto-descriptive qu'il est possible de publier,
découvrir, et appeler via un réseau au moyen de protocoles de réseau standard. Généralement,
le langage XML sert à baliser les données, le protocole SOAP à les transférer, le langage WSDL à
décrire les services disponibles, et UDDI à indiquer quels services
sont disponibles. Voir également SOAP, UDDI et WSDL.
- seuil de candidat
- Score minimum auquel une valeur d'attribut particulière doit concorder entre l'identité entrante et une entité existante pour satisfaire la règle de résolution.
Voir également règle de résolution.
- seuil générique
- Nombre de fois qu'une valeur de donnée peut survenir dans la base de données pour plusieurs
entités avant que cette valeur ne soit considérée comme valeur générique. Voir également valeur générique.
- SOAP
- Protocole léger à base XML destiné à l'échange d'informations en
environnement distribué décentralisé. Le protocole SOAP peut servir à solliciter et renvoyer des informations
et à appeler des services sur la totalité d'Internet. Voir également service Web.
- source de données
- Données qui contiennent les identités que vous voulez
charger dans la base de données d'entités. Les sources de données contiennent les
données identificatrices (identificateurs personnels et uniques d'une identité) et non
identificatrices (autres attributs et points de données d'une identité). Les fiches
d'identité de la source de données doivent être exportées au format UMF pour pouvoir
être chargées dans la base de données d'entités. Exemples, non exhaustifs, de sources de données : listes d'employés, listes noires,
listes de fournisseurs, listes de clients, etc.
- standardisation d'adresse
- Processus qui normalise et homogénéise les informations d'adresse afin de corriger les erreurs et transpositions éventuelle et permettre une concordance et une liaison optimales entre entités. Il est possible de faire appels à des logiciels de correction d'adresse complémentaires
pour optimiser le processus de standardisation d'adresse.
- standardisation de nom
- Processus qui normalise les noms en les réduisant au
dérivé ou nom racine le plus courant. Par example, Richard est le dérivé ou nom racine
le plus courant de Dick, Ricardo, Ricky, Rich ou Ritchie, Mohamed étant le dérivé ou nom racine
le plus courant de
Mohamad, Mohammad ou Mohammed.
T
- Translittération
- Processus qui consiste à remplacer les caractères d'un alphabet
par les caractères d'un autre alphabet.
- transport
- Couche de communication qui permet au produit d'envoyer et recevoir des données
entre la source de données et un pipeline. Exemples de transport :
transport HTTP, transport de file d'attente, transport de base de données, ou
transport de fichier, entre autres.
- type d'attribut
- Classification spécifique d'un attribut. Les types d'attribut possibles
sont les caractéristiques, numéros, noms, adresses et adresses électroniques. Voir
également attribut.
- types de document
- Voir documents d'entrée UMF.
U
- UDDI
- Voir Universal Description, Discovery, and Integration.
- UMF (Universal Message Format)
- Langage de balisage standard, à base XML, servant à structurer les fichiers
sources de données. Pour charger des données dans la base de données d'entités, le fichier
doit être au format UMF.
- Universal Description, Discovery, and Integration (UDDI)
- Ensemble de spécifications standard qui permet aux entreprises et applications
de localiser et utiliser rapidement et facilement des services Web sur Internet. Voir également service Web.
- utilitaire de configuration
- Utilitaire servant, après l'installation, à modifier les paramètres de configuration
de base de données et de consignation WebSphere Application Server. Il peut également servir
à appliquer des correctifs à la console de configuration et au visualiseur.
- Utilitaire de conversion de base de données UMF
- Utilitaire qui convertit les fichiers de base de données en fichiers UMF
(Universal Message Format). Cet utilitaire est souvent personnalisé selon votre environnement de base de données particulier.
Voir également Universal Message Format.
- utilitaire de conversion de fichier UMF
- Utilitaire qui convertit les fichiers texte à largeur fixe en fichiers UMF
(Universal Message Format). Voir également Universal Message Format.
- utilitaire de file d'attente
- Utilitaire qui gère le transfert de données
vers une file d'attente de gestionnaire de files d'attente, tel que Microsoft Message Queuing ou WebSphere
MQ, à partir d'un processus ou d'un fichier.
- Utilitaire de formatage UMF
- Utilitaire qui formate les fichiers UMF (Universal Message Format) et extrait
les données UMF afin de consulter les fiches UMF en format large (une fiche UMF par ligne),
format haut (une fiche UMF sur plusieurs lignes), ou pour une balise UMF précise.
Voir également Universal Message Format.
- utilitaire Net change
- Utilitaire qui compare un fichier texte de largeur fixe à un fichier connu et
soit élimine les doublons de fiches entre les données entrantes et le fichier connu,
soit marque les fiches pour ajout, modification ou ou suppression. Cet utilitaire peut contribuer à réduire significativement le nombre de fichessoumises aux pipelines pour traitement.
V
- valeur générique
- Valeur de données qui est survenue dans la base de données pour plusieurs entités
un nombre précis de fois. Par exemple, un numéro de téléphone ayant pour valeur
555-555-5555 pourrait être considéré comme valeur générique une fois qu'il est survenu
10 fois dans la base de données. Voir également seuil générique.
- Visualiseur
- Interface graphique dont se servent les analystes pour se renseigner sur les alertes, visualiser
les relations, rechercher des entités, charger des données et exécuter des rapports.
W
- WSDL (Web Services Description Language)
- Spécification à base XML servant à décrire les services en réseau en tant qu'ensemble
de points finaux fonctionnant sur les messages contenant des informations documentaires
ou de procédure. Voir également service Web.
X
- Xutil
- Voir utilitaire de formatage UMF.