IM InfoSphere Identity Insight, Version 8.0

Générateur de candidats

La fonction de générateur de candidats définit les critères que le système applique pour ajouter une entité existante à la liste de candidats dans le cadre du processus de résolution d'entité.

Parmi les paramètres de générateur de candidats typiques figurent l'adresse, les numéros uniques, ainsi que les autres numéros. Il s'agit des types de données que le système compare afin de déterminer quelles entités existantes sont susceptibles de se résoudre en identité entrante. Dès qu'une nouvelle fiche d'identité parvient dans le système, si une entité existante comporte une valeur concordante pour n'importe lequel des types de données identifiés par le générateur de candidats, cette entité est ajoutée à la liste de candidats.

Configurations du générateur de candidats

Les paramètres du générateur de candidats sont organisés par groupes appelés configurations du générateur de candidats. Une seule configuration peut être utilisée au sein d'une configuration de résolution.

Les configurations du générateur de candidats incluses avec le produit sont les suivantes :
  • Par défaut - ce paramètre inclut l'adresse, le numéro unique et d'autres numéros comme critères d'inclusion d'une entité dans la liste des candidats.
  • Par défaut avec nom uniquement - ce paramètre inclut les noms comme critère d'inclusion d'une entité dans la liste des candidats. Ce paramètre est destiné à servir lorsque les données de votre entité sont susceptibles de ne contenir que des noms ou des noms et très peu d'autres types de données.

Considérations sur les configurations

Les valeurs génériques déterminent si une valeur est considérée dans le cadre du processus générateur de candidats. Une fois qu'une valeur est considérée comme générique, elle n'est plus utilisée pour générer des listes de candidats.

Les paramètres du générateur de candidats affectent directement les performances du système. Quand le système, par consultations de l'index, compare une identité entrante à chacune des entités de la base de données, il ne compare que les types de données configurés dans la fonction de générateur de candidats. Ceci permet de générer très rapidement les listes de candidats. A mesure que la base de données s'étoffe et compte de plus en plus d'entités, le volume de données que le générateur de candidats doit comparer augmente. Par exemple, si votre base de données compte 100 000 entités est que le générateur de candidats est réglé pour comparer trois types de données lors de la création de la liste de candidats, dès qu'une nouvelle identité parvient dans le système, celui-ci peut réaliser jusqu'à 300 000 comparaisons simplement pour générer la liste de candidats. Si votre base de données compte 1 000 000 d'entités est que le générateur de candidats est réglé pour comparer trois types de données lors de la création de la liste de candidats, dès qu'une nouvelle identité parvient dans le système, celui-ci peut réaliser jusqu'à 3 000 000 comparaisons simplement pour générer la liste de candidats. Si vous n'ajoutez ne serait-ce qu'un seul critère au générateur de candidats, le système peut effectuer jusqu'à 1 000 000 comparaisons supplémentaires rien que pour établir la liste de candidats, à savoir jusqu'à 1 000 000 de comparaisons supplémentaires par fiche d'identité chargée dans le système. Si les listes de candidats sont trop volumineuses car elles prennent en compte un nombre excessif de types de données, le processus de résolution d'entité fonctionne bien plus lentement que si les paramètres du générateur ne contiennent que les types de données nécessaires à l'élaboration de listes de candidats efficaces.

Lorsque vous réfléchissez au choix entre les paramètres de configuration Par défaut et Par défaut avec nom uniquement, songez bien que si vous optez pour Par défaut avec nom uniquement, vous ajoutez des comparaisons dans un ordre de grandeur supérieur à celles nécessaires à la configuration Par défaut.



Commentaires en retour

Dernière mise à jour : 2009