Durante a resolução da entidade, os pipelines resolvem identidades para entidades.
Após a limpeza, padronização ou aprimoramento dos valores dos dados nos registros de identidade,
o pipeline utiliza algoritmos de procura sofisticados
para comparar os valores dos dados no registro de identidade de entrada com entidades
existentes no banco de dados da entidade para determinar se são a mesma entidade.
A resolução de entidades envolve três fases:
- Geração de listas de candidatos
- O sistema utiliza as informações no registro de identidade de entrada para correspondência
com entidades já existentes no banco de dados da entidade para criar uma lista de possíveis
candidatos de resolução da entidade. Cada candidato compartilha valores de atributo suficientes
para continuar avaliando o candidato para resolução da entidade. É possível configurar
os critérios que o sistema utiliza para gerar as listas de candidatos.
- Desempenhando a Resolução da Entidade
- Depois de gerar listas de candidatos, o sistema aplica as regras de resolução
a cada entidade na lista de candidatos, utilizando um método de contagem que calcula
uma contagem de resolução para determinar se a identidade de entrada e a entidade existente
devem ser resolvidas. É possível configurar regras de resolução e configurar os limites
para as contagens de resolução para determinar o grau de correspondência necessário entre os valores de
atributo para que a identidade de entrada e a entidade do candidato sejam resolvidas
para uma entidade.