IM InfoSphere Identity Insight Version 8.0

Speicherparameter für große Attributdaten

Damit das System große Attributdaten für das Scoring speichern und verarbeiten kann, müssen Metadaten in UMF (Universal Message Format) konvertiert und in den entsprechenden Spalten gespeichert werden.

Verwenden Sie die Spalten ATTR_VALUE und ATTR_LARGE_DATA zum Speichern großer oder unstrukturierter Attributdaten für angepasste Attribut- und Scoring-Anwendungen.

Spalte und UMF-Tagname Datentyp und Größe Erforderlich Erläuterung
ATTR_VALUE varchar(255) (Standardwert) auf maximal 8 KB erweiterbar Ja Daten, die als eines der Attribute in einem ETL-Prozess mit den Basis-Plug-ins für das Scoring verwendet werden.

Wenn die Daten größer als 8 KB sind und im Binärformat vorliegen, speichern Sie sie in der Spalte ATTR_LARGE_DATA und erstellen Sie eine eindeutige Kennung für diese Daten in der Spalte ATTR_VALUE. Diese ATTR_VALUE-Kennung wird dann für Vergleich und Scoring verwendet. Erstellen Sie z. B. einen einseitig gerichteten MD5-Hash-Code (MD5 - Message-Digest Algorithmus 5), der im Visualizer und in den Berichten verglichen und angezeigt werden kann.

Die maximale Spaltengröße ist von der Datenbank abhängig. Damit Binärdaten, die größer als 255/3 sind, in ATTR_VALUE gespeichert werden können, muss die Spaltengröße geändert werden. Aus Leistungsgründen sollten Sie eine erneute Optimierung des Datenbankcache erwägen, da wahrscheinlich weitaus weniger Zeilen in den Cache passen.

ATTR_LARGE_DATA Großes Zeichenobjekt (CLOB) zur Verwendung von Daten über 8 KB. Nein Als Zeichendaten speichern. Verwenden Sie z. B. Base64-Codierung von Binärdaten.

Verwenden Sie diese Spalte zum Speichern von Attributdaten, die für die Spalte ATTR_VALUE zu groß sind.

ATTR_LARGE_DATA ist eine Spalte des Typs CLOB (großes Zeichenobjekt), die Daten ohne Größenbeschränkung aufnehmen kann.

Diese Daten stehen für die Entitätsauflösung zur Verfügung. Die Struktur der Daten muss dem Verfasser des angepassten Vergleichs-Plug-ins bekannt sein. Visualizer zeigt diese Daten nicht an, da das Format kein Standardformat ist und bei unterschiedlichen Systemtypen variiert.

Die Leistung eines CLOB fällt gegenüber der einer varchar-Spalte ab, da ein CLOB nicht in den Cache gestellt werden kann und von Platte gelesen werden muss. Daher ist ATTR_VALUE vorzuziehen. Wird die Spalte ATTR_VALUE vergrößert, bedeutet dies, dass weniger Attributdaten im Cache abgelegt werden. Daher kann es unter Umständen besser sein, für Daten unter 8 KB einfach die Spalte ATTR_LARGE_DATA zu verwenden, um sicherzustellen, dass andere nicht so große Attribute wie Geschlecht und Geburtsdatum in den Cache gestellt werden. Diese Entscheidung liegt beim Architekten. Wenden Sie sich im Zweifelsfall an Ihren Systemadministrator.

Beispiel

Hier ein Beispiel einer MD5-Hashwertausgabe großer Binärdaten:
<ATTRIBUTE><ATTR_TYPE>BIOMETRIC-1</ATTR_TYPE><ATTR_VALUE>214b21fc3e040f844a07710b1bb451a0
</ATTR_VALUE><ATTR_LARGE_DATA><![H4sICBRTqkgAA2Zvby50eHQAK0ktLuHlAgDkTqoPBgAAAA==]>
</ATTR_LARGE_DATA></ATTRIBUTE>
Tatsächliche ATTR_LARGE_DATA-Werte sind in der Regel weitaus größer als in diesem Beispiel gezeigt.


Feedback

Letzte Aktualisierung: 2009