Sie können auch Datenformate analysieren, für die noch kein Modell existiert. Hierzu müssen Sie nur die Struktur verstehen, so dass Sie das entsprechende DFDL-Modell selbst erstellen können.
Die Datenmodellierung mit DFDL hat sehr viel mit Programmierung zu tun. Stellen Sie sich einfach vor, Sie möchten eine neue Programmiersprache erlernen und in dieser ein Programm schreiben, das ein Geschäftsproblem löst. Nehmen Sie zum Beispiel Java. Sie kaufen sich ein Buch darüber und lesen alles zur Theorie der Sprache. Sie finden einen guten Java-Editor und arbeiten sich in ihn ein. Der schwierigste Teil aber ist es, eine geeignete Struktur für ihr neues Programm zu finden, die ihr Geschäftsproblem wirklich löst. Praktisch ist es dann, wenn Sie sich Beispiele anderer Programmierer ansehen, die ihnen zeigen, wie solche Probleme gelöst werden.
Bei der Datenmodellierung mit DFDL ist es nicht anders. Sie können sich die Theorie über die Modellierungssprache aneignen und sich in einen Editor für diese Sprache einarbeiten. Der schwierigste Teil aber kommt erst, wenn Sie sich ihre Daten ansehen und herausfinden müssen, wie Sie am besten ein Modell dafür erstellen. Wenn Sie Glück haben, ist das Problem bereits ganz oder zumindest teilweise gelöst, weil Sie bereits in dem einen oder anderen Format ein Modell Ihrer Daten haben (Metadaten). Hierzu bietet IBM für DFDL Importprogramme an, die bestimmte Datenformate (z. B. COBOL- und C-Metadaten) in DFDL-Schemas konvertieren. Was aber machen Sie, wenn Ihnen kein referenzierbares Modell vorliegt, nur ein oder mehrere Beispiele des Datenformats? Gerade bei formatierten Textnachrichten, zum Beispiel im Format CSV, gibt es häufig kein Modell. Sie können aber lernen, wie Datenformate analysiert werden, damit Sie die Struktur verstehen und das entsprechende DFDL-Modell selbst erstellen können.