Wie führen wir Indexierungsprojekte durch?

Die folgenden Abschnitte erläutern die Schritte zum Erstellen neuer Indexierungsprojekte auf NamensIndex.org


Phase I: Pate für ein eigenes Projekt werden

Du möchtest gerne ein eigenes Indexierungsprojekt realisieren

Der erste gemeinsame Schritt besteht in einem unverbindlichen Abstimmungsgespräch über die Quelle. Die Quelle sollte idealerweise als digitalisierter Aktenbestand mit entsprechenden Scans in einem der polnischen Staatsarchive über die Webseite des Staatsarchives in Allenstein oder Szukajwarchiwach zugänglich sein. In diesem ersten Abstimmungsgespräch schauen wir uns gemeinsam in einer Online- Videokonferenz den Informationsumfang an. Die gescannten Bilddateien der Originalquelle müssen öffentlich zugänglich verlinkt sein und einen Bezug zur Familienforschung in unserem Forschungsgebiet Ost- und Westpreußen haben. Deshalb schließen wir Quellen aus, die ausschließlich hinter einer "Bezahlschranke" wie MyHeritage, Ancestry, Archion oder ähnlichen kommerziellen Portalen als Bildmaterial zugänglich sind.
Dabei prüfen wir zugleich die rechtliche Situation für das neue Projekt:

  • Unterliegen die Personendaten teilweise noch dem Datenschutz?
  • Dürfen die gescannten Bilddateien im Rahmen des Projektes verlinkt werden?
  • Welche Nutzungsrechte der Daten sollen eingeräumt werden?
    Wir unterstützen grundsätzlich den Open-Access Zugang!
  • Wurden die Daten bereits an anderer Stelle transkribiert und unterliegen sie daher möglicherweise einem Urheberschutz?
Gemeinsam Projekte starten

Spezifikation der Datenstruktur

Phase II: Spezifikation der Daten

Modellierung der Datenstruktur und Erfassung der Daten

Der entscheidende erste Schritt zu Beginn eines Projektes ist ein gemeinsames Verständnis über die Modellierung der Datenstuktur, welche sich aus der Quelle ergibt. Sie entscheidet darüber, welche Suchmöglichkeiten dem Familienforscher später zugänglich sein werden, um mit der Quelle zu arbeiten:

  • Welche Datenfelder und Attribute sollen erfasst werden?
  • Wie sollen die Datenfelder strukturiert werden?
  • Auf welche Weise sind die einzelnen Daten miteinander verknüpft?
  • In welchem Datenformat soll die Erfassung der Daten erfolgen?
    Excel-Sheets, ASCII-Datenformate, direkt in einer Datenbank, ...

Diesen Schritt führen wir gemeinsam durch und erstellen zusammen ein grafisches Model der Datenstruktur. Im einfachsten Fall ist dies eine einfache Tabelle, welche später immer wieder in die Datenbank des Projektes importiert werden kann. Wir haben im Laufe der Jahre viel Erfahrung damit gesammelt, wie man solche Datenprozesse effizient gestalten und realisieren kann. Ein solcher Importprozess (wir sprechen vom ETL-Prozess) beinhaltet immer auch eine Prüfung der Daten auf offensichtliche Plausibilitätsregeln, um die Qualität der Indexierung möglichst hoch zu halten. Beim manuellen Transkribieren von Daten können sich immer Fehler einschleichen. Um diese Fehler oder Ergänzungen später jederzeit korrigieren und die Daten erneut importieren zu können, ist ein abgestimmtes Vorgehen bei der Erfassung und Verarbeitung der Daten sehr hilfreich.


Phase III: Indexierung der Digitalisate

Aus den Bilddaten werden Datensätze für die Familienforschung

Nachdem die Struktur der indexierten Daten und der Ablauf ihrer Verarbeitung gemeinsam geklärt ist, geht es daran die Bilddateien zu erfassen. Für digitalisierte Urkunden, welche auf dem Webportal des Archives in Allenstein liegen, bieten wir eine Arbeitsversion des Allenstein-Downloaders an. Dieses Programm war bis zum Jahre 2019 öffentlich zugänglich. Inzwischen pflegen wir diese Software nur noch für unsere internen Indexierungsarbeiten, um die Bilddateien ganzer Aktenbestände und Verzeichniseinheiten als komplette ZIP-Datei lokal zu speichern.
Alternativ stellen wir dir die digitalisierten Bilddateien der Archive auch über unsere Cloud als Komplettpaket zur Verfügung. Damit wird die Arbeit mit den Digitalisaten zum Kinderspiel auf dem heimischen PC.

Als Projektpate steht es dir frei selbst zu entscheiden, ob du die Quelle alleine oder mit weiteren Indexierern und "helfenden Händen" als Team erfasst.

Indexierung von historischen Quellen

Phase IV: Die Web-Applikation entsteht

Integration der Quelle in die Projekte auf Namensindex.org

Wir haben für die neuen Projektapplikationen ein modulares Baukastensystem erstellt, welches es uns einfach macht, neue Projekte in unsere Webseite zu integrieren. Mit der Programmierung der Webseite musst du dich gar nicht beschäftigen. Das erledigen wir mit Hilfe unseres Baukastensystems möglichst effizient. Das "Bürgerbuch Rössel" mag hierfür als Beispiel dienen. Die Webapplikation des Projektes besteht aus einer einzelnen Webseite, die mit Hilfe eines modularen JavaScript Frameworks ihre dynamische Funktionalität erhält: eine sogenannte Single-Page Applikation
Jedes Projekt erhält eine Startseite mit den Informationen zu der Quelle, zum Projekt und (optional) zur genealogischen Arbeit des Projektpaten. Weitere Tabulator-Seiten enthalten dann, je nach Datenstruktur der Quelle, die Suchmöglichkeiten zu den genealogischen Daten aus der Indexierung. In den meisten Fällen wird dies über Darstellungen in Tabellen oder Listen erfolgen. Besonderen Wert legen wir darauf, dass es für den suchenden Benutzer einen möglichst kurzen Weg von der Indexierung hin zum digitalen Zwilling der historischen Quelle gibt.
Jedes Projekt erhält eine individuelle Personenkarte zu einem einzelnen Datensatz. Diese wird später an die genealogischen Meta-Suchmaschinen angeschlossen, um die Daten auch von anderen genealogischen Suchmaschinen auffindbar zu machen.

Wir betreiben mehrere Testserver für unsere Webseite im Internet. Dort können wir bereits vor der offiziellen Veröffentlichung des Projektes gemeinsam mit den ersten Beispieldaten die Funktionalität der ETL-Prozesse und Webseite ansehen und testen. So ist das Projekt am Tage der Veröffentlichung bereits ausgiebig getestet. Dies ist ein weiterer wichtiger Schritt zur Qualitätssicherung unserer Arbeit.

Die Webseite entsteht

Phase V: Das Projekt geht Online

Dein Projekt wird anderen Familienforschern zugänglich gemacht.

Wir entscheiden gemeinsam über den Zeitpunkt, wann dein Projekt einen Reifegrad erreicht hat, um es bereits der Öffentlichkeit zugänglich zu machen. Die Indexierung der standesamtlichen Register wurde von Bernhard Ostrzinski bereits 2013 begonnen und ist bis heute nicht final abgeschlossen, weil regelmäßig neue Urkunden von den Staatsarchiven online zugänglich gemacht werden. Für kleinere, in sich abgeschlossene Projekte, kann es hingegen sinnvoll sein, zuerst die Quelle vollständig zu transkribieren, bevor sie Online veröffentlicht wird.

Nach der Veröffentlichung des Projektes stehst du den Nutzern der Daten auch weiterhin als Ansprechpartner zur Verfügung, beantwortest Rückfragen zum Projekt oder zur Indexierung oder hilfst Benutzern bei der Recherche in den Daten. Sofern Korrekturen oder Ergänzungen in den Daten erforderlich werden, führst du diese im vereinbarten Datenformat durch, damit sie bei einer nächsten Gelegenheit als Update eingespielt werden können.

Wir führen regelmäßig Online-Zoom-Meetings in einer freundschaftlichen Stammtischrunde durch, um über neue Ideen oder Projekte zu sprechen. Natürlich bist du herzlich eingeladen an unseren virtuellen Treffen teilzunehmen und Teil unseres Teams zu werden. Vielleicht entwickelt sich ja bei einer solchen Gelegenheit der Wunsch ein weiteres Projekt mit uns gemeinsam durchzuführen!

Projekt geht Online