
Im Rahmen des Projekts haben wir mit den Werkzeugen Koyha, Stable Diffusion sowie verschiedenen LoRA-Modellen gearbeitet – insbesondere Jaggurnaut, FLUX und dem Booru Datasetmanager. Ziel war es, Bildmaterial von Angehörigen der indigenen Völker der Himba und San aus Namibia mithilfe von Text- und Bild-Prompting zu generieren, wobei der Fokus auf der realitätsnahen Darstellung von Kleidung, Umgebung, Gegenständen und Behausungen lag.
Wir haben eigene Datensätze erstellt und diese genutzt, um Modelle zu trainieren, die gezielt Bildlücken schließen können, welche bei generischen KI-Outputs oft auftreten. Der Projektverlauf beinhaltete:
das Testen verschiedener Bildgeneratoren,
das Erlernen technischer Grundlagen (neuronale Netze, Fuzzy-Systeme, Stable Diffusion),
das gezielte Training eigener Modelle mit spezifischem Bildmaterial,
sowie die iterative Verbesserung der generierten Ergebnisse.
Am Ende entstand ein spezialisiertes Modell, das realitätsnahe Darstellungen indigener Kulturen liefert und potenziell auch für andere Kontexte anwendbar ist. Das Projekt förderte sowohl technisches als auch kreatives Verständnis für KI-gestützte Bildgenerierung und ermöglichte es uns, Lücken in bestehenden Systemen zu erkennen und aktiv zu adressieren.

Das war der Anfang.











