The Model is the Message
THKI Chat bietet Ihnen nicht ein Modell, sondern eine ganze Auswahl. Das ist kein Zufall, sondern eine Funktion. Wir zeigen Ihnen, warum sich der Blick über das voreingestellte Modell hinaus lohnt – und wie Sie damit zu besseren Ergebnissen kommen.

Warum im THKI Chat mehrere KI-Modelle zur Auswahl stehen – und wie Sie das gezielt nutzen.
Warum mehrere Modelle?
Marshall McLuhan prägte 1964 den Satz „The medium is the message“: Nicht nur der Inhalt zählt, sondern das Medium, das ihn transportiert. Die Forscher Benjamin Bratton und Blaise Agüera y Arcas haben den Gedanken auf KI übertragen – „The Model is the Message“ (Noema, 2022). Pragmatisch übersetzt: Ein Sprachmodell ist kein neutraler Kanal. Trainingsdaten, Architektur und Optimierung fallen je Modell anders aus – und damit auch die Ergebnisse. Dieselbe Frage an zwei Modelle führt zu zwei unterschiedlichen Antworten. Das gewählte Modell ist also Teil der Botschaft.
„Alle Modelle sind falsch, aber manche sind nützlich.“ — George Box
Box meinte ursprünglich statistische Modelle, aber der Satz passt: Kein Modell bildet die Welt vollständig korrekt ab. Welches Modell nützlich ist, hängt von der Aufgabe ab – und genau deshalb lohnt sich die Auswahl.
Modelle unterscheiden sich unter anderem in:
- Tempo und Tiefe – ein kleines Modell antwortet in Sekunden; ein Reasoning-Modell rechnet mit mehr Zwischenschritten und liefert dafür belastbarere Ergebnisse.
- Fähigkeiten – etwa Programmieren, das Verarbeiten von Bildern und Dokumenten oder mehrsprachiges Schreiben.
- Herkunft und Souveränität – kommerziell und extern gehostet oder offen auf deutscher bzw. NRW-Infrastruktur.
- Kosten – kommerzielle Modelle kosten pro Anfrage, offene Modelle laufen unbegrenzt.
Was Sie davon haben
Das passende Werkzeug je Aufgabe wählen, statt alles durch dasselbe Modell zu schicken.
- Gegenproben machen: Stellen Sie dieselbe Frage an mehrere Modelle. Wo die Antworten auseinanderlaufen, lohnt sich ein zweiter Blick – so erkennen Sie Halluzinationen und einseitige Darstellungen.
- Bewusst wählen: Braucht die Aufgabe wirklich ein kommerzielles Modell – oder sind die Daten auf einem souverän gehosteten Modell besser aufgehoben?
- Das Antwortverhalten kennenlernen: Mit etwas Übung erkennen Sie, wie ein Modell auf bestimmte Prompts reagiert, und formulieren gezielter.
Wo Ihre Daten verarbeitet werden – die Icons im Modellmenü
Jedes Modell im Auswahlmenü trägt ein Symbol, das zeigt, wo Ihre Anfragen verarbeitet werden:
- Deutschland-Flagge – die offenen Modelle. Sie werden auf Servern in Deutschland betrieben: bei der GWDG in Göttingen oder über OSKI.nrw auf NRW-Infrastruktur in Aachen und Köln. Ihre Daten verlassen Deutschland nicht.
- EU-Symbol – ChatGPT 5.5. Die Verarbeitung erfolgt über die GWDG-Azure-Anbindung auf europäischen Servern.
- Globus-Symbol – ChatGPT 5.4-mini. Die Verarbeitung erfolgt über die GWDG-Azure-Anbindung auf globalen Servern.
Unabhängig vom Modell laufen alle Anfragen gebündelt über die zentrale Schnittstelle von KI:connect und werden der TH Köln zugeschrieben, nicht einzelnen Personen. Geben Sie dennoch keine personenbezogenen oder sensiblen Daten ein.
Der Modellkatalog im THKI Chat – nach Quellen
Im THKI Chat bündeln wir Modelle aus drei Infrastrukturen. Die Quelle ist nicht nur ein technisches Detail: Sie bestimmt, wohin Ihre Daten fließen, wie souverän das Modell betrieben wird und ob Kosten entstehen.
GWDG – proprietär (OpenAI über Azure)
Die kommerziellen OpenAI-Modelle, von der GWDG über Microsoft Azure vermittelt. Sie gehören zu den leistungsfähigsten überhaupt, werden aber extern betrieben und unterliegen Nutzungs-Limits, weil sie pro Anfrage kosten.
- ChatGPT 5.5 – OpenAIs High-End-Modell für die anspruchsvollsten Aufgaben: komplexe Facharbeit, Coding, werkzeugintensive Agenten und Workflows, bei denen Ausführungsqualität zählt. Kontextfenster rund 256k Token. Verarbeitung auf EU-Servern.
- ChatGPT 5.4-mini – die schnelle, kostengünstige Variante für Routine-Anfragen; rund 400k Kontext. Verarbeitung auf globalen Servern.
GWDG – Open Source (über KISSKI)
Offene Modelle, von der GWDG über ihr KI-Servicezentrum KISSKI in Deutschland betrieben. Offene Gewichte, unbegrenzte Nutzung, keine Kosten pro Anfrage.
- GLM-4.7 (Z.ai) – coding-fokussiert: stark bei mehrsprachigem, agentischem Programmieren, Terminal-Aufgaben, Tool-Nutzung und Reasoning (rund 200k Kontext).
- InternVL 3.5 30B (OpenGVLab) – leichtgewichtiges, schnelles multimodales Modell; besonders stark bei Bild- und Dokumentverständnis, Texterkennung (OCR) sowie Mehrbild- und Videoanalyse (rund 41k Kontext).
- Apertus 70B (Swiss AI) – vollständig offenes Modell aus der Schweiz, das über 1.800 Sprachen abdeckt und ausschließlich auf rechtlich sauberen, offenen Trainingsdaten beruht – maximale Transparenz und Souveränität (rund 65k Kontext).
- Qwen 3.5 397B (Alibaba Cloud) – ein MoE-Modell (397 Mrd. Parameter, davon 17 Mrd. aktiv) und eines der leistungsstärksten offenen Modelle überhaupt: herausragend bei Reasoning, Code und Mathematik, mit Bildverständnis und rund 262k Kontext.
- Qwen 3 Omni 30B (Alibaba Cloud) – omni-modal: verarbeitet Text, Bild, Audio und Video, inklusive Spracherkennung und Sprachdialog in vielen Sprachen. Für multimodale und sprachbasierte Szenarien (rund 65k Kontext).
- DeepSeek R1 Distill 70B (DeepSeek) – ein reasoning-orientiertes 70B-Modell (aus DeepSeek-R1 destilliert, Basis Llama 3.3) mit guter Allround-Leistung; rund 131k Kontext. Hinweis: Bei politisch sensiblen Themen kann es verzerrte oder zensierte Antworten liefern – Antworten immer gegenprüfen.
OSKI.nrw (über Inferenz NRW)
Die landeseigene, souveräne Inferenz von OSKI.nrw (Open Source-KI.nrw), betrieben auf NRW-Infrastruktur in Aachen und Köln (u. a. Hochleistungsrechner RAMSES, UzK). Unbegrenzt nutzbar, die Daten bleiben in NRW.
- GPT OSS 120B (OpenAI, offen) – OpenAIs offenes Modell, auf schnelle Inferenz optimiert: starke Allround- und Reasoning-Leistung (laut OpenAI nahe an o4-mini) und gut bei Tool-Nutzung; rund 131k Kontext. Der unbegrenzte Standard für den Alltag.
- Mistral Small 4 119B (Mistral AI) – leistungsfähiges europäisches Modell mit großem Kontextfenster (rund 262k) und starker mehrsprachiger Allround-Leistung, inklusive Bilderkennung.
Modelle zum Einbetten (Embeddings)
Bereit stehen Qwen3 Embedding 8B und E5 Mistral 7B Instruct, beide über OSKI.nrw auf NRW-Infrastruktur (Aachen bzw. Köln). Der Vorteil: Sie können eigene Such- und RAG-Anwendungen auf Ihren eigenen Daten aufbauen – ohne dass ein zentrales RAG betrieben werden muss und ohne dass Ihre Dokumente das souveräne Umfeld verlassen.
Drei Modelle, drei Aufgaben – einfach ausprobiert
Am schnellsten erschließen sich die Unterschiede, wenn Sie dieselbe Art Aufgabe an sehr verschiedene Modelle geben. Drei Beispiele zum Loslegen:
ChatGPT 5.5 – für anspruchsvolle Analyse
„Ich habe drei widersprüchliche Anforderungen an ein Projekt. Strukturiere die Zielkonflikte und entwickle zwei Lösungswege mit ihren Vor- und Nachteilen.“
GLM-4.7 – für Code
„Schreib mir ein kleines Python-Skript, das eine CSV-Datei einliest und die Zeilen nach Datum sortiert – und erkläre Schritt für Schritt, was es tut.“
InternVL 3.5 – für Bilder und Dokumente
(Bild oder Scan hochladen) „Lies diesen eingescannten Handzettel aus und fasse die wichtigsten Punkte in Stichworten zusammen.“
Stellen Sie ruhig allen drei Modellen einmal dieselbe Frage aus Ihrem Fachgebiet. Die Unterschiede in Tempo, Tiefe und Zuverlässigkeit werden schnell sichtbar.
Probieren Sie es aus!
Das Modell wechseln Sie oben links im Modell-Dropdown; über „Erfahre mehr“ gelangen Sie zur vollständigen Modellübersicht. Probieren, vergleichen, ein Gefühl entwickeln – denn am Ende gilt: The Model is the Message.
→ Zum THKI Chat
Haben Sie noch Fragen?
Dann wenden Sie sich direkt an digitalelehre@th-koeln.de!



