Die Veröffentlichung von Forschungsaktivitäten und -ergebnissen sowie die verschiedenen Beteiligten stellen den Datenaustausch, die Exploration und die Visualisierung vor große Herausforderungen. Für die vom Bundesministerium für Bildung und Forschung (BMBF) geförderte National Academics Panel Study (Nacaps) hat das Deutsche Zentrum für Hochschul- und Wissenschaftsforschung (DZHW) ein offenes Datenportal entwickelt. Mit interaktiven Grafiken zu Themen wie Promotionsbedingungen, Karriereabsichten, Mobilität oder Finanzierung bietet das Portal einen Überblick zur Lebens- und Arbeitsrealität Promovierender in Deutschland. Befragungsdaten werden im Datenportal so aufbereitet, dass sie niedrigschwellig verwendbar sind. Da die Daten in offenen und wiederverwendbaren Formaten ohne Einschränkung unentgeltlich zur Verfügung gestellt werden, können sie gleichermaßen von der Forschung und der Öffentlichkeit genutzt werden. Zugleich bietet das Portal kooperierenden Partnerhochschulen in einem geschützten Raum eine hochschulspezifische Berichterstattung über die Daten von Promovierenden ihrer Einrichtung. Erörtert werden die mögliche Weiterentwicklung und effektiven Nutzung des Nacaps-Datenportals für das Management von offenen Befragungsdaten. Dabei werden besonders die Qualität offener Befragungsdaten sowie das Potenzial und die Besonderheiten des Nacaps-Datenportals bei der Visualisierung von Befragungsdaten diskutiert.
The publication of research activities and results as well as the various participants pose major challenges for data exchange, exploration and visualization. The German Centre for Higher Education Research and Science Studies (DZHW) has developed an open data portal for the National Academics Panel Study (Nacaps), funded by the Federal Ministry of Education and Research (BMBF). With interactive graphics on topics such as doctoral conditions, career intentions, mobility and financing, the portal offers an overview of the life and work reality of doctoral students in Germany. Survey data is prepared in the data portal so that it can be used at a low threshold. Since the data is made available free of charge in open and reusable formats without restrictions, it can be used by researchers and the public alike. At the same time, the portal offers cooperating partner universities university-specific reporting on the data of doctoral students at their institution in a protected space. The possible further development and effective use of the Nacaps data portal for the management of open survey data will be discussed. In particular, the quality of open survey data as well as the potential and special features of the Nacaps data portal when visualizing survey data are discussed.
Résumé: La publication des activités et des résultats de recherche ainsi que des différents participants posent des défis majeurs en matière d'échange, d'exploration et de visualisation des données. Le Centre allemand de recherche universitaire et scientifique (DZHW) a développé un portail de données ouvertes pour l'étude nationale du panel universitaire (Nacaps), financée par le ministère fédéral de l'Éducation et de la Recherche (BMBF). Avec des graphiques interactifs sur des sujets tels que les conditions de doctorat, les intentions de carrière, la mobilité et le financement, le portail offre un aperçu de la réalité de la vie et du travail des doctorants en Allemagne. Les données d'enquête sont préparées dans le portail de données afin de pouvoir être utilisées à un seuil bas. Étant donné que les données sont mises à disposition gratuitement dans des formats ouverts et réutilisables sans restriction, elles peuvent être utilisées aussi bien par les chercheurs que par le public. Parallèlement, le portail propose aux universités partenaires coopérantes des rapports spécifiques à l'université sur les données des doctorants de leur établissement dans un espace protégé. L'éventuel développement ultérieur et l'utilisation efficace du portail de données Nacaps pour la gestion des données d'enquête ouvertes seront discutés. En particulier, la qualité des données d'enquête ouvertes ainsi que les fonctionnalités potentielles et particulières du portail de données Nacaps lors de la visualisation des données d'enquête sont discutées.
Keywords: Projekt; Nacaps; Datendokumentation; Open Access; Datenportal; Datenqualität; Visualisierung; Nutzung; Benutzerfreundlichkeit; Project; Data documentation; Open access; Data portal; Data quality; Visualization; Usage; Usability; Projet; Documentation des données; Libre accès; Portail de données; Qualité des données; Visualisation; Utilisation; Convivialité
Die Akkumulation und Analyse von Befragungsdaten ist ressourcenintensiv. Die meisten aktuellen Ansätze sind manuell, erfordern Zeit, Kosten und sind anfällig für menschliche Fehler. Interaktive digitale Technologien haben das Potenzial, Zeit, Kosten und Fehler in diesen Prozessen zu reduzieren, was wiederum zur Lösung einer zentralen gesellschaftlichen Herausforderung beitragen kann ([
Dem Management an Hochschulen und Forschungseinrichtungen kann eine interaktive und digitale Berichterstattung helfen, interne und externe Stakeholder über den vergangenen, aktuellen und zukünftigen Stand ihrer Zielvorhaben in Forschung und Lehrer zu informieren. Mithilfe von Dashboards lassen sich auch für große und komplexe Datengrundlagen Trends, Zusammenhänge und Unregelmäßigkeiten effizient und effektiv aufzeigen. Dazu wird das Reporting in verschiedenen Bereichen zunehmend institutionalisiert. Die Verwendung traditioneller Visualisierungen (z. B. Torten-, Säulen- oder Balkendiagramme) ist bereits gängige Praxis, wobei verschiedene Gestaltungsansätze diskutiert werden, die Datenexploration und datenbasierte Steuerung unterstützen sollen ([
Die Suche nach Daten erfolgt entlang der Bedürfnisse der Suchenden. Zentrale Kriterien sind inhaltliche Kategorien und Zeiträume sowie Qualität der Daten. Die Organisationen, die Datenportale bereitstellen, sind gefordert, die Daten so anzubieten, dass sie den Anfragenden helfen, ihre Ziele zu erreichen ([
Herausforderungen und Potenziale einer nutzerorientieren Bereitstellung von Forschungsdaten werden in diesem Beitrag am Beispiel des im Nacaps-Projekt integrierten Datenportals (https://nacaps-datenportal.de/) aufgezeigt. Es folgt ein Überblick über das zum Reporting offener Befragungsdaten von Promovierenden und Promovierten entwickelte Portal. Anschließend wird das breite Portfolio von Möglichkeiten für eine effektive Datennutzung aufgezeigt und diskutiert. Abschließend werden die Perspektive der DQ sowie mögliche Qualitätsframeworks zur Beurteilung von offenen Daten betrachtet.
Die Bereitstellung von Ergebnissen aus den Befragungen von Promovierenden und Promovierten im Rahmen der Nacaps-Studie über ein Datenportal für Öffentlichkeit und kooperierende Hochschulen ist ein zentrales Projektziel. Das Nacaps-Datenportal ist eine Web-Anwendung, mit der die die über große Online-Surveys generierten Datensätze erfasst und in Form von benutzerfreundlichen Dashboards veröffentlicht werden. Die konzeptionelle Einbettung der Dashboards beruht auf einem theoretisch fundierten Indikationenmodell ([
Die aus der Nacaps-Befragung gewonnenen Daten werden verschiedenen Kategorien zugeordnet, die typischerweise relevante Aspekte der untersuchten Themen abdecken. Diese Kategorien könnten je nach Zielsetzung der Umfrage und den spezifischen Fragestellungen variieren. Mögliche Kategorien sind z. B. Demografische Informationen (z. B. Alter, Geschlecht, Einkommen); Bildungshintergrund; Berufsbezeichnung, Branche, Beschäftigungsstatus; Art der Institution, Position innerhalb der Institution; Meinungen und Einstellungen. In vielen Fällen wird der Kategorienkatalog im Voraus festgelegt, um eine konsistente Datenstruktur und -analyse zu gewährleisten. Die Anzahl der Kategorien kann variieren und hängt von der Komplexität der Umfrage und der Vielfalt der untersuchten Themen ab. In der Regel umfasst der Kategorienkatalog jedoch eine überschaubare Anzahl von Kategorien, um die Daten effizient organisieren und analysieren zu können.
Das Datenportal basiert aktuell auf zwei großen Untersuchungen, den Erstbefragungen von Promotionskohorten. Perspektivisch wird alle zwei Jahre ein Datensatz einer weiteren Erstbefragung sowie Befragungen von Promovierten ergänzt. Das Nacaps-Datenportal ist einerseits eine Informationsquelle für die Partnerhochschulen, die den Feldzugang für die Surveys ermöglichen und im Gegenzug hochschulspezifische Daten erhalten. In einem öffentlich zugänglichen Bereich können breite Gruppen, wie forschungsunterstützende Einrichtungen, Ministerien, Medien, Unternehmen oder andere interessierte Personenkreise auf die Ergebnisse zugreifen.
Das Nacaps-Datenportal hat eine eigene URL, ist aber auch in den Webauftritt des Nacaps-Projekts und des DZHW integriert. Mit dem Portal hat das Nacaps-Projekt einen zentralen Einstiegspunkt in das breite Spektrum seiner Befragungsdaten aus den Bereichen Promotionsbedingungen, Karriereabsichten und Karriereverläufen sowie die allgemeinen Lebensbedingungen Promovierender und Promovierter geschaffen. Das Datenportal bündelt Umfrage-Daten, die gemeinsam mit über 65 promotionsberechtigten Hochschulen erhoben worden sind. Ziel des Portals ist es, die Daten möglichst übersichtlich aufzubereiten, aber hinreichend komplex, um eine adäquate vertiefende Auswertbarkeit zu gewährleisten. Die Darstellung von Befragungsdaten im Partnerbereich des Portals unterstützt die kooperierenden Hochschulen bei einem Monitoring ihrer Qualifizierungsbedingungen.
Wer nutzt das Nacaps-Datenportal zu welchem Zweck? Die Zugriffszahlen auf das Datenportal belaufen sich Anfang 2024 auf etwa 2.000 Besuche pro Monat bzw. auf rund 500 Besuche pro Woche. Hinweise über die Nutzerinnen und Nutzer des öffentlichen Bereichs liefern Zitate: In journalistischen Beiträgen oder Publikationen über das deutsche Wissenschaftssystem, aber auch in wissenschaftlichen Studien zu verwandten Themen werden Ergebnisse aus dem Portal regelmäßig aufgegriffen (z. B. Alt, (2021), Wiarda (2022) – https://
Der Austausch mit den Partnerhochschulen und Anfragen an das DZHW als Betreiberin des Portals deuten darauf hin, dass das Portal insbesondere für die interne und externe Berichterstattung eingesetzt wird, auch in Kombination mit weiteren administrativen Daten oder Daten aus der Hochschulstatistik. Das Nacaps-Datenportal muss einigen Herausforderungen der Nutzenden begegnen:
Komplexität der Daten: Befragungsdaten können oft komplex sein, und Nutzende könnten Schwierigkeiten haben, sie zu interpretieren und zu verstehen, insbesondere wenn sie nicht über Vorkenntnisse in der Datenanalyse verfügen.
Datenqualität: Die Qualität der bereitgestellten Daten könnte variieren, und Nutzende müssen sicherstellen, dass die Daten zuverlässig und aktuell sind, um fundierte Entscheidungen treffen zu können.
Benutzerfreundlichkeit: Das Portal sollte benutzerfreundlich gestaltet sein, damit Nutzende schnell und einfach auf die gewünschten Daten zugreifen können. Eine unzureichende Benutzerführung oder ein kompliziertes Layout können die Nutzung des Portals erschweren.
Datenschutz und Sicherheit: Da Befragungsdaten oft sensible Informationen enthalten, ist es wichtig, dass das Nacaps-Datenportal Maßnahmen zum Schutz der Privatsphäre und Sicherheit der Nutzerdaten implementiert.
Aktualität der Daten: Nutzende benötigen möglicherweise Zugriff auf aktuelle Daten, um zeitnahe Entscheidungen treffen zu können. Das Portal muss sicherstellen, dass die bereitgestellten Daten regelmäßig aktualisiert werden.
Schulung und Unterstützung: Für Personen, die weniger erfahren im Umgang mit Befragungsdaten oder dem Portal selbst sind, kann eine Schulung oder Unterstützung erforderlich sein, um das volle Potenzial des Portals nutzen zu können.
Beim Reporting geht es darum, Daten in nützliche Informationen umzuwandeln, die verwendet werden können, um geschäftliche Einsichten zu gewinnen und fundierte Entscheidungen zu treffen. Die täglich generierten Datenmengen und die damit verbundene Menge an verfügbaren Informationen sind in den vergangenen Jahren geradezu explosionsartig gestiegen ([
Hinter der Datenvisualisierung steht eine Folge von Schritten. Im ersten Schritt werden Daten aus verschiedenen Quellen importiert und in einem geeigneten Format gespeichert. Im zweiten Schritt werden die Daten mittels verschiedener Operationen vorverarbeitet. Hierunter fallen z. B. die Entfernung unnötiger Elemente, das konsistente Indexieren nach einem einheitlichen Schema, Entscheidungen über notwendige Harmonisierungen, die Aggregation von Intervallen. Im dritten Schritt werden die Daten als Input für ein Datenvisualisierungstool bereitgestellt, um im vierten Schritt, abhängig von der Wahl der Visualisierung in der Nutzungssituation, über dieses Tool in einem vorab konzipierten Format bereitgestellt zu werden.
Die Schritte im Datenvisualisierungsprozess sind in Abbildung 1 zu sehen.
Tools zur Datenvisualisierung helfen, aus großen Datenmengen aussagekräftige und nützliche Informationen zu extrahieren ([
Graph: Abbildung 1: Schritte im Prozess der Datenvisualisierung.
Datenvisualisierungstools wie Tableau bieten somit Lösungen für die Herausforderung, große Datenmengen mit begrenzten personellen und finanziellen Ressourcen effizient zu untersuchen und sinnvoll verarbeiten zu können ([
Das Konzept von Open Data ist, dass von Organisationen erhobene Daten öffentlich zugänglich gemacht werden, unabhängig für wen und welche Nutzungszwecke. Die unentgeltlichen und öffentlichen Daten können unter anderem dazu verwendet werden, neue Geschäftsvorhaben zu gründen oder schwierige strategische Herausforderungen zu lösen. Open Data gewinnt sowohl im öffentlichen als auch im privaten Sektor an Bedeutung, was zum Teil auf den Druck zur Erhöhung der Transparenz des öffentlichen Sektors und zum Teil auf das aktuell große öffentliche Interesse an Big Data und Datenanalyse zurückzuführen ist ([
Demgegenüber verweisen zahlreiche Studien auf weit verbreitet Probleme im Zusammenhang mit schlechter DQ, was die effiziente Wiederverwendung offener Daten möglicherweise behindern kann.
Datenqualitätsprobleme in Bezug auf die Genauigkeit, Aggregation und Präzision offener Daten wurden von [
Der Erfolg eines Datenportal-Projekts ist von verschiedenen organisatorischen, technologischen und analytischen Aspekten abhängig. So ist es von großer Bedeutung, Qualitätsframeworks einzuführen, um die Qualität offener Daten messen zu können ([
Ein anderer wichtige Aspekt ist die Zugänglichkeit und Verfügbarkeit von Daten. Unter der Zugänglichkeit werden das Herunterladen und Verwenden relevanter Datensätze erfasst, unter der Verfügbarkeit, wie einfach diese zu finden sind ([
Datenportale haben sich im Verlauf des letzten Jahrzehnts als wichtige Informationsquellen und Zugangspunkte zu Informationen etabliert ([
Bei offenen Daten unterscheiden sich die Prozesse der Datenerhebung, -bereinigung, -verwaltung und -visualisierung in Datenportalen erheblich ([
- Die Bewertung der Qualität von offenen Daten sollte möglichst früh im Datenlebenszyklus erfolgen, idealerweise bereits während der Datensammlungsphase. Auf diese Weise können zusätzliche Kriterien in die gesammelten Daten integriert werden.
- Die Datenspeicherung sollte standardisierten Protokollen folgen, die eine einfache, schnelle Speicherung, Wiederherstellung und Abfrage ermöglichen.
- Es müssen spezialisierte Qualitätsmetriken definiert werden, die der komplexen Natur offener Daten gerecht werden.
- Datenqualitätskontrolle, kontinuierliche Qualitätsverbesserung und Compliance-Frameworks müssen entwickelt werden.
- Es müssen neue flexible Messmethoden entwickelt werden, die speziell für unstrukturierte Daten geeignet sind und keinen Abgleich mit umfangreichen detaillierten Datenschemata erfordern.
- Effektive Compliance mit effektiver Berichterstellung und Überprüfung sind erforderlich, um Evaluierungsaktivitäten zu fördern.
- Eine bessere Berichterstattung und Überwachung der DQ sollte durch den Aufbau automatisierter Echtzeit-Dashboards erreicht werden.
- Die Qualitätsbewertung eines repräsentativen Datensatzes muss durchgeführt werden, um ein Qualitätsmodell zu erstellen, dass auf die gesamten Daten angewendet werden kann. Dies wird einen Einblick in die DQ geben und Erkenntnisse liefern, die fair auf verschiedene Datentypen angewendet werden können.
- Der Datenschutz muss berücksichtigt werden. Eines der größten Probleme von Open Data ist, wie Menschen damit umgehen können, ihre Daten mit Institutionen und Unternehmen zu teilen. Folglich besteht eine der Herausforderungen bei der Entwicklung von Datenanwendungen, Menschen davon zu überzeugen, ihre Daten zu teilen.
Das Nacaps-Datenportal stellt einen bedeutenden Schritt in der Bereitstellung und Nutzung von Befragungsdaten durch interaktive digitale Reportings dar. Die Diskussion über die Potenziale, Besonderheiten und Datenqualität dieses Portals wirft eine Vielzahl von wichtigen Fragen auf und bietet Raum für Reflexion und Analyse. Ein wesentliches Potenzial des Nacaps-Datenportals liegt zweifellos in seiner Fähigkeit, komplexe Befragungsdaten in interaktiven digitalen Reportings zugänglich zu machen. Durch die Visualisierung und Aufbereitung der Daten können verschiedene Interessengruppen, von Forschern über Entscheidungsträger bis hin zur breiten Öffentlichkeit, ein tieferes Verständnis für komplexe soziale Phänomene und Trends entwickeln. Diese Zugänglichkeit fördert die Transparenz und ermöglicht eine evidenzbasierte Entscheidungsfindung auf verschiedenen Ebenen.
Die Besonderheiten des Nacaps-Datenportals sind ebenfalls von Bedeutung. Durch die Strukturierung der Daten in nachvollziehbaren Kategorien und die zusätzliche Verschlagwortung sowie die Integration einer Suchfunktion werden die Benutzerfreundlichkeit deutlich verbessert und die Navigation durch die Daten erleichtert. Dies ermöglicht es den Nutzenden, relevante Informationen schnell zu finden, indem sie Suchbegriffe eingeben und nach bestimmten Kategorien filtern können, was wiederum die Effizienz bei der Datennutzung steigert und eine zielgerichtete Arbeit ermöglicht. Zusätzlich bietet das Portal Möglchkeiten für Interaktion und Feedback, indem es Ideen und Rückmeldungen von Institutionen und einzelnen Personen aus der Wissenschaft einbezieht. Diese kontinuierliche Rückmeldung fördert die Weiterentwicklung und Verbesserung des Portals.
Ein zentraler Aspekt, der beim Nacaps-Datenportal hervorgehoben werden muss, ist die Datenqualität. Die Bereitstellung qualitativ hochwertiger Informationen ist entscheidend, um die Glaubwürdigkeit und Verwendbarkeit der Daten sicherzustellen. Fehler bei der Datenerhebung, -verarbeitung oder -interpretation können nicht nur die Wiederverwendung der Daten beeinträchtigen, sondern auch das Vertrauen der Zielgruppe in das Portal untergraben. Daher ist eine kontinuierliche Überprüfung und Sicherung der Datenqualität unerlässlich, um die Integrität des Portals zu gewährleisten.
Das Nacaps-Datenportal dient als Verbindung zwischen Forschungsdaten und deren Nachnutzung. Idealerweise sollte jedes Portal ein konsistentes Design aufweisen, eine Suchfunktion auf der Startseite bieten und Informationen über die beteiligten Organisationen liefern. Der Inhalt des Portals sollte klar und strukturiert präsentiert werden, damit die Benutzer ihn leicht finden können. Dies wird durch die Verwendung von übersichtlichen Kategorien und Tags erreicht. Kategorien helfen dabei, den Inhalt in größere thematische Bereiche zu organisieren, während Tags zusätzliche Informationen über den Inhalt liefern und es den Benutzern ermöglichen, gezielt nach spezifischen Themen zu suchen. Neben der Bereitstellung von Daten für spezifische Interessengruppen sollte das Portal auch darauf abzielen, Ideen und Rückmeldungen von Institutionen und ihren wissenschaftlich Beschäftigten zu integrieren. Fehler bei der Bereitstellung qualitativ hochwertiger Informationen können nicht nur die Wiederverwendung der Daten, sondern auch die Nutzung der institutionellen Portale beeinträchtigen. Eine effiziente Entwicklung dieser Portale erfordert deshalb eine systematische Bewertung ihrer Qualität, um ihren Nutzen besser zu verstehen und zu bewerten. Die Aufbereitung von schlecht dokumentierten Datensätzen sowie damit verbundene Bereinigungsaktivitäten machen einen erheblichen Teil des Aufwands aus, der für die Wiederverwendung offener Daten erforderlich ist. Dies stellt eine Ressourcenverschwendung dar. Die Qualitätsbewertung von Open-Data-Portalen ist jedoch nicht nur wichtig, um den Wert der Portale zu verstehen, sondern auch um weitere Verbesserungen voranzutreiben. Neue Datenbanktechnologien und vielversprechende webbasierte Visualisierungsansätze können dazu beitragen, die Kosten für die Bereitstellung und Visualisierung offener Daten zu senken und die Integration in qualitätsorientierte Open-Data-Angebote zu ermöglichen.
Das Nacaps-Datenportal hat sich als wichtige Plattform für die Bereitstellung und Nutzung von Befragungsdaten durch interaktive digitale Reportings etabliert. Die Zukunft dieses Portals bietet vielversprechende Potenziale und Herausforderungen. Es ist entscheidend, die Interaktivität und Benutzerfreundlichkeit kontinuierlich zu verbessern, indem neue Technologien integriert und die Nutzerbedürfnisse berücksichtigt werden. Die kontinuierliche Sicherung und Verbesserung der Datenqualität ist ebenfalls von großer Bedeutung. Zukünftige Entwicklungen im Bereich der Open Data bieten zusätzliche Chancen, indem neue Technologien und innovative Ansätze zur Datenanalyse und -visualisierung das Verständnis für komplexe soziale Phänomene vertiefen und datenbasierte Entscheidungsprozesse verbessern können.
By Otmane Azeroual
Reported by Author
Dr. Otmane Azeroual studierte Wirtschaftsinformatik an der Hochschule für Technik und Wirtschaft (HTW) und wurde in Ingenieurinformatik am Institut für Technische und Betriebliche Informationssysteme (ITI), Arbeitsgruppe Datenbanken & Software Engineering der Otto-von-Guericke Universität Magdeburg promoviert. Seit 2016 arbeitet er als wissenschaftlicher Mitarbeiter und Projektleiter am Deutschen Zentrum für Hochschul- und Wissenschaftsforschung (DZHW).