Zum Hauptinhalt springen

Das Nacaps-Datenportal – Potenziale, Besonderheiten und Datenqualität in interaktiven digitalen Reportings.

Azeroual, Otmane
In: Information -- Wissenschaft und Praxis, Jg. 75 (2024-05-01), Heft 2/3, S. 103-110
Online academicJournal

Das Nacaps-Datenportal – Potenziale, Besonderheiten und Datenqualität in interaktiven digitalen Reportings  Nacaps data portal – potential, special features and data quality in interactive digital reporting  Le portail de données Nacaps – potentiel, particularités et qualité des données dans le reporting numérique interactif 

Die Veröffentlichung von Forschungsaktivitäten und -ergebnissen sowie die verschiedenen Beteiligten stellen den Datenaustausch, die Exploration und die Visualisierung vor große Herausforderungen. Für die vom Bundesministerium für Bildung und Forschung (BMBF) geförderte National Academics Panel Study (Nacaps) hat das Deutsche Zentrum für Hochschul- und Wissenschaftsforschung (DZHW) ein offenes Datenportal entwickelt. Mit interaktiven Grafiken zu Themen wie Promotionsbedingungen, Karriereabsichten, Mobilität oder Finanzierung bietet das Portal einen Überblick zur Lebens- und Arbeitsrealität Promovierender in Deutschland. Befragungsdaten werden im Datenportal so aufbereitet, dass sie niedrigschwellig verwendbar sind. Da die Daten in offenen und wiederverwendbaren Formaten ohne Einschränkung unentgeltlich zur Verfügung gestellt werden, können sie gleichermaßen von der Forschung und der Öffentlichkeit genutzt werden. Zugleich bietet das Portal kooperierenden Partnerhochschulen in einem geschützten Raum eine hochschulspezifische Berichterstattung über die Daten von Promovierenden ihrer Einrichtung. Erörtert werden die mögliche Weiterentwicklung und effektiven Nutzung des Nacaps-Datenportals für das Management von offenen Befragungsdaten. Dabei werden besonders die Qualität offener Befragungsdaten sowie das Potenzial und die Besonderheiten des Nacaps-Datenportals bei der Visualisierung von Befragungsdaten diskutiert.

The publication of research activities and results as well as the various participants pose major challenges for data exchange, exploration and visualization. The German Centre for Higher Education Research and Science Studies (DZHW) has developed an open data portal for the National Academics Panel Study (Nacaps), funded by the Federal Ministry of Education and Research (BMBF). With interactive graphics on topics such as doctoral conditions, career intentions, mobility and financing, the portal offers an overview of the life and work reality of doctoral students in Germany. Survey data is prepared in the data portal so that it can be used at a low threshold. Since the data is made available free of charge in open and reusable formats without restrictions, it can be used by researchers and the public alike. At the same time, the portal offers cooperating partner universities university-specific reporting on the data of doctoral students at their institution in a protected space. The possible further development and effective use of the Nacaps data portal for the management of open survey data will be discussed. In particular, the quality of open survey data as well as the potential and special features of the Nacaps data portal when visualizing survey data are discussed.

Résumé: La publication des activités et des résultats de recherche ainsi que des différents participants posent des défis majeurs en matière d'échange, d'exploration et de visualisation des données. Le Centre allemand de recherche universitaire et scientifique (DZHW) a développé un portail de données ouvertes pour l'étude nationale du panel universitaire (Nacaps), financée par le ministère fédéral de l'Éducation et de la Recherche (BMBF). Avec des graphiques interactifs sur des sujets tels que les conditions de doctorat, les intentions de carrière, la mobilité et le financement, le portail offre un aperçu de la réalité de la vie et du travail des doctorants en Allemagne. Les données d'enquête sont préparées dans le portail de données afin de pouvoir être utilisées à un seuil bas. Étant donné que les données sont mises à disposition gratuitement dans des formats ouverts et réutilisables sans restriction, elles peuvent être utilisées aussi bien par les chercheurs que par le public. Parallèlement, le portail propose aux universités partenaires coopérantes des rapports spécifiques à l'université sur les données des doctorants de leur établissement dans un espace protégé. L'éventuel développement ultérieur et l'utilisation efficace du portail de données Nacaps pour la gestion des données d'enquête ouvertes seront discutés. En particulier, la qualité des données d'enquête ouvertes ainsi que les fonctionnalités potentielles et particulières du portail de données Nacaps lors de la visualisation des données d'enquête sont discutées.

Keywords: Projekt; Nacaps; Datendokumentation; Open Access; Datenportal; Datenqualität; Visualisierung; Nutzung; Benutzerfreundlichkeit; Project; Data documentation; Open access; Data portal; Data quality; Visualization; Usage; Usability; Projet; Documentation des données; Libre accès; Portail de données; Qualité des données; Visualisation; Utilisation; Convivialité

Einleitung

Die Akkumulation und Analyse von Befragungsdaten ist ressourcenintensiv. Die meisten aktuellen Ansätze sind manuell, erfordern Zeit, Kosten und sind anfällig für menschliche Fehler. Interaktive digitale Technologien haben das Potenzial, Zeit, Kosten und Fehler in diesen Prozessen zu reduzieren, was wiederum zur Lösung einer zentralen gesellschaftlichen Herausforderung beitragen kann ([15] et al., 2019). In den letzten Jahren haben immer mehr staatliche Stellen begonnen, ihre Daten zu veröffentlichen und Datenportale zu entwickeln ([23] & Lněnička, 2017). Die Notwendigkeit, im Rahmen wissenschaftlicher Arbeit Daten auszutauschen, hat ebenfalls zu einem starken Anstieg der Anzahl und Vielfalt von Forschungsdatenportalen geführt ([10] & Zhang, 2014). Die Entwicklung dieser Portale verändert die Art und Weise, wie Forschende nach Daten zu ihrem – Forschungsthema suchen oder auch Daten aus ihren Forschungsarbeiten zur Verfügung stellen. Die Offenlegung von administrativ generierten Daten dient zugleich dazu, Rechenschaft gegenüber der Öffentlichkeit und den Steuerzahlenden abzulegen. Implizit geht es vor allem darum, einen Wandel hin zu mehr Datenaustausch und Transparenz zu erreichen ([30], 2013; [31] & Wiseman & Krkeljas, 2021). Diese Entwicklungen könnten dazu beitragen, die Aufhebung von sogenannten „Datensilos" im öffentlichen Sektor zu fördern. Ansätze zur effektiven Nutzung offener Daten können breiten Zugang zu Ressourcen bieten, die daten- und informationsbasierte Entscheidungsprozesse unterstützen. Laut [22] & Cukier (2013) hat die Menge digitaler offener Daten aus verschiedenen Quellen in den letzten zehn Jahren enorm zugenommen. Datenbanken und Informationssysteme ermöglichen eine massenhafte Sammlung von Daten, die zur Identifizierung und Vorhersage von Problemen, aber auch zur Gewinnung eines besseren Gesamtverständnisses aktueller Geschäftsmodelle durch die Identifizierung wichtiger Einflussfaktoren verwendet werden können. In der Folge ist ein zunehmendes Interesse zu beobachten, fundierte und analytische Entscheidungsfindung auf der Basis großer strukturierter und unstrukturierter Datenmengen zu ermöglichen ([9] et al., 2012; [11] et al., 2023). Dieser Trend hat Entwicklungen zur interaktiven, digitalen Berichterstattung beeinflusst. Der Umgang mit Big Data ist keine neue Anforderung, weil Daten von jeher in der Regel aggregiert, strukturiert und für verschiedene Entscheidungszwecke aufbereitet werden müssen ([19] & Weidenmier Watson, 2017). Big Data wird jedoch zunehmend nicht nur als Umgang mit großen Datenmengen, sondern auch mit sehr heterogenen Daten und sehr schnellen Prozessen verstanden. Für umfassende Analysen und Reporting werden oft nicht nur interne Forschungsdaten verwendet (meist strukturierte Daten), sondern auch externe Quellen, wie Webseiten, Texte, Videos und andere Objekte/Quellen (meist semi-strukturierte und unstrukturierte Daten) (Janvrin & Weidenmier Watson, 2017; [21], 2022). In diesem Zusammenhang hat die Visualisierung von Forschungsdaten zunehmend Aufmerksamkeit erhalten. Mit einer unterstützenden Visualisierung sollen Verläufe, Verteilungen und Beziehungen verschiedener Kennzahlen und Werte übersichtlich dargestellt werden. Datenportale nutzen dafür in der Regel sogenannte Dashboards, auf denen die Kennzahlen aufbereitet dargestellt werden.

Dem Management an Hochschulen und Forschungseinrichtungen kann eine interaktive und digitale Berichterstattung helfen, interne und externe Stakeholder über den vergangenen, aktuellen und zukünftigen Stand ihrer Zielvorhaben in Forschung und Lehrer zu informieren. Mithilfe von Dashboards lassen sich auch für große und komplexe Datengrundlagen Trends, Zusammenhänge und Unregelmäßigkeiten effizient und effektiv aufzeigen. Dazu wird das Reporting in verschiedenen Bereichen zunehmend institutionalisiert. Die Verwendung traditioneller Visualisierungen (z. B. Torten-, Säulen- oder Balkendiagramme) ist bereits gängige Praxis, wobei verschiedene Gestaltungsansätze diskutiert werden, die Datenexploration und datenbasierte Steuerung unterstützen sollen ([3] & Barnes, 2017).

Die Suche nach Daten erfolgt entlang der Bedürfnisse der Suchenden. Zentrale Kriterien sind inhaltliche Kategorien und Zeiträume sowie Qualität der Daten. Die Organisationen, die Datenportale bereitstellen, sind gefordert, die Daten so anzubieten, dass sie den Anfragenden helfen, ihre Ziele zu erreichen ([4], 2021). Datenqualität (DQ) ist daher ein gemeinsames Interesse derjenigen, die Daten nutzen, und Portalanbietern. DQ wird aus der Perspektive der Nutzung oft als „Fitness for Purpose" definiert, also die Fähigkeit einer Datensammlung, die Anforderungen der Nutzenden zu erfüllen ([33] & Strong, 1996). Jüngst wurden vermehrt Forschungsprojekte zur Qualität von Datenportalen durchgeführt ([12] & de Souza & da Silva, 2019). Allerdings fehlt es noch an konkreten Vorschlägen für eine DQ in Datenportalen, die die Sichtweisen beim Datenkonsum berücksichtigen sowie Tools, die diese Vorschläge in die Praxis umsetzen. Offene Forschungsdaten müssen gut beschrieben und von guter Qualität sein. Eine geringe (Meta-)Datenqualität wirkt sich auf die Auffindbarkeit und den Gebrauch eines Datensatzes aus: Bei fehlenden Metadaten sind relevante Datensätze für Anfagende nicht oder nur schwer zu finden. Falsche Beschreibungen von Datensätzen sind wiederum problematisch für die Verarbeitung und Integration in andere Datensätze.

Herausforderungen und Potenziale einer nutzerorientieren Bereitstellung von Forschungsdaten werden in diesem Beitrag am Beispiel des im Nacaps-Projekt integrierten Datenportals (https://nacaps-datenportal.de/) aufgezeigt. Es folgt ein Überblick über das zum Reporting offener Befragungsdaten von Promovierenden und Promovierten entwickelte Portal. Anschließend wird das breite Portfolio von Möglichkeiten für eine effektive Datennutzung aufgezeigt und diskutiert. Abschließend werden die Perspektive der DQ sowie mögliche Qualitätsframeworks zur Beurteilung von offenen Daten betrachtet.

Das Nacaps-Datenportal

Die Bereitstellung von Ergebnissen aus den Befragungen von Promovierenden und Promovierten im Rahmen der Nacaps-Studie über ein Datenportal für Öffentlichkeit und kooperierende Hochschulen ist ein zentrales Projektziel. Das Nacaps-Datenportal ist eine Web-Anwendung, mit der die die über große Online-Surveys generierten Datensätze erfasst und in Form von benutzerfreundlichen Dashboards veröffentlicht werden. Die konzeptionelle Einbettung der Dashboards beruht auf einem theoretisch fundierten Indikationenmodell ([34], 2022). Die Dashboards zeigen den Benutzerinnen und Benutzern über eine Anwendungsprogrammierschnittstelle (Application Programming Interface, API) Ergebnisse in Form verschiedener Grafiktypen an. Die angezeigten Grafiken können den einzelnen Informationsbedürfnissen entsprechend anhand unterschiedlicher Merkmale (bspw. Geschlecht, Fächergruppen) gefiltert und in verschiedenen Formaten heruntergeladen werden. Die Datensätze sind mit Tags bzw. Schlagwörtern, die von den Benutzenden selbst stammen und zugewiesen werden, um die Daten nach ihren individuellen Bedürfnissen zu organisieren, in einem durchsuchbaren Katalog recherchierbar.

Die aus der Nacaps-Befragung gewonnenen Daten werden verschiedenen Kategorien zugeordnet, die typischerweise relevante Aspekte der untersuchten Themen abdecken. Diese Kategorien könnten je nach Zielsetzung der Umfrage und den spezifischen Fragestellungen variieren. Mögliche Kategorien sind z. B. Demografische Informationen (z. B. Alter, Geschlecht, Einkommen); Bildungshintergrund; Berufsbezeichnung, Branche, Beschäftigungsstatus; Art der Institution, Position innerhalb der Institution; Meinungen und Einstellungen. In vielen Fällen wird der Kategorienkatalog im Voraus festgelegt, um eine konsistente Datenstruktur und -analyse zu gewährleisten. Die Anzahl der Kategorien kann variieren und hängt von der Komplexität der Umfrage und der Vielfalt der untersuchten Themen ab. In der Regel umfasst der Kategorienkatalog jedoch eine überschaubare Anzahl von Kategorien, um die Daten effizient organisieren und analysieren zu können.

Das Datenportal basiert aktuell auf zwei großen Untersuchungen, den Erstbefragungen von Promotionskohorten. Perspektivisch wird alle zwei Jahre ein Datensatz einer weiteren Erstbefragung sowie Befragungen von Promovierten ergänzt. Das Nacaps-Datenportal ist einerseits eine Informationsquelle für die Partnerhochschulen, die den Feldzugang für die Surveys ermöglichen und im Gegenzug hochschulspezifische Daten erhalten. In einem öffentlich zugänglichen Bereich können breite Gruppen, wie forschungsunterstützende Einrichtungen, Ministerien, Medien, Unternehmen oder andere interessierte Personenkreise auf die Ergebnisse zugreifen.

Nutzung des Nacaps-Datenportals

Das Nacaps-Datenportal hat eine eigene URL, ist aber auch in den Webauftritt des Nacaps-Projekts und des DZHW integriert. Mit dem Portal hat das Nacaps-Projekt einen zentralen Einstiegspunkt in das breite Spektrum seiner Befragungsdaten aus den Bereichen Promotionsbedingungen, Karriereabsichten und Karriereverläufen sowie die allgemeinen Lebensbedingungen Promovierender und Promovierter geschaffen. Das Datenportal bündelt Umfrage-Daten, die gemeinsam mit über 65 promotionsberechtigten Hochschulen erhoben worden sind. Ziel des Portals ist es, die Daten möglichst übersichtlich aufzubereiten, aber hinreichend komplex, um eine adäquate vertiefende Auswertbarkeit zu gewährleisten. Die Darstellung von Befragungsdaten im Partnerbereich des Portals unterstützt die kooperierenden Hochschulen bei einem Monitoring ihrer Qualifizierungsbedingungen.

Wer nutzt das Nacaps-Datenportal zu welchem Zweck? Die Zugriffszahlen auf das Datenportal belaufen sich Anfang 2024 auf etwa 2.000 Besuche pro Monat bzw. auf rund 500 Besuche pro Woche. Hinweise über die Nutzerinnen und Nutzer des öffentlichen Bereichs liefern Zitate: In journalistischen Beiträgen oder Publikationen über das deutsche Wissenschaftssystem, aber auch in wissenschaftlichen Studien zu verwandten Themen werden Ergebnisse aus dem Portal regelmäßig aufgegriffen (z. B. Alt, (2021), Wiarda (2022) – https://www.jmwiarda.de/2022/05/30/wie-geht-es-den-doktoranden/ oder Max-Planck-Gesellschaft PhDnet Report 2019 – https://www.hdnet.mpg.de/145345/PhDnet%5fSurvey%5fReport%5f2019.pdf).

Der Austausch mit den Partnerhochschulen und Anfragen an das DZHW als Betreiberin des Portals deuten darauf hin, dass das Portal insbesondere für die interne und externe Berichterstattung eingesetzt wird, auch in Kombination mit weiteren administrativen Daten oder Daten aus der Hochschulstatistik. Das Nacaps-Datenportal muss einigen Herausforderungen der Nutzenden begegnen:

Komplexität der Daten: Befragungsdaten können oft komplex sein, und Nutzende könnten Schwierigkeiten haben, sie zu interpretieren und zu verstehen, insbesondere wenn sie nicht über Vorkenntnisse in der Datenanalyse verfügen.

Datenqualität: Die Qualität der bereitgestellten Daten könnte variieren, und Nutzende müssen sicherstellen, dass die Daten zuverlässig und aktuell sind, um fundierte Entscheidungen treffen zu können.

Benutzerfreundlichkeit: Das Portal sollte benutzerfreundlich gestaltet sein, damit Nutzende schnell und einfach auf die gewünschten Daten zugreifen können. Eine unzureichende Benutzerführung oder ein kompliziertes Layout können die Nutzung des Portals erschweren.

Datenschutz und Sicherheit: Da Befragungsdaten oft sensible Informationen enthalten, ist es wichtig, dass das Nacaps-Datenportal Maßnahmen zum Schutz der Privatsphäre und Sicherheit der Nutzerdaten implementiert.

Aktualität der Daten: Nutzende benötigen möglicherweise Zugriff auf aktuelle Daten, um zeitnahe Entscheidungen treffen zu können. Das Portal muss sicherstellen, dass die bereitgestellten Daten regelmäßig aktualisiert werden.

Schulung und Unterstützung: Für Personen, die weniger erfahren im Umgang mit Befragungsdaten oder dem Portal selbst sind, kann eine Schulung oder Unterstützung erforderlich sein, um das volle Potenzial des Portals nutzen zu können.

Interaktive Reportings

Beim Reporting geht es darum, Daten in nützliche Informationen umzuwandeln, die verwendet werden können, um geschäftliche Einsichten zu gewinnen und fundierte Entscheidungen zu treffen. Die täglich generierten Datenmengen und die damit verbundene Menge an verfügbaren Informationen sind in den vergangenen Jahren geradezu explosionsartig gestiegen ([6] & Chui & Manyika, 2011). Daten sind zu einem wertvollen, aber häufig auch ungenutzten Gut geworden. Das Potenzial von Daten wird erst offenkundig, wenn sie extrahiert und analysiert werden. Um sie schließlich für Entscheidungsfindungsprozesse nutzen zu können, helfen interaktive Datenvisualisierungstools. Die Datenvisualisierung hebt spezifische Merkmale der Daten hervor und erleichtert deren Verständnis für Personen mit unterschiedlichem Kompetenzniveau. Visualisierungstools (wie das als Tool im Nacaps-Datenportal verwendete Tableau) bieten einen intuitiveren Einblick in komplexe Datenstrukturen und Zusammenhänge. Sie unterstützen das Verständnis großer Informationsmengen und versetzt Menschen in die Lage, Muster, Trends und Sequenzen zu erkennen ([14] et al., 2013).

Hinter der Datenvisualisierung steht eine Folge von Schritten. Im ersten Schritt werden Daten aus verschiedenen Quellen importiert und in einem geeigneten Format gespeichert. Im zweiten Schritt werden die Daten mittels verschiedener Operationen vorverarbeitet. Hierunter fallen z. B. die Entfernung unnötiger Elemente, das konsistente Indexieren nach einem einheitlichen Schema, Entscheidungen über notwendige Harmonisierungen, die Aggregation von Intervallen. Im dritten Schritt werden die Daten als Input für ein Datenvisualisierungstool bereitgestellt, um im vierten Schritt, abhängig von der Wahl der Visualisierung in der Nutzungssituation, über dieses Tool in einem vorab konzipierten Format bereitgestellt zu werden.

Die Schritte im Datenvisualisierungsprozess sind in Abbildung 1 zu sehen.

Tools zur Datenvisualisierung helfen, aus großen Datenmengen aussagekräftige und nützliche Informationen zu extrahieren ([1] et al., 2015). Durch die Integration von Zusatzfunktionen kann die Effizienz der Tools gesteigert werden. Tableau wurde beispielsweise von verschiedenen Benutzerinnen und Benutzern im Bereich der Datenvisualisierung empfohlen, weil es im Unterschied zu anderen High-End-Datenvisualisierungssoftware und -programmen Datenabfrage, Exploration und Visualisierung in einem einzigen Prozess integriert ([16] & Mortimer, 2018). Die Standardeinstellungen der Software ermöglichen es, mithilfe von Farbe, Form, räumlicher Position und Bewegung effektive visuelle Präsentationen von Daten zu erstellen ([13], 2009), ([7] et al. 2023).

Graph: Abbildung 1: Schritte im Prozess der Datenvisualisierung.

Datenvisualisierungstools wie Tableau bieten somit Lösungen für die Herausforderung, große Datenmengen mit begrenzten personellen und finanziellen Ressourcen effizient zu untersuchen und sinnvoll verarbeiten zu können ([8], 2017). Die Möglichkeit, Variablen einfach hinzuzufügen oder ausschließen zu können sowie andere Aktionen zur Interaktion mit Daten, wie z. B. zu segmentieren, zu sortieren und hervorzuheben, erweitern die Möglichkeiten, große Mengen quantitativer Informationen begreifbar zu machen. Sie entlasten bei ihrer Nutzung von den teilweise voraussetzungsvollen Schritten der Datenaufbereitung und -verarbeitung und unterstützen das analytische Durchdringen der Daten mit Hilfe adäquater Visualisierungen.

Open Data, Qualitätsperspektive und DQ Frameworks

Das Konzept von Open Data ist, dass von Organisationen erhobene Daten öffentlich zugänglich gemacht werden, unabhängig für wen und welche Nutzungszwecke. Die unentgeltlichen und öffentlichen Daten können unter anderem dazu verwendet werden, neue Geschäftsvorhaben zu gründen oder schwierige strategische Herausforderungen zu lösen. Open Data gewinnt sowohl im öffentlichen als auch im privaten Sektor an Bedeutung, was zum Teil auf den Druck zur Erhöhung der Transparenz des öffentlichen Sektors und zum Teil auf das aktuell große öffentliche Interesse an Big Data und Datenanalyse zurückzuführen ist ([18] & Charalabidis & [35], 2012; [36] & Janssen & Davis, 2014). In der Literatur finden sich Beispiel für die Wirksamkeit von Open Data. Laut [5] & Kuula-Luumi (2017) hat die Wiederverwendung qualitativer Daten beispielsweise zu verbesserten Diensten und Infrastrukturen geführt, die den Zugriff auf Tausende von Datensammlungen erleichtern.

Demgegenüber verweisen zahlreiche Studien auf weit verbreitet Probleme im Zusammenhang mit schlechter DQ, was die effiziente Wiederverwendung offener Daten möglicherweise behindern kann.

Datenqualitätsprobleme in Bezug auf die Genauigkeit, Aggregation und Präzision offener Daten wurden von [2] (2010) thematisiert und z. B. bei schlechter Umsetzung von Postleitzahlen, Ländercodes, Stadtcodes in öffentlichen Archiven identifiziert. Ein weiteres Beispiel für Schwierigkeiten bei der Integration offener Daten mit Einschränkungen in der DQ und der damit verbundene Aufwand wurden von [28] (2014) diskutiert. [26] & Janssen (2017) haben Datenqualitätsprobleme und deren Einfluss auf Geschäftsprozesse identifiziert. [25], [37] & Janssen (2020) zeigen wie im Zusammenspiel von DQ und Informationsqualität Qualitätsprobleme das Angebot von qualitativen Dienstleistungen für Bürgerinnen und Bürger beeinflussen.

Der Erfolg eines Datenportal-Projekts ist von verschiedenen organisatorischen, technologischen und analytischen Aspekten abhängig. So ist es von großer Bedeutung, Qualitätsframeworks einzuführen, um die Qualität offener Daten messen zu können ([24], Umbrich & Polleres, 2016). Obwohl die Anwendungskontexte variieren können, lassen sich solche Datenqualitätsframeworks für Open Data ähnliche kategorisieren (Zuiderwijk & Janssen, 2014). Datenqualität ist ein kontinuierlicher Prozess, der auf bestimmten technischen Standards, Prozessen und Ergebnissen basiert, die häufig die Datenaktualität berücksichtigen.

Ein anderer wichtige Aspekt ist die Zugänglichkeit und Verfügbarkeit von Daten. Unter der Zugänglichkeit werden das Herunterladen und Verwenden relevanter Datensätze erfasst, unter der Verfügbarkeit, wie einfach diese zu finden sind ([29] et al., 2021). Es gibt verschiedene Frameworks, die sich auf bestimmte Datenportale konzentrieren. Sie messen und berechnen die Qualität offener Daten pro Datenportal. Datenportale werden sind auf der Grundlage dieser Kennzahlen vergleichbar. Organisationen können ein umfassendes Qualitätsmanagement-Paradigma einsetzen, das die wichtigsten Qualitätsaspekte offener Daten während des gesamten Entwicklungszyklus identifiziert und die Verwaltung von Datenqualitätsprobleme ermöglicht. Die wichtigsten Schritte zur Sicherstellung der DQ in einem Framework sind ([27] et al. 2021): (1) Datenerhebung, (2) Datenspeicherung, (3) Datenvorverarbeitung, (4) Verarbeitung & Analyse und (5) Visualisierung. Das Framework kann verwendet werden, um Benutzerinnen und Benutzer auf Qualitätsprobleme bei der Überprüfung von Daten aufmerksam zu machen. Bei Auffälligkeiten kann dann eine Methode zur Bereinigung von Daten eingesetzt werden, um die Qualität der öffentlichen Daten zu verbessern. Die Bereinigungsmethode konzentriert sich hauptsächlich darauf, Fehler zu finden und zu korrigieren. Die Datenqualitätsframeworks richten sich nach den Arten und Verwendungszwecken von öffentlichen Daten. Daher können die Faktoren, die die Qualität beeinflussen, je nachdem, wie die Daten verwendet werden sollen, unterschiedlich bewertet werden. Bei der Anwendung von Datenqualitätsframeworks sollten folgende Fragen beantwortet werden: Welche sind die allgemeinen Anforderungen der Benutzerinnen und Benutzer? Welche Arten von Daten werden gesammelt und verwendet? In welchem Kontext stehen die Daten? Woher stammen die Daten und wie werden sie erfasst? Welche Qualitätskriterien sind für die Daten relevant (z. B. Genauigkeit, Vollständigkeit, Aktualität, Konsistenz)? Welche Tools oder Technologien können bei der Umsetzung des Datenqualitätsframeworks unterstützen? Wie werden Probleme mit der Datenqualität identifiziert, priorisiert und behoben?

Diskussion & künftige Ausrichtung

Datenportale haben sich im Verlauf des letzten Jahrzehnts als wichtige Informationsquellen und Zugangspunkte zu Informationen etabliert ([17] & Houben, 2023). Um den Anforderungen eines „Fitness for Purpose" gerecht zu werden, ist es von zentraler Bedeutung, dass die auf diesen Portalen bereitgestellten Daten die Informationsbedürfnisse potenzieller Nutzerinnen und Nutzer mit einer hohen Datenqualität erfüllen. Nutzerinnen und Nutzer müssen das Qualitätsniveau der erhaltenen Daten bewerten können. Trotz der Bedeutung dieses Aspekts ließen sich in der untersuchten Literatur keine konkreten Vorschläge für Datenqualitätsmodelle speziell für Datenportale finden.

Bei offenen Daten unterscheiden sich die Prozesse der Datenerhebung, -bereinigung, -verwaltung und -visualisierung in Datenportalen erheblich ([20] et al. 2023). Aufgrund ihrer besonderen Natur erfordern offene Daten mehr Aufwand und müssen eine Vielzahl von Anforderungen erfüllen, bevor sie sinnvoll nutzbar sind. Daher sollte die Forschung zu Qualitätsfragen offener Daten Lösungen entwickelt, die folgende Aspekte berücksichtigen:

  • Die Bewertung der Qualität von offenen Daten sollte möglichst früh im Datenlebenszyklus erfolgen, idealerweise bereits während der Datensammlungsphase. Auf diese Weise können zusätzliche Kriterien in die gesammelten Daten integriert werden.
  • Die Datenspeicherung sollte standardisierten Protokollen folgen, die eine einfache, schnelle Speicherung, Wiederherstellung und Abfrage ermöglichen.
  • Es müssen spezialisierte Qualitätsmetriken definiert werden, die der komplexen Natur offener Daten gerecht werden.
  • Datenqualitätskontrolle, kontinuierliche Qualitätsverbesserung und Compliance-Frameworks müssen entwickelt werden.
  • Es müssen neue flexible Messmethoden entwickelt werden, die speziell für unstrukturierte Daten geeignet sind und keinen Abgleich mit umfangreichen detaillierten Datenschemata erfordern.
  • Effektive Compliance mit effektiver Berichterstellung und Überprüfung sind erforderlich, um Evaluierungsaktivitäten zu fördern.
  • Eine bessere Berichterstattung und Überwachung der DQ sollte durch den Aufbau automatisierter Echtzeit-Dashboards erreicht werden.
  • Die Qualitätsbewertung eines repräsentativen Datensatzes muss durchgeführt werden, um ein Qualitätsmodell zu erstellen, dass auf die gesamten Daten angewendet werden kann. Dies wird einen Einblick in die DQ geben und Erkenntnisse liefern, die fair auf verschiedene Datentypen angewendet werden können.
  • Der Datenschutz muss berücksichtigt werden. Eines der größten Probleme von Open Data ist, wie Menschen damit umgehen können, ihre Daten mit Institutionen und Unternehmen zu teilen. Folglich besteht eine der Herausforderungen bei der Entwicklung von Datenanwendungen, Menschen davon zu überzeugen, ihre Daten zu teilen.

Das Nacaps-Datenportal stellt einen bedeutenden Schritt in der Bereitstellung und Nutzung von Befragungsdaten durch interaktive digitale Reportings dar. Die Diskussion über die Potenziale, Besonderheiten und Datenqualität dieses Portals wirft eine Vielzahl von wichtigen Fragen auf und bietet Raum für Reflexion und Analyse. Ein wesentliches Potenzial des Nacaps-Datenportals liegt zweifellos in seiner Fähigkeit, komplexe Befragungsdaten in interaktiven digitalen Reportings zugänglich zu machen. Durch die Visualisierung und Aufbereitung der Daten können verschiedene Interessengruppen, von Forschern über Entscheidungsträger bis hin zur breiten Öffentlichkeit, ein tieferes Verständnis für komplexe soziale Phänomene und Trends entwickeln. Diese Zugänglichkeit fördert die Transparenz und ermöglicht eine evidenzbasierte Entscheidungsfindung auf verschiedenen Ebenen.

Die Besonderheiten des Nacaps-Datenportals sind ebenfalls von Bedeutung. Durch die Strukturierung der Daten in nachvollziehbaren Kategorien und die zusätzliche Verschlagwortung sowie die Integration einer Suchfunktion werden die Benutzerfreundlichkeit deutlich verbessert und die Navigation durch die Daten erleichtert. Dies ermöglicht es den Nutzenden, relevante Informationen schnell zu finden, indem sie Suchbegriffe eingeben und nach bestimmten Kategorien filtern können, was wiederum die Effizienz bei der Datennutzung steigert und eine zielgerichtete Arbeit ermöglicht. Zusätzlich bietet das Portal Möglchkeiten für Interaktion und Feedback, indem es Ideen und Rückmeldungen von Institutionen und einzelnen Personen aus der Wissenschaft einbezieht. Diese kontinuierliche Rückmeldung fördert die Weiterentwicklung und Verbesserung des Portals.

Ein zentraler Aspekt, der beim Nacaps-Datenportal hervorgehoben werden muss, ist die Datenqualität. Die Bereitstellung qualitativ hochwertiger Informationen ist entscheidend, um die Glaubwürdigkeit und Verwendbarkeit der Daten sicherzustellen. Fehler bei der Datenerhebung, -verarbeitung oder -interpretation können nicht nur die Wiederverwendung der Daten beeinträchtigen, sondern auch das Vertrauen der Zielgruppe in das Portal untergraben. Daher ist eine kontinuierliche Überprüfung und Sicherung der Datenqualität unerlässlich, um die Integrität des Portals zu gewährleisten.

Fazit & Ausblick

Das Nacaps-Datenportal dient als Verbindung zwischen Forschungsdaten und deren Nachnutzung. Idealerweise sollte jedes Portal ein konsistentes Design aufweisen, eine Suchfunktion auf der Startseite bieten und Informationen über die beteiligten Organisationen liefern. Der Inhalt des Portals sollte klar und strukturiert präsentiert werden, damit die Benutzer ihn leicht finden können. Dies wird durch die Verwendung von übersichtlichen Kategorien und Tags erreicht. Kategorien helfen dabei, den Inhalt in größere thematische Bereiche zu organisieren, während Tags zusätzliche Informationen über den Inhalt liefern und es den Benutzern ermöglichen, gezielt nach spezifischen Themen zu suchen. Neben der Bereitstellung von Daten für spezifische Interessengruppen sollte das Portal auch darauf abzielen, Ideen und Rückmeldungen von Institutionen und ihren wissenschaftlich Beschäftigten zu integrieren. Fehler bei der Bereitstellung qualitativ hochwertiger Informationen können nicht nur die Wiederverwendung der Daten, sondern auch die Nutzung der institutionellen Portale beeinträchtigen. Eine effiziente Entwicklung dieser Portale erfordert deshalb eine systematische Bewertung ihrer Qualität, um ihren Nutzen besser zu verstehen und zu bewerten. Die Aufbereitung von schlecht dokumentierten Datensätzen sowie damit verbundene Bereinigungsaktivitäten machen einen erheblichen Teil des Aufwands aus, der für die Wiederverwendung offener Daten erforderlich ist. Dies stellt eine Ressourcenverschwendung dar. Die Qualitätsbewertung von Open-Data-Portalen ist jedoch nicht nur wichtig, um den Wert der Portale zu verstehen, sondern auch um weitere Verbesserungen voranzutreiben. Neue Datenbanktechnologien und vielversprechende webbasierte Visualisierungsansätze können dazu beitragen, die Kosten für die Bereitstellung und Visualisierung offener Daten zu senken und die Integration in qualitätsorientierte Open-Data-Angebote zu ermöglichen.

Das Nacaps-Datenportal hat sich als wichtige Plattform für die Bereitstellung und Nutzung von Befragungsdaten durch interaktive digitale Reportings etabliert. Die Zukunft dieses Portals bietet vielversprechende Potenziale und Herausforderungen. Es ist entscheidend, die Interaktivität und Benutzerfreundlichkeit kontinuierlich zu verbessern, indem neue Technologien integriert und die Nutzerbedürfnisse berücksichtigt werden. Die kontinuierliche Sicherung und Verbesserung der Datenqualität ist ebenfalls von großer Bedeutung. Zukünftige Entwicklungen im Bereich der Open Data bieten zusätzliche Chancen, indem neue Technologien und innovative Ansätze zur Datenanalyse und -visualisierung das Verständnis für komplexe soziale Phänomene vertiefen und datenbasierte Entscheidungsprozesse verbessern können.

Literatur 1 Agrawal, R., Kadadi, A., Dai, X., & Andres, F. (2015). Challenges and opportunities with big data visualization. In Proceedings of the 7th International Conference on Management of computational and collective intElligence in Digital EcoSystems (S. 169–173). 2 Allison, B. (2010). My data can't tell you that. In Lathrop, D., Ruma, L. (Eds.), Open government collaboration, transparency, and participation in practice (S. 257–265). O'Reilly Media. 3 Archer, E., & Barnes, G. (2017). Revisiting Sensemaking: The case of the Digital Decision Network Application (Digital DNA). International Review of Research in Open and Distributed Learning, 18(5), S. 249–276. 4 Azeroual, O. (2021). Datenqualität und -kuratierung als Voraussetzung für Open Research Data. Information – Wissenschaft & Praxis, 72(4), S. 204–211. 5 Bishop, L. & Kuula-Luumi, A. (2017). Revisiting qualitative data reuse: A decade on. SAGE Open, 7(1), 1–15. 6 Brown, B., Chui, M., & Manyika, J. (2011). Are you ready for the era of ‚big data'. McKinsey Quarterly, 4(1), S. 24–35. 7 Burch, M., Wallner, G., Broeks, N., Piree, L., Boonstra, N., Vlaswinkel, P., ... & Van Wijk, V. (2021, May). The power of linked eye movement data visualizations. In ACM symposium on eye tracking research and applications (S. 1–11). 8 Carillo, K. D. A. (2017). Let's stop trying to be „sexy"–preparing managers for the (big) data-driven business era. Business Process Management Journal, 23(3), S. 598–622. 9 Chen, H. & Chiang, R. H.L. & Storey, V. C. (2012), Business intelligence and analytics: from big data to big impact. MIS Quarterly, 30(4), S. 1165–1188. Chen, C. P., & Zhang, C. Y. (2014). Data-intensive applications, challenges, techniques and technologies: A survey on Big Data. Information sciences, 275, S. 314–347. Corallo, A., Crespino, A. M., Del Vecchio, V., Gervasi, M., Lazoi, M., & Marra, M. (2023). Evaluating maturity level of big data management and analytics in industrial companies. Technological Forecasting and Social Change, 196, 122826. Correa, A. S., de Souza, R. M., & da Silva, F. S. C. (2019). Towards an automated method to assess data portals in the deep web. Government information quarterly, 36(3), S. 412–426. Few, S. (2009). Thinking with Our Eyes. In Now You See It: Simple Visualization Techniques for Quantitative Analysis, edited by Stephen Few, 35–49. Oakland, CA: Analytics Press. Gettinger, J. & Kiesling, E. & Stummer, C. & Vetschera, R. (2013), A comparison of representations for discrete multi-criteria decision problems. Decision Support Systems, 54(2), S. 976–985. Himanen, L., Geurts, A., Foster, A. S., & Rinke, P. (2019). Data‐driven materials science: status, challenges, and perspectives. Advanced Science, 6(21), 1900808. Hoelscher, J., & Mortimer, A. (2018). Using Tableau to visualize data and drive decision-making. Journal of Accounting Education, 44, S. 49–59. Hole, B., & Houben, L. (2023). Web Portals for Business Data Collection. Advances in Business Statistics, Methods and Data Collection, S. 469–500. Janssen, M. & Charalabidis, Y. & Zuiderwijk, A. (2012). Benefits, adoption barriers and myths of open data and open government. Information Systems Management, 29(4), S. 258–268. Janvrin, D. J. & Weidenmier Watson, M. (2017), Big Data: a new twist to accounting. Journal of Accounting Education, 38, S. 3–8. Liu, C., Usta, A., Zhao, J., & Salihoglu, S. (2023). Governor: Turning Open Government Data Portals into Interactive Databases. In Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems (S. 1–16). Marcondes, H. (2022). The Role of Vocabularies in the Age of Data: The Question of Research Data. Knowledge Organization, 49(7), S. 467–482. Mayer-Schönberger, V. & Cukier, K. (2013), Big Data: A Revolution that will Transform how we Live, Work, and Think, John Murray, London. Máchová, R. & Lněnička, M. (2017). Evaluating the quality of open data portals on the national level. Journal of theoretical and applied electronic commerce research, 12(1), S. 21–41. Neumaier, S., Umbrich, J. & Polleres, A. (2016). Automated quality assessment of metadata across open data portals. Journal of Data and Information Quality (JDIQ), 8(1), S. 1–29. Purwanto, A., Zuiderwijk, A. & Janssen, M. (2020). Citizens' trust in open government data: A quantitative study about the effects of data quality, system quality and service quality [Conference session]. dg.o '20: The 21st Annual International Conference on Digital Government Research, Seoul Republic of Korea (S. 310–318). ACM. Saxena, S. & Janssen, M. (2017). Examining open government data (OGD) usage in India through UTAUT framework. Foresight, 19(4), S. 421–436. Taleb, I., Serhani, M. A., Bouhaddioui, C., & Dssouli, R. (2021). Big data quality framework: a holistic approach to continuous quality management. Journal of Big Data, 8(1), S. 1–41. Tauberer, J. (2014). Open government data: The book (2nd ed., pp. 67–71). eBook. Tedersoo, L., Küngas, R., Oras, E., Köster, K., Eenmaa, H., Leijen, Ä., ... & Sepp, T. (2021). Data sharing practices and data availability upon request differ across scientific disciplines. Scientific data, 8(1), S. 192. Ubaldi, B. (2013), Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives, OECD Working Papers on Public Governance, No. 22, OECD Publishing, Paris. Van der Burg, S., Wiseman, L., & Krkeljas, J. (2021). Trust in farm data sharing: reflections on the EU code of conduct for agricultural data sharing. Ethics and Information Technology, 23, S. 185–198. Van der Waal, S., Węcel K., Ermilov, I., Janev, V., Milošević, U. & Wainwright M. (2014). Lifting Open Data Portals to the Data Web. In: Auer S., Bryl V., Tramp S. (eds) Linked Open Data – Creating Knowledge Out of Interlinked Data. Lecture Notes in Computer Science, vol 8661. Springer, Cham. Wang, R. Y. & Strong, D. M. (1996). Beyond Accuracy: What Data Quality Means to Data Consumers? Journal of Management Information Systems, 12(4), S. 5–33. Wegner, A. (2022). Indikatorenbasierte Berichterstattung zu Promovierenden – Ziele, Referenzen und Erläuterungen der Indikatoren und Kernziffern im Datenportal der National Academics Panel Study. Version 2.0. Berlin: DZHW. Zuiderwijk, A. & Janssen, M. (2015). Participation and data quality in open data use: Open data infrastructures evaluated, in Proceedings of the 15th European Conference on E-Government 2015 (ECEG 2015), Academic Conferences and Publishing International Limited, Reading, UK, 2015, S. 351–359. Zuiderwijk, A., & Janssen, M. (2014). Open data policies, their implementation and impact: A framework for comparison. Government information quarterly, 31(1), S. 17–29. Zuiderwijk, A., Janssen, M. & Davis, C. (2014). Innovation with open data: Essential elements of open data ecosystems. Information Polity, 19(1–2), S. 17–33.

By Otmane Azeroual

Reported by Author

Dr. Otmane Azeroual studierte Wirtschaftsinformatik an der Hochschule für Technik und Wirtschaft (HTW) und wurde in Ingenieurinformatik am Institut für Technische und Betriebliche Informationssysteme (ITI), Arbeitsgruppe Datenbanken & Software Engineering der Otto-von-Guericke Universität Magdeburg promoviert. Seit 2016 arbeitet er als wissenschaftlicher Mitarbeiter und Projektleiter am Deutschen Zentrum für Hochschul- und Wissenschaftsforschung (DZHW).

Titel:
Das Nacaps-Datenportal – Potenziale, Besonderheiten und Datenqualität in interaktiven digitalen Reportings.
Autor/in / Beteiligte Person: Azeroual, Otmane
Link:
Zeitschrift: Information -- Wissenschaft und Praxis, Jg. 75 (2024-05-01), Heft 2/3, S. 103-110
Veröffentlichung: 2024
Medientyp: academicJournal
ISSN: 1434-4653 (print)
DOI: 10.1515/iwp-2024-2005
Schlagwort:
  • HIGHER education research
  • DOCTORAL students
  • PANEL analysis
  • SCIENCE education
  • RESEARCH personnel
  • GERMANY
  • Subjects: HIGHER education research DOCTORAL students PANEL analysis SCIENCE education RESEARCH personnel
  • Data documentation
  • Data portal
  • Data quality
  • Open access
  • Project
  • Usability
  • Usage
  • Visualization
  • Benutzerfreundlichkeit
  • Datendokumentation
  • Datenportal
  • Datenqualität
  • Nacaps
  • Nutzung
  • Open Access
  • Projekt
  • Visualisierung
  • Convivialité
  • Documentation des données
  • Libre accès
  • Portail de données
  • Projet
  • Qualité des données
  • Utilisation
  • Visualisation Language of Keywords: English; German; French
Sonstiges:
  • Nachgewiesen in: DACH Information
  • Sprachen: German
  • Alternate Title: Nacaps data portal – potential, special features and data quality in interactive digital reporting. ; Le portail de données Nacaps – potentiel, particularités et qualité des données dans le reporting numérique interactif.
  • Language: German
  • Document Type: Article
  • Geographic Terms: GERMANY
  • Author Affiliations: 1 = Deutsches Zentrum für Hochschul- und Wissenschaftsforschung (DZHW), Schützenstraße 6 a 10117 Berlin, Deutschland
  • Full Text Word Count: 5287

Klicken Sie ein Format an und speichern Sie dann die Daten oder geben Sie eine Empfänger-Adresse ein und lassen Sie sich per Email zusenden.

oder
oder

Wählen Sie das für Sie passende Zitationsformat und kopieren Sie es dann in die Zwischenablage, lassen es sich per Mail zusenden oder speichern es als PDF-Datei.

oder
oder

Bitte prüfen Sie, ob die Zitation formal korrekt ist, bevor Sie sie in einer Arbeit verwenden. Benutzen Sie gegebenenfalls den "Exportieren"-Dialog, wenn Sie ein Literaturverwaltungsprogramm verwenden und die Zitat-Angaben selbst formatieren wollen.

xs 0 - 576
sm 576 - 768
md 768 - 992
lg 992 - 1200
xl 1200 - 1366
xxl 1366 -