Das Data Warehouse des IT-Systemhaus der BA

Das Data Warehouse (DWH) des IT-Systemhauses ist eines der innovativsten und größten Data-Warehouses in der deutschen IT-Landschaft. Unser DWH enthält die Datengrundlagen für die amtliche Statistik über den Arbeitsmarkt. Die Statistik der BA stellt auf dieser Basis Tabellen, Berichte und Interaktive Statistiken über den Arbeitsmarkt und die Grundsicherung nach dem SGB II zur Verfügung.

IT-BAsics: Was ist ein Data Warehouse?

Data Warehouse (DWH)

Ein Data Warehouse ist eine zentrale Datenbank, die Daten aus mehreren Quellen in einem einheitlichen Datenspeicher zusammenführt. Im Gegensatz zu einer herkömmlichen Datenbank ermöglicht ein Data Warehouse die effiziente Analyse riesiger Datenmengen. Künstliche Intelligenz und Machine Learning bringen die Datenanalyse in neue Dimensionen in Bezug auf Automatisierung und Interaktion der verfügbaren Daten.

Big Data: Von Daten und Antworten

Wie hoch ist die Arbeitslosenquote in Deutschland?
Wie viele Beschäftigte gibt es?
In welchen Berufen arbeiten die Menschen und wie hoch ist deren Verdienst?

Fragen, die unsere Bürgerinnen und Bürger, Regierung, Unternehmen und Medien beschäftigen. Dabei sind der Komplexität und dem Detailierungsgrad dieser Fragen keine Grenzen gesetzt; exakte Genauigkeit und Aktualität sind stets vorausgesetzt.

Um diese Fragen zu beantworten benötigen wir Daten. Und diese Daten liegen bei uns im IT-Systemhaus in einem der größten Data Warehouses (DWH) der deutschen IT-Landschaft.

Unser Business Intelligence der Bundesagentur für Arbeit beinhaltet:

  • Mehr als 90 Terabyte
  • Mehr als 60.000 Datenbank-Tabellen
  • Mehr als 600 Milliarden Datensätze im DWH
  • Mehr als 1.200 Dimensionen im DWH

So arbeitet unser Data Warehouse

Täglich erhalten wir Datenlieferungen von den IT-Verfahren in den Agenturen und Jobcentern. Weitere Datenlieferanten sind die Träger unseres Sozialversicherungssystems, wie Kranken- oder Rentenversicherungen.

Diese meist unterschiedlich strukturierten, heterogene Rohdaten werden zunächst in einer Ladeschicht gesammelt. Über Transformationen werden die Daten in der DWH-Schicht strukturiert, verdichtet sowie Kennzahlen berechnet. So werden gemeldete Arbeitslose beispielsweise nach Berufsgruppen sortiert, auf Stadt-, Land- oder Bundesebene zusammengefasst und entsprechende Arbeitslosenquoten berechnet. 

Die Analyse der Daten und die Erstellung von Endprodukten für die Nutzerinnen und Nutzer erfolgt schließlich von den Statistikerinnen und Statistikern der BA für die Veröffentlichung im Internetangebot der Statistik der BA.

Unser Team besteht aus

  • Entwicklern
  • Datenbank-Profis
  • Daten-Analysten
  • Data Scientists

Sie kümmern sich um die riesigen Datenströme und verarbeiten diese so, dass am Ende mehr daraus gewonnen werden kann: Themenorientierte, strukturierte Informationen. Vor allem aber auch AnalysenInterpretationen und Darstellungen hinsichtlich Mengen, Verteilungen und zeitlichen Entwicklungen.

Dabei sind Zugriff und Verwendung der Daten klar reglementiert und folgen eindeutigen datenethischen Grundlagen.

Verwendung finden diese Daten bei der Statistik der BA und beim Institut für Arbeitsmarkt- und Berufsforschung der BA (IAB). Zusätzlich betreiben wir einen Business Intelligence Self Service für Arbeitsagenturen und Jobcenter und ein Controlling-Portal für unsere internen Prozesse.

Statistik für Alle - Unsere Berichte zum deutschen Arbeitsmarkt

Du willst das Potenzial unseres Data Warehouses selbst erleben? In unserem Statistik-Portal findest du spannende Statistiken, Analysen und Berichte über den Arbeitsmarkt in Deutschland.

Zum Statistik-Portal

Weitere Themen des IT-Systemhaus der BA