Zukunftsgestaltung für Unternehmen

Die Data Science Business Akademie bietet passgenaue Lösungen, einzigartige Services, eine individuelle Qualifizierung sowie höchste Beratungskompetenz in den Bereichen Predictive Analytics, Artificial Intelligence und Big Data – wir begleiten Sie auf dem Weg zum Data Science Expert.

Ihr Zertifizierungsweg:

Explorer

Grundlagenwoche

  • 1 Modul plus Prüfung
  • Zertifizierung: Certified Data Science Explorer

Practitioner

Praxiswoche

  • 1 Modul plus Prüfung
  • wählbar aus 2 Themenfeldern
  • Zertifizierung: Certified Data Science Practitioner

Expert

Vertiefungswoche

  • 1 Modul plus Prüfung oder 1 Projekt
  • wählbar aus 3 Themenfeldern
  • Zertifizierung: Certified Data Science Expert

Data Science Seminare

Verwenden Sie genau die Werkzeuge, die Sie in Ihrem Unternehmen benötigen.

Mit unseren aktuellen Angeboten rund um Predictive Analytics, Artificial Intelligence und Big Data qualifizieren und unterstützen wir Sie auf Ihrem Weg durch die digitale Transformation.

Stellen Sie sich aus einer Reihe von Seminaren Ihren Zertifizierungsplan zusammen.

Köln 5 Tage Practitioner
Praxiswoche – Data Science mit R und RStudio
Kursbeschreibung
Den Teilnehmern wird der Umgang mit der statistischen Programmiersprache R interaktiv näher gebracht. Die erlernten Fähigkeiten werden regelmäßig an einem kursbegleitenden Projekt angewandt und dadurch gefestigt.
Ziele
Nach erfolgreichem Abschluss, besitzen die Kursteilnehmer Grundkenntnisse im Umgang mit R, die es ihnen ermöglichen, statistische Fragestellungen eigenständig zu bearbeiten, analysieren und auszuwerten.
Inhalte
Neben den Grundlagen in R, werden insbesondere Themen wie die effiziente Aufbereitung und Verarbeitung von Daten, deren visuelle Analyse, sowie die Anwendung gängiger Techniken des maschinellen Lernens vermittelt.
Jetzt Buchen
Köln 5 Tage Expert
Vertiefungswoche – Deep Learning und neuronale Netze
Kursbeschreibung
Einführung in die Anwendung neuronaler Netze im betriebswirtschaftlichen Kontext in unterschiedlichen Anwendungsszenarien von der Bildklassifizierung bis zum Reinforcement Learning.
Ziele
Die Teilnehmer können aktuelle Methoden im Bereich des Deep Learning anwenden und mit Data Science Werkzeugen umsetzen.
Inhalte
Deep Learning Methodik, Convolutional und Recurrent Netzwerkarchitekturen, Reinforcement Learning zur Entscheidungsunterstützung

Coming Soon…

Köln 5 Tage Expert
Vertiefungswoche – Sprachverarbeitung und Social Media Analytics
Kursbeschreibung
Der Kurs vermittelt einen grundlegenden Einblick in die Verarbeitung natürlicher Sprache im Computer und zeigt Ihnen Methoden und Technologien zur Social Media-Analyse, deren Technik Sie an praktischen Beispielen erlernen.
Ziele
Die Teilnehmer des Kurses sind nach erfolgreicher Kursteilnahme in der Lage, heutige Methoden der Sprachanalyse und -erzeugung zu bewerten und selbst anzuwenden. Sie sind mit den aktuellen Methoden und Technologien der Social-Media-Analyse vertraut und können Inhalte und Aktivitäten in sozialen Netzwerken eigenständig bewerten.
Inhalte
Methoden zur Analyse; Generieren natürlicher Sprache im Computer; Datenbeschaffung über offene Schnittstellen von sozialen Medien, deren Aufbereitung sowie Speicherung; Methoden der Graphen- und Indikator-basierten Analyse, es wird besonderen Wert auf die Anwendung der vorgestellten Konzepte gelegt

Coming Soon…

Köln 5 Tage Expert
Vertiefungswoche – Big Data mit Hadoop
Kursbeschreibung
tba
Ziele
tba
Inhalte
tba

Coming Soon…

Köln 5 Tage Expert
Vertiefungswoche – Praxisprojekt
Kursbeschreibung
tba
Ziele
tba
Inhalte
tba

Coming Soon…

Köln 5 Tage Explorer
Grundlagenwoche – Data Science
Kursbeschreibung
Einführung in die Methodik und Anwendung von Data Science für die Lösung betriebswirtschaftlicher datenbezogener Fragestellungen. Neben den statistischen Grundlagen der Datenanalyse stehen die Basiskonzepte des Data Mining im Fokus.
Ziele
Die Teilnehmer sind in der Lage, eine vollständige Data Science Lösung zu entwerfen, umzusetzen und zu bewerten. Sie können marktübliche Kenntnisse und Kompetenzen erwerben.
Inhalte
Es werden Techniken der explorativen Analyse, der Datenvorbereitung und des überwachten und nichtüberwachten Lernens vermittelt. Deskriptive und induktive Verfahren der statistischen Datenanalyse werden vorgestellt.
Jetzt Buchen
Köln 1 Tage Explorer
Data Science: Grundlagen der Statistik kompakt
Kursbeschreibung
Kompaktschulung zu statistischen Grundlagen, die für die Themengebiete Data Science und Machine Learning notwendig sind.
Ziele
Mit dieser Grundlagenschulung bauen Sie sich ein statistisches Fundament auf. Die Kompaktschulung vermittelt die wesentlichen Grundlagen der beschreibenden und schließenden Statistik.
Inhalte
Folgende Themen werden behandelt:
  • Grundlagen der beschreibenden Statistik
    • Stichprobe versus Gesamtheit
    • statistische Skalen: nominal, ordinal, metrisch
    • relative Häufigkeiten und kumulierte relative Häufigkeiten, empirische Verteilungsfunktion
    • Histogramm für klassierte Daten
    • Lagemaße: arithmetisches Mittel, Median, Quantile
    • Box-Whisker-Plot
    • Streuungsmaße: Varianz und Standardabweichung
    • zweidimensionale Datensätze, Streudiagramm
    • Zusammenhangsmaße: Korrelation
    • Lineare Regression
  • Grundlagen der schließenden Statistik
    • Schließen von der Stichprobe auf die Gesamtheit
    • Wahrscheinlichkeit versus relative Häufigkeit
    • diskrete und stetige Zufallsvariablen
    • Gaußkurve, Normalverteilung
    • Vertrauensbereich, Konfidenzintervalle
    • Grundlagen der Hypothesentests (Nullhypothese, Alternativhypothese, Signifikanzniveau)
    • Hypothesentest-Typen (Mittelwerttest, Anteilstest, Unabhängigkeitstest, F-Test als Gesamtmodell-Test, t-Test) und Anwendungsbereiche
    • Ausblick: einfaktorielle Varianzanalyse
    • Diskussion spezifischer Fragestellungen aus der beruflichen Praxis
Jetzt Buchen
Köln 3 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 2 Tage Special
Datenmodellierung in Business-Intelligence und Big-Data-Systemen
Kursbeschreibung
Damit ein betriebliches Informationssystem wie etwa ein Data Warehouse reibungslos funktioniert, bedarf es einer grundlegenden Datenmodellierung. Die 2-tägige Schulung vermittelt die methodischen Grundlagen und veweist auf die notwendigen technischen Aspekte. Dabei werden auch beispielhafte Lösungen für verschiedene Anwendungsfälle aufgezeigt.
Ziele
Nach der Schulung kennen Sie die Grundlagen der Datenmodellierung für Business Intelligence und Data Analytics. Als Teilnehmer haben Sie verschiedene konzeptionelle Datenmodellierungsansätze kennengelernt und können nun mit Data Vault klassische Modellierungsarten einen aktuellen Modellansatz gegenüberstellen.
Inhalte
Folgende Themen werden behandelt:
  • Informationssysteme und Kennzahlen
  • Data-Warehouse-Systeme
  • Relationale Datenmodelle
  • Entity-Relationship-Modell
  • Normalformen & Historisierung
  • Dimensionale Datenmodelle
  • Agile dimensionale Modellierung
  • Star- und Snowflake-Schema
  • Modellierung mit ADAPT
  • Data-Vault-Datenmodelle
  • Modellierung von Fachlogik
  • NoSQL-Datenmodelle
Jetzt Buchen
Köln 5 Tage Practitioner
Praxiswoche – Data Science mit Python
Kursbeschreibung
Die Teilnehmer erhalten einen Einstieg in Python und Pandas, um Daten zu analysieren und Machine Learning Algorithmen einsetzen zu können. Die durchgängigen Praxisbeispiele mit vielen Übungen führen wie ein roter Faden durch diese Schulung.
Ziele
Nach dem Seminar sind Sie in der Lage Pandas als Data Science Tool für Ihre Projekte zu nutzen. Darüber hinaus lernen Sie die Umsetzung grundlegender Data Science Schritte in Python kennen, sodass sie Ihre Projekte auch direkt in einer Programmiersprache umsetzen können.
Inhalte
Datenstrukturen in Python, Einführung in das Data Science Paket pandas (Daten einlesen, Data handling), grundlegende Statistiken mit pandas, Algorithmen im Data Science
Jetzt Buchen
Köln 3 Tage Expert
Machine Learning mit Python
Kursbeschreibung
Wenn Sie Automatisierungsprozesse vorantreiben und ein Gespür für den Wert Ihrer Daten bekommen möchten, ist diese 3-tägige Schulung perfekt geeignet. Sie lernen den Umgang mit gängiger Lernalgorithmen aus der Scikit-Learn Bibliothek und erhalten anhand praktischer Beispiele ein Verständis zu statischen Grundlagen.
Ziele
Neben der Vermittlung von Machine Learning Grundlagen liegt der Fokus dieser Schulung auf der Vorverarbeitung der Daten und der Extraktion relevanter Variablen für den Anlernprozess. Dank einer Grundlagenschulung  zur praktischen Anwendung von gängigen Lernalgorithmen aus der Scikit-Learn Bibliothek fällt es am Ende der Schulung nicht schwer, Daten zielsicher zu extrahieren, Algorithmen anzulernen und diese zur Klassifizierung oder Prognose einzusetzen.
Inhalte
Folgenden Themen werden behandelt:
  • Daten ziehen und aufbereiten
    • Dateien im Verzeichnis ansteuern
    • Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
    • SQL-Datenbanken ansteuern
    • Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
    • Daten inspizieren und beschreiben
    • Fehlende Werte behandeln
  • Machine Learning Grundlagen 
    • Grundlagen, Varianten und Techniken des Machine Learnings.
    • Arbeiten mit der Machine Learning Bibliothek scikit-learn.
    • Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
    • Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
    • Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
    • Unterteilen der Daten in Trainings- und Testdaten
  • Feature-Extraction 
    • Kategoriale Daten vorbereiten: One-Hot Codierung
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA (Principle Component Analysis)
    • Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
  • Machine Learning Workflow
    • Daten aufarbeiten und zusammenführen (DataMapper)
    • Pipelines einrichten
    • Speichern und laden trainierter Klassifizierer
Jetzt Buchen
Köln 4 Tage Expert
Deep Learning mit Python & Keras
Kursbeschreibung
Diese Schulung wurde für technisch interessierte Fachkräfte mit Grundkenntnissen in Python konzipiert. Sie ist geeignet für alle Teilnehmer, die mehr über Neuronale Netze lernen und mit Keras eigene Neuronale Netze aufbauen und trainieren und damit den Sprung in fortgeschrittene Machine Learning Techniken wagen möchten.
Ziele
Durch praktische Übungen wird vermittelt, wie Bild-, Text und numerische Daten für Training und Schätzung vorbereitet werden. Nach der Schulung kennen Sie den kompletten Workflow des Machine Learning mit der Deep Learning Bibliothek Keras. Sie sind in der Lage Daten, und Optionen des Einsatzes neuronaler Netze zu prüfen udn Modelle zielsicher auszuwählen und zu trainieren.
Inhalte
Folgende Themen werden behandelt:
  • Wie lernen Neuronale Netze?
    • Variablen, Modelle und Zusammenhänge
    • Künstliche Neuronen und neuronale Netze
    • Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
  • Neuronale Netze mit Keras aufbauen und trainieren
    • Graphen mit Tensorflow erstellen
    • Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
    • Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
    • Einsatz angelernter Modelle zur Klassifzierung und Schätzung
    • Modelle speichern und laden
    • Overfitting mit Dropout-Layern verhindern
    • Überwachung des Anlernprozesses mit TensorBoard
  • Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
    • Bilddateien als mehrdimensionale Matrizen
    • Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
    • Konvolutionale Layer mit Keras aufbauen und anlernen
    • Vortrainierte Layer einsetzen
  • Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
    • Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
    • Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
    • Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
    • Textdaten mit Embedding-Layers interpretieren
  • Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
    • Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
    • Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
    • Qualitativer Variablen und Dummy-Sets
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA
    • Bilddateien transformieren
    • Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.
Jetzt Buchen
Köln 4 Tage Special
Data Science mit RapidMiner: Grundlagen und fortgeschrittene Themen für Analysten
Kursbeschreibung
Die Schulungen sind auch geeignet, um neue Data Scientists auszubilden oder erfahrenen Data Scientists den Umstieg auf die Plattform RapidMiner zu erleichtern.
Ziele
Nachdem Sie die Schulung besucht haben können Sie durch Ablegen einer Prüfung das Zertifikat „RapidMiner Analyst “ erwerben, mit dem Sie Ihre neue Qualifizierung nach außen sichtbar machen.
Inhalte
Grundlegende Methoden der Datenaufbereitung, Erstellen analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation von Modellen im Hinblick auf verschiedene Gütekriterien, Weiterführende Methoden der Datenaufbereitung, Erstellen komplexer, analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation und Optimierung von Modellen im Hinblick auf verschiedene Gütekriterien
Jetzt Buchen
Köln 0 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 2 Tage Practitioner
Einstieg in Data Science mit Pandas
Kursbeschreibung
Das Python-Paket Pandas ist als universeller Werkzeugkasten für den Bereich Data Science nicht mehr wegzudenken. Die 2-tägige Schulung vermittelt die Grundlagen und Funktionsweisen dieses mächtigen Tools und gibt Hilfestellung für einen optimalen Einsatz von Pandas im Unternehmenskontext.
Ziele
Nach der Schulung wissen Sie, wie Sie Datenaufbereitung, Datenaggregation und Datenvisualisierung mit Pandas umsetzen und haben anhand von praktischen Beispielen ein Gefühl für den Einsatz von Pandas im Unternehmenskontext erhalten.
Inhalte
Folgende Themen werden behandelt:
  • Pandas im Überblick
    • Datenaufbereitung
    • Datenaggregation
    • Datenvisualisierung
  • Einführung in Pandas
    • Aggregatfunktionen
    • Zeitreihen
    • Geodaten
    • Best Practices
Jetzt Buchen
Köln 2 Tage Special
Big Data mit Amazon Web Services (AWS)
Kursbeschreibung
Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).
Ziele
Nach der Schulung wissen Sie, welche Tools bei der effizienten Verarbeitung von großen Datenmengen hilfreich sind. Auf Basis von Amazon Web Services (AWS) werden Sie sichere und produktive Big Data Umgebungen einrichten können.
Inhalte
Folgende Themen werden behandelt:
  • Big Data - Konzeptuelle Grundlagen
    • Einführung
    • Klassifizierung von Methoden
    • überwachtes und unüberwachtes Lernen
  • Big Data - Grundlegende Tools
    • Apache Hadoop
    • Hadoop distributed File System (HDFS)
    • SQL/NoSQL Abfragen
  • AWS Setup für Big Data
    • AWS Services für Big Data
    • Apache Hadoop und Amazon EMR
    • Installation und Konfiguration einesAmazon EMR Clusters
    • Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
    • Hadoop User Experience (HUE)
  • AWS Datenverarbeitung
    • In-Memory Datenanalyse mit Apache Spark und Amazon EMR
    • AWS Datenspeicherung
    • (Fast) Realtime Datenverarbeitung mit AWS Kinesis
    • Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
  • Kosten,
  • -Sicherheit und Visualisierung
    • AWS Abrechnungsmodelle
    • IT-Sicherheit und AWS Big-Data Anwendungen
    • Interaktive Datenabfrage- und Analyse mit Amazon Athena
    • Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
    • Visualisierung von Daten und Abfragen via Amazon QuickSight
Jetzt Buchen
Köln 3 Tage Practitioner
Jupyter Notebook Infrastruktur für effiziente Data Science Workflows
Kursbeschreibung
Wer als Datenanalyst tätig ist, wird an Jupyter kaum vorbei kommen. Die 3-tägige Schulung gibt einen Überblick über iPython und den Funktionsumfang von Jupyter. Der Fokus der Schulung liegt auf dem Aufbau einer Infrastruktur auf Basis von Jupyter Notebooks, die den Arbeitsalltag eines Datanalysten deutlich erleichtert.
Ziele
Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.
Inhalte
Folgende Themen werden behandelt:
  • Einführung, Überblick
    • iPython und Jupyter
    • JupyterHub
    • nbconvert und nbviewer
    • Kernels
  • Notebooks erweitern
    • Widgets
    • nbextensions
    • Dashboards
    • Notebooks einbetten
  • Praxis mit Jupyter
    • Reproduzierbare Notebooks
    • Parametrisierung
    • Zeitplanung
    • Refactoring
Jetzt Buchen
Köln 3 Tage Expert
Machine Learning mit Python
Kursbeschreibung
Wenn Sie Automatisierungsprozesse vorantreiben und ein Gespür für den Wert Ihrer Daten bekommen möchten, ist diese 3-tägige Schulung perfekt geeignet. Sie lernen den Umgang gängiger Lernalgorithmen aus der Scikit-Learn Bibliothek und erhalten anhand praktischer Beispiele ein Verständis zu statischen Grundlagen.
Ziele
Neben der Vermittlung von Machine Learning Grundlagen liegt der Fokus dieser Schulung auf der Vorverarbeitung der Daten und der Extraktion relevanter Variablen für den Anlernprozess. Dank einer Grundlagenschulung  zur praktischen Anwendung von gängigen Lernalgorithmen aus der Scikit-Learn Bibliothek fällt es am Ende der Schulung nicht schwer, Daten zielsicher zu extrahieren, Algorithmen anzulernen und diese zur Klassifizierung oder Prognose einzusetzen.
Inhalte
Folgenden Themen werden behandelt:
  • Daten ziehen und aufbereiten
    • Dateien im Verzeichnis ansteuern
    • Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
    • SQL-Datenbanken ansteuern
    • Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
    • Daten inspizieren und beschreiben
    • Fehlende Werte behandeln
  • Machine Learning Grundlagen 
    • Grundlagen, Varianten und Techniken des Machine Learnings.
    • Arbeiten mit der Machine Learning Bibliothek scikit-learn.
    • Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
    • Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
    • Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
    • Unterteilen der Daten in Trainings- und Testdaten
  • Feature-Extraction 
    • Kategoriale Daten vorbereiten: One-Hot Codierung
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA (Principle Component Analysis)
    • Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
  • Machine Learning Workflow
    • Daten aufarbeiten und zusammenführen (DataMapper)
    • Pipelines einrichten
    • Speichern und laden trainierter Klassifizierer
Jetzt Buchen
Köln 2 Tage Special
Analytics Architekturen für Big Data, BI, DWH und AI
Kursbeschreibung
In zwei intensiven Schulungstagen lernen Sie unterschiedliche Architekturvarianten kennen. Mit diesem Grundlagenwissen können Sie Architekturalternativen bewerten, Risiken einschätzen und eigene Entwürfe einbringen.
Ziele
Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.
Inhalte
Folgende Themen werden behandelt:
  • Data-Warehouse-Architekturen
  • Datenmodelle
  • Data-Warehouse-Prozesse
  • Reporting und Analyse
  • Moderne Datenhaltungskonzepte
  • Big-Data-Architekturen
  • Data Lake und Big Data Warehouse
Jetzt Buchen
Köln 1 Tage Explorer
Data Science: Grundlagen der Statistik kompakt
Kursbeschreibung
Kompaktschulung zu statistischen Grundlagen, die für die Themengebiete Data Science und Machine Learning notwendig sind.
Ziele
Mit dieser Grundlagenschulung bauen Sie sich ein statistisches Fundament auf. Die Kompaktschulung vermittelt die wesentlichen Grundlagen der beschreibenden und schließenden Statistik.
Inhalte
Folgende Themen werden behandelt:
  • Grundlagen der beschreibenden Statistik
    • Stichprobe versus Gesamtheit
    • statistische Skalen: nominal, ordinal, metrisch
    • relative Häufigkeiten und kumulierte relative Häufigkeiten, empirische Verteilungsfunktion
    • Histogramm für klassierte Daten
    • Lagemaße: arithmetisches Mittel, Median, Quantile
    • Box-Whisker-Plot
    • Streuungsmaße: Varianz und Standardabweichung
    • zweidimensionale Datensätze, Streudiagramm
    • Zusammenhangsmaße: Korrelation
    • Lineare Regression
  • Grundlagen der schließenden Statistik
    • Schließen von der Stichprobe auf die Gesamtheit
    • Wahrscheinlichkeit versus relative Häufigkeit
    • diskrete und stetige Zufallsvariablen
    • Gaußkurve, Normalverteilung
    • Vertrauensbereich, Konfidenzintervalle
    • Grundlagen der Hypothesentests (Nullhypothese, Alternativhypothese, Signifikanzniveau)
    • Hypothesentest-Typen (Mittelwerttest, Anteilstest, Unabhängigkeitstest, F-Test als Gesamtmodell-Test, t-Test) und Anwendungsbereiche
    • Ausblick: einfaktorielle Varianzanalyse
    • Diskussion spezifischer Fragestellungen aus der beruflichen Praxis
Jetzt Buchen
Köln 1 Tage Explorer
Data Science: Grundlagen der Statistik, Praxistag mit Excel
Kursbeschreibung
In diesem Praxistag lernen Sie die drei Zugangswege zu statistischen Analysen in Verwendung mit Excel kennen. Durch die Arbeit mit Fallbeispielen bekommen Sie ein Verständnis für die Darstellung und Berechnung verschiedener Kennzahlen, Analysen und Diagramme in Excel.
Ziele
Nach dem Praxistag können Sie mit Hilfe von Excel eigenständig statistische Analysen erstellen, statistische Kennzahlen berechnen und Diagramme erzeugen.
Inhalte
Folgende Themen werden behandelt:
  • Excel: Statistik mit den Analyse-Funktionen
  • Excel: Statistik mit den Formeln
  • Excel: Statistik mit den Diagrammen
  • Fallstudie, Berechnung von statistischen Kennzahlen
  • Fallstudie, Darstellung von statistischen Diagrammen
  • Unterschiede in den verschiedenen Excel-Versionen
  • Diskussion spezifischer Fragestellungen aus der beruflichen Praxis
Jetzt Buchen
Köln 4 Tage Expert
Deep Learning mit Python & Keras
Kursbeschreibung
Diese Schulung wurde für technisch interessierte Fachkräfte mit Grundkenntnissen in Python konzipiert. Sie ist geeignet für alle Teilnehmer, die mehr über Neuronale Netze lernen und mit Keras eigene Neuronale Netze aufbauen und trainieren und damit den Sprung in fortgeschrittene Machine Learning Techniken wagen möchten.
Ziele
Durch praktische Übungen wird vermittelt, wie Bild-, Text und numerische Daten für Training und Schätzung vorbereitet werden. Nach der Schulung kennen Sie den kompletten Workflow des Machine Learning mit der Deep Learning Bibliothek Keras. Sie sind in der Lage Daten, und Optionen des Einsatzes neuronaler Netze zu prüfen udn Modelle zielsicher auszuwählen und zu trainieren.
Inhalte
Folgende Themen werden behandelt:
  • Wie lernen Neuronale Netze?
    • Variablen, Modelle und Zusammenhänge
    • Künstliche Neuronen und neuronale Netze
    • Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
  • Neuronale Netze mit Keras aufbauen und trainieren
    • Graphen mit Tensorflow erstellen
    • Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
    • Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
    • Einsatz angelernter Modelle zur Klassifzierung und Schätzung
    • Modelle speichern und laden
    • Overfitting mit Dropout-Layern verhindern
    • Überwachung des Anlernprozesses mit TensorBoard
  • Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
    • Bilddateien als mehrdimensionale Matrizen
    • Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
    • Konvolutionale Layer mit Keras aufbauen und anlernen
    • Vortrainierte Layer einsetzen
  • Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
    • Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
    • Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
    • Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
    • Textdaten mit Embedding-Layers interpretieren
  • Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
    • Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
    • Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
    • Qualitativer Variablen und Dummy-Sets
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA
    • Bilddateien transformieren
    • Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.
Jetzt Buchen
Köln 5 Tage Explorer
Grundlagenwoche – Data Science
Kursbeschreibung
Einführung in die Methodik und Anwendung von Data Science für die Lösung betriebswirtschaftlicher datenbezogener Fragestellungen. Neben den statistischen Grundlagen der Datenanalyse stehen die Basiskonzepte des Data Mining im Fokus.
Ziele
Die Teilnehmer sind in der Lage, eine vollständige Data Science Lösung zu entwerfen, umzusetzen und zu bewerten. Sie können marktübliche Kenntnisse und Kompetenzen erwerben.
Inhalte
Es werden Techniken der explorativen Analyse, der Datenvorbereitung und des überwachten und nichtüberwachten Lernens vermittelt. Deskriptive und induktive Verfahren der statistischen Datenanalyse werden vorgestellt.
Jetzt Buchen
Köln 3 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 2 Tage Explorer
Data Science – Einführung für angehende Data Scientists
Kursbeschreibung
Die 2-tägige Schulung bereitet Sie auf einen Einstieg im Bereich Data Science vor.  Neben Grundlagenwissen zu Data Science und Machine Learning, werden Sie Tools und Sprachen kennenlernen, die für ganz unterschiedliche Aufgabengebiete im Arbeitsumfeld eines Data Scientists eingesetzt werden.
Ziele
Nach der Schulung haben Sie das Grundlagenwissen, um als Data Scientist im Unternehmenskontext erste Herausforderungen zu meistern und eigene Ideen weiterzuentwickeln.
Inhalte
Folgende Themen werden behandelt:
  • Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
  • Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
  • Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
  • Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
  • Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt
Jetzt Buchen
Köln 5 Tage Practitioner
Data Science und R Einführung – Komplett für angehende Data Scientists
Kursbeschreibung
Wenn Sie Data Science im Unternehmenskontext einsetzen möchten, ist diese Schulung perfekt geeignet. In der intensiven 5-tägigen Schulung wird der Umgang mit allen notwendigen Tools geübt, es werden Data Science Methoden, insbesondere Machine Learning geschult und es gibt jede Menge gute Tipps, Tricks & Kniffe für ein hervorragendes Data Science Produkt.
Ziele
Nach der Schulung wissen Sie, worauf es bei Data Science im Unternehmenskontext ankommt. Sie kennen Tools, Tricks & Kniffe, die Ihnen den Arbeitsalltag als Data Scientist erleichtern werden. Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.
Inhalte
Folgende Themen werden behandelt: 1.-2. Tag: Auch separat buchbar als Data Science - Einführung für angehende Data Scientists
  • Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
  • Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
  • Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
  • Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
  • Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt
3.-5. Tag: Auch separat buchbar als Einführung R für Data Scientists
  • Funktionale Programmierung
  • Grundlagen der Skriptsprache R
  • Entwicklungsumgebung Rstudio
  • Grundlegende statistische Verfahren
  • Umsetzung exemplarischer Data-Science-Prozesse in R
  • Visualisierung und Vorverarbeitung der Daten
  • Modellbildung mit aktuellen Machine-Learning-Algorithmen
  • Erstellung und Bewertung von Prognosen für typische Anwendungsfälle
Jetzt Buchen
Köln 2 Tage Special
Big Data mit Amazon Web Services (AWS)
Kursbeschreibung
Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).
Ziele
Nach der Schulung wissen Sie, welche Tools bei der effizienten Verarbeitung von großen Datenmengen hilfreich sind. Auf Basis von Amazon Web Services (AWS) werden Sie sichere und produktive Big Data Umgebungen einrichten können.
Inhalte
Folgende Themen werden behandelt:
  • Big Data - Konzeptuelle Grundlagen
    • Einführung
    • Klassifizierung von Methoden
    • überwachtes und unüberwachtes Lernen
  • Big Data - Grundlegende Tools
    • Apache Hadoop
    • Hadoop distributed File System (HDFS)
    • SQL/NoSQL Abfragen
  • AWS Setup für Big Data
    • AWS Services für Big Data
    • Apache Hadoop und Amazon EMR
    • Installation und Konfiguration einesAmazon EMR Clusters
    • Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
    • Hadoop User Experience (HUE)
  • AWS Datenverarbeitung
    • In-Memory Datenanalyse mit Apache Spark und Amazon EMR
    • AWS Datenspeicherung
    • (Fast) Realtime Datenverarbeitung mit AWS Kinesis
    • Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
  • Kosten,
  • -Sicherheit und Visualisierung
    • AWS Abrechnungsmodelle
    • IT-Sicherheit und AWS Big-Data Anwendungen
    • Interaktive Datenabfrage- und Analyse mit Amazon Athena
    • Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
    • Visualisierung von Daten und Abfragen via Amazon QuickSight
Jetzt Buchen
Köln 3 Tage Practitioner
Einführung R für Data Scientists
Kursbeschreibung
Die Schulung vermittelt die Grundlagen zum Einsatz von R, eine der meistverwendeten Data-Science Programmiersprachen weltweit. In der Schulung wird auf konkrete Data-Science Fragestellungen im Unternehmenskontext eingegangen.
Ziele
Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.
Inhalte
Folgende Themen werden vermittelt: Diese Agenda ist auch Bestandteil (3.-5. Tag) des Kurses Data Science und R Einführung - Komplett für angehende Data Scientists
  • Funktionale Programmierung
  • Grundlagen der Skriptsprache R
  • Entwicklungsumgebung Rstudio
  • Grundlegende statistische Verfahren
  • Umsetzung exemplarischer Data-Science-Prozesse in R
  • Visualisierung und Vorverarbeitung der Daten
  • Modellbildung mit aktuellen Machine-Learning-Algorithmen
  • Erstellung und Bewertung von Prognosen für typische Anwendungsfälle
Jetzt Buchen
Köln 2 Tage Practitioner
Einstieg in Data Science mit Pandas
Kursbeschreibung
Das Python-Paket Pandas ist als universeller Werkzeugkasten für den Bereich Data Science nicht mehr wegzudenken. Die 2-tägige Schulung vermittelt die Grundlagen und Funktionsweisen dieses mächtigen Tools und gibt Hilfestellung für einen optimalen Einsatz von Pandas im Unternehmenskontext.
Ziele
Nach der Schulung wissen Sie, wie Sie Datenaufbereitung, Datenaggregation und Datenvisualisierung mit Pandas umsetzen und haben anhand von praktischen Beispielen ein Gefühl für den Einsatz von Pandas im Unternehmenskontext erhalten.
Inhalte
Folgende Themen werden behandelt:
  • Pandas im Überblick
    • Datenaufbereitung
    • Datenaggregation
    • Datenvisualisierung
  • Einführung in Pandas
    • Aggregatfunktionen
    • Zeitreihen
    • Geodaten
    • Best Practices
Jetzt Buchen
Köln 3 Tage Practitioner
Jupyter Notebook Infrastruktur für effiziente Data Science Workflows
Kursbeschreibung
Wer als Datenanalyst tätig ist, wird an Jupyter kaum vorbei kommen. Die 3-tägige Schulung gibt einen Überblick über iPython und den Funktionsumfang von Jupyter. Der Fokus der Schulung liegt auf dem Aufbau einer Infrastruktur auf Basis von Jupyter Notebooks, die den Arbeitsalltag eines Datanalysten deutlich erleichtert.
Ziele
Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.
Inhalte
Folgende Themen werden behandelt:
  • Einführung, Überblick
    • iPython und Jupyter
    • JupyterHub
    • nbconvert und nbviewer
    • Kernels
  • Notebooks erweitern
    • Widgets
    • nbextensions
    • Dashboards
    • Notebooks einbetten
  • Praxis mit Jupyter
    • Reproduzierbare Notebooks
    • Parametrisierung
    • Zeitplanung
    • Refactoring
Jetzt Buchen
Köln 2 Tage Special
Analytics Architekturen für Big Data, BI, DWH und AI
Kursbeschreibung
In zwei intensiven Schulungstagen lernen Sie unterschiedliche Architekturvarianten kennen. Mit diesem Grundlagenwissen können Sie Architekturalternativen bewerten, Risiken einschätzen und eigene Entwürfe einbringen.
Ziele
Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.
Inhalte
Folgende Themen werden behandelt:
  • Data-Warehouse-Architekturen
  • Datenmodelle
  • Data-Warehouse-Prozesse
  • Reporting und Analyse
  • Moderne Datenhaltungskonzepte
  • Big-Data-Architekturen
  • Data Lake und Big Data Warehouse
Jetzt Buchen
Köln 5 Tage Practitioner
Praxiswoche – Data Science mit Python
Kursbeschreibung
Die Teilnehmer erhalten einen Einstieg in Python und Pandas, um Daten zu analysieren und Machine Learning Algorithmen einsetzen zu können. Die durchgängigen Praxisbeispiele mit vielen Übungen führen wie ein roter Faden durch diese Schulung.
Ziele
Nach dem Seminar sind Sie in der Lage Pandas als Data Science Tool für Ihre Projekte zu nutzen. Darüber hinaus lernen Sie die Umsetzung grundlegender Data Science Schritte in Python kennen, sodass sie Ihre Projekte auch direkt in einer Programmiersprache umsetzen können.
Inhalte
Datenstrukturen in Python, Einführung in das Data Science Paket pandas (Daten einlesen, Data handling), grundlegende Statistiken mit pandas, Algorithmen im Data Science
Jetzt Buchen
Köln 2 Tage Special
Datenmodellierung in Business-Intelligence und Big-Data-Systemen
Kursbeschreibung
Damit ein betriebliches Informationssystem wie etwa ein Data Warehouse reibungslos funktioniert, bedarf es einer grundlegenden Datenmodellierung. Die 2-tägige Schulung vermittelt die methodischen Grundlagen und veweist auf die notwendigen technischen Aspekte. Dabei werden auch beispielhafte Lösungen für verschiedene Anwendungsfälle aufgezeigt.
Ziele
Nach der Schulung kennen Sie die Grundlagen der Datenmodellierung für Business Intelligence und Data Analytics. Als Teilnehmer haben Sie verschiedene konzeptionelle Datenmodellierungsansätze kennengelernt und können nun mit Data Vault klassische Modellierungsarten einen aktuellen Modellansatz gegenüberstellen.
Inhalte
Folgende Themen werden behandelt:
  • Informationssysteme und Kennzahlen
  • Data-Warehouse-Systeme
  • Relationale Datenmodelle
  • Entity-Relationship-Modell
  • Normalformen & Historisierung
  • Dimensionale Datenmodelle
  • Agile dimensionale Modellierung
  • Star- und Snowflake-Schema
  • Modellierung mit ADAPT
  • Data-Vault-Datenmodelle
  • Modellierung von Fachlogik
  • NoSQL-Datenmodelle
Jetzt Buchen
Köln 3 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 3 Tage Practitioner
Machine Learning mit Python
Kursbeschreibung
Wenn Sie Automatisierungsprozesse vorantreiben und ein Gespür für den Wert Ihrer Daten bekommen möchten, ist diese 3-tägige Schulung perfekt geeignet. Sie lernen den Umgang gängiger Lernalgorithmen aus der Scikit-Learn Bibliothek und erhalten anhand praktischer Beispiele ein Verständis zu statischen Grundlagen.
Ziele
Neben der Vermittlung von Machine Learning Grundlagen liegt der Fokus dieser Schulung auf der Vorverarbeitung der Daten und der Extraktion relevanter Variablen für den Anlernprozess. Dank einer Grundlagenschulung  zur praktischen Anwendung von gängigen Lernalgorithmen aus der Scikit-Learn Bibliothek fällt es am Ende der Schulung nicht schwer, Daten zielsicher zu extrahieren, Algorithmen anzulernen und diese zur Klassifizierung oder Prognose einzusetzen.
Inhalte
Folgenden Themen werden behandelt:
  • Daten ziehen und aufbereiten
    • Dateien im Verzeichnis ansteuern
    • Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
    • SQL-Datenbanken ansteuern
    • Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
    • Daten inspizieren und beschreiben
    • Fehlende Werte behandeln
  • Machine Learning Grundlagen 
    • Grundlagen, Varianten und Techniken des Machine Learnings.
    • Arbeiten mit der Machine Learning Bibliothek scikit-learn.
    • Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
    • Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
    • Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
    • Unterteilen der Daten in Trainings- und Testdaten
  • Feature-Extraction 
    • Kategoriale Daten vorbereiten: One-Hot Codierung
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA (Principle Component Analysis)
    • Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
  • Machine Learning Workflow
    • Daten aufarbeiten und zusammenführen (DataMapper)
    • Pipelines einrichten
    • Speichern und laden trainierter Klassifizierer
Jetzt Buchen
Köln 4 Tage Special
Data Science mit RapidMiner: Grundlagen und fortgeschrittene Themen für Analysten
Kursbeschreibung
Die Schulungen sind auch geeignet, um neue Data Scientists auszubilden oder erfahrenen Data Scientists den Umstieg auf die Plattform RapidMiner zu erleichtern.
Ziele
Nachdem Sie die Schulung besucht haben können Sie durch Ablegen einer Prüfung das Zertifikat „RapidMiner Analyst “ erwerben, mit dem Sie Ihre neue Qualifizierung nach außen sichtbar machen.
Inhalte
Grundlegende Methoden der Datenaufbereitung, Erstellen analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation von Modellen im Hinblick auf verschiedene Gütekriterien, Weiterführende Methoden der Datenaufbereitung, Erstellen komplexer, analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation und Optimierung von Modellen im Hinblick auf verschiedene Gütekriterien
Jetzt Buchen
Köln 4 Tage Expert
Deep Learning mit Python & Keras
Kursbeschreibung
Diese Schulung wurde für technisch interessierte Fachkräfte mit Grundkenntnissen in Python konzipiert. Sie ist geeignet für alle Teilnehmer, die mehr über Neuronale Netze lernen und mit Keras eigene Neuronale Netze aufbauen und trainieren und damit den Sprung in fortgeschrittene Machine Learning Techniken wagen möchten.
Ziele
Durch praktische Übungen wird vermittelt, wie Bild-, Text und numerische Daten für Training und Schätzung vorbereitet werden. Nach der Schulung kennen Sie den kompletten Workflow des Machine Learning mit der Deep Learning Bibliothek Keras. Sie sind in der Lage Daten, und Optionen des Einsatzes neuronaler Netze zu prüfen udn Modelle zielsicher auszuwählen und zu trainieren.
Inhalte
Folgende Themen werden behandelt:
  • Wie lernen Neuronale Netze?
    • Variablen, Modelle und Zusammenhänge
    • Künstliche Neuronen und neuronale Netze
    • Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
  • Neuronale Netze mit Keras aufbauen und trainieren
    • Graphen mit Tensorflow erstellen
    • Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
    • Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
    • Einsatz angelernter Modelle zur Klassifzierung und Schätzung
    • Modelle speichern und laden
    • Overfitting mit Dropout-Layern verhindern
    • Überwachung des Anlernprozesses mit TensorBoard
  • Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
    • Bilddateien als mehrdimensionale Matrizen
    • Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
    • Konvolutionale Layer mit Keras aufbauen und anlernen
    • Vortrainierte Layer einsetzen
  • Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
    • Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
    • Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
    • Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
    • Textdaten mit Embedding-Layers interpretieren
  • Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
    • Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
    • Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
    • Qualitativer Variablen und Dummy-Sets
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA
    • Bilddateien transformieren
    • Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.
Jetzt Buchen
Köln 2 Tage Special
Big Data mit Amazon Web Services (AWS)
Kursbeschreibung
Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).
Ziele
Nach der Schulung wissen Sie, welche Tools bei der effizienten Verarbeitung von großen Datenmengen hilfreich sind. Auf Basis von Amazon Web Services (AWS) werden Sie sichere und produktive Big Data Umgebungen einrichten können.
Inhalte
Folgende Themen werden behandelt:
  • Big Data - Konzeptuelle Grundlagen
    • Einführung
    • Klassifizierung von Methoden
    • überwachtes und unüberwachtes Lernen
  • Big Data - Grundlegende Tools
    • Apache Hadoop
    • Hadoop distributed File System (HDFS)
    • SQL/NoSQL Abfragen
  • AWS Setup für Big Data
    • AWS Services für Big Data
    • Apache Hadoop und Amazon EMR
    • Installation und Konfiguration einesAmazon EMR Clusters
    • Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
    • Hadoop User Experience (HUE)
  • AWS Datenverarbeitung
    • In-Memory Datenanalyse mit Apache Spark und Amazon EMR
    • AWS Datenspeicherung
    • (Fast) Realtime Datenverarbeitung mit AWS Kinesis
    • Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
  • Kosten,
  • -Sicherheit und Visualisierung
    • AWS Abrechnungsmodelle
    • IT-Sicherheit und AWS Big-Data Anwendungen
    • Interaktive Datenabfrage- und Analyse mit Amazon Athena
    • Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
    • Visualisierung von Daten und Abfragen via Amazon QuickSight
Jetzt Buchen
Köln 3 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 2 Tage Practitioner
Einstieg in Data Science mit Pandas
Kursbeschreibung
Das Python-Paket Pandas ist als universeller Werkzeugkasten für den Bereich Data Science nicht mehr wegzudenken. Die 2-tägige Schulung vermittelt die Grundlagen und Funktionsweisen dieses mächtigen Tools und gibt Hilfestellung für einen optimalen Einsatz von Pandas im Unternehmenskontext.
Ziele
Nach der Schulung wissen Sie, wie Sie Datenaufbereitung, Datenaggregation und Datenvisualisierung mit Pandas umsetzen und haben anhand von praktischen Beispielen ein Gefühl für den Einsatz von Pandas im Unternehmenskontext erhalten.
Inhalte
Folgende Themen werden behandelt:
  • Pandas im Überblick
    • Datenaufbereitung
    • Datenaggregation
    • Datenvisualisierung
  • Einführung in Pandas
    • Aggregatfunktionen
    • Zeitreihen
    • Geodaten
    • Best Practices
Jetzt Buchen
Köln 3 Tage Practitioner
Jupyter Notebook Infrastruktur für effiziente Data Science Workflows
Kursbeschreibung
Wer als Datenanalyst tätig ist, wird an Jupyter kaum vorbei kommen. Die 3-tägige Schulung gibt einen Überblick über iPython und den Funktionsumfang von Jupyter. Der Fokus der Schulung liegt auf dem Aufbau einer Infrastruktur auf Basis von Jupyter Notebooks, die den Arbeitsalltag eines Datanalysten deutlich erleichtert.
Ziele
Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.
Inhalte
Folgende Themen werden behandelt:
  • Einführung, Überblick
    • iPython und Jupyter
    • JupyterHub
    • nbconvert und nbviewer
    • Kernels
  • Notebooks erweitern
    • Widgets
    • nbextensions
    • Dashboards
    • Notebooks einbetten
  • Praxis mit Jupyter
    • Reproduzierbare Notebooks
    • Parametrisierung
    • Zeitplanung
    • Refactoring
Jetzt Buchen
Köln 2 Tage Special
Analytics Architekturen für Big Data, BI, DWH und AI
Kursbeschreibung
In zwei intensiven Schulungstagen lernen Sie unterschiedliche Architekturvarianten kennen. Mit diesem Grundlagenwissen können Sie Architekturalternativen bewerten, Risiken einschätzen und eigene Entwürfe einbringen.
Ziele
Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.
Inhalte
Folgende Themen werden behandelt:
  • Data-Warehouse-Architekturen
  • Datenmodelle
  • Data-Warehouse-Prozesse
  • Reporting und Analyse
  • Moderne Datenhaltungskonzepte
  • Big-Data-Architekturen
  • Data Lake und Big Data Warehouse
Jetzt Buchen
Köln 1 Tage Explorer
Data Science: Grundlagen der Statistik kompakt
Kursbeschreibung
Kompaktschulung zu statistischen Grundlagen, die für die Themengebiete Data Science und Machine Learning notwendig sind.
Ziele
Mit dieser Grundlagenschulung bauen Sie sich ein statistisches Fundament auf. Die Kompaktschulung vermittelt die wesentlichen Grundlagen der beschreibenden und schließenden Statistik.
Inhalte
Folgende Themen werden behandelt:
  • Grundlagen der beschreibenden Statistik
    • Stichprobe versus Gesamtheit
    • statistische Skalen: nominal, ordinal, metrisch
    • relative Häufigkeiten und kumulierte relative Häufigkeiten, empirische Verteilungsfunktion
    • Histogramm für klassierte Daten
    • Lagemaße: arithmetisches Mittel, Median, Quantile
    • Box-Whisker-Plot
    • Streuungsmaße: Varianz und Standardabweichung
    • zweidimensionale Datensätze, Streudiagramm
    • Zusammenhangsmaße: Korrelation
    • Lineare Regression
  • Grundlagen der schließenden Statistik
    • Schließen von der Stichprobe auf die Gesamtheit
    • Wahrscheinlichkeit versus relative Häufigkeit
    • diskrete und stetige Zufallsvariablen
    • Gaußkurve, Normalverteilung
    • Vertrauensbereich, Konfidenzintervalle
    • Grundlagen der Hypothesentests (Nullhypothese, Alternativhypothese, Signifikanzniveau)
    • Hypothesentest-Typen (Mittelwerttest, Anteilstest, Unabhängigkeitstest, F-Test als Gesamtmodell-Test, t-Test) und Anwendungsbereiche
    • Ausblick: einfaktorielle Varianzanalyse
    • Diskussion spezifischer Fragestellungen aus der beruflichen Praxis
Jetzt Buchen
Köln 1 Tage Explorer
Data Science: Grundlagen der Statistik, Praxistag mit Excel
Kursbeschreibung
In diesem Praxistag lernen Sie die drei Zugangswege zu statistischen Analysen in Verwendung mit Excel kennen. Durch die Arbeit mit Fallbeispielen bekommen Sie ein Verständnis für die Darstellung und Berechnung verschiedener Kennzahlen, Analysen und Diagramme in Excel.
Ziele
Nach dem Praxistag können Sie mit Hilfe von Excel eigenständig statistische Analysen erstellen, statistische Kennzahlen berechnen und Diagramme erzeugen.
Inhalte
Folgende Themen werden behandelt:
  • Excel: Statistik mit den Analyse-Funktionen
  • Excel: Statistik mit den Formeln
  • Excel: Statistik mit den Diagrammen
  • Fallstudie, Berechnung von statistischen Kennzahlen
  • Fallstudie, Darstellung von statistischen Diagrammen
  • Unterschiede in den verschiedenen Excel-Versionen
  • Diskussion spezifischer Fragestellungen aus der beruflichen Praxis
Jetzt Buchen
Köln 3 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 2 Tage Explorer
Data Science – Einführung für angehende Data Scientists
Kursbeschreibung
Die 2-tägige Schulung bereitet Sie auf einen Einstieg im Bereich Data Science vor. Neben Grundlagenwissen zu Data Science und Machine Learning, werden Sie Tools und Sprachen kennenlernen, die für ganz unterschiedliche Aufgabengebiete im Arbeitsumfeld eines Data Scientists eingesetzt werden.
Ziele
Nach der Schulung haben Sie das Grundlagenwissen, um als Data Scientist im Unternehmenskontext erste Herausforderungen zu meistern und eigene Ideen weiterzuentwickeln.
Inhalte
Inhalte
Folgende Themen werden behandelt:
  • Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
  • Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
  • Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
  • Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
  • Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt
Jetzt Buchen
Köln 5 Tage Explorer
Grundlagenwoche – Data Science
Kursbeschreibung
Einführung in die Methodik und Anwendung von Data Science für die Lösung betriebswirtschaftlicher datenbezogener Fragestellungen. Neben den statistischen Grundlagen der Datenanalyse stehen die Basiskonzepte des Data Mining im Fokus.
Ziele
Die Teilnehmer sind in der Lage, eine vollständige Data Science Lösung zu entwerfen, umzusetzen und zu bewerten. Sie können marktübliche Kenntnisse und Kompetenzen erwerben.
Inhalte
Es werden Techniken der explorativen Analyse, der Datenvorbereitung und des überwachten und nichtüberwachten Lernens vermittelt. Deskriptive und induktive Verfahren der statistischen Datenanalyse werden vorgestellt.
Jetzt Buchen
Köln 5 Tage Practitioner
Data Science und R Einführung – Komplett für angehende Data Scientists
Kursbeschreibung
Wenn Sie Data Science im Unternehmenskontext einsetzen möchten, ist diese Schulung perfekt geeignet. In der intensiven 5-tägigen Schulung wird der Umgang mit allen notwendigen Tools geübt, es werden Data Science Methoden, insbesondere Machine Learning geschult und es gibt jede Menge gute Tipps, Tricks & Kniffe für ein hervorragendes Data Science Produkt.
Ziele
Nach der Schulung wissen Sie, worauf es bei Data Science im Unternehmenskontext ankommt. Sie kennen Tools, Tricks & Kniffe, die Ihnen den Arbeitsalltag als Data Scientist erleichtern werden. Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.
Inhalte
Folgende Themen werden behandelt: 1.-2. Tag: Auch separat buchbar als Data Science - Einführung für angehende Data Scientists
  • Einführung und Einbindung von Data Science in einen betriebswirtschaftlichen Rahmen
  • Vorgehensmodelle und Zieldefinitionen für Data-Science-Projekte
  • Data-Science-Methoden (insbesondere Machine Learning) und Werkzeuge
  • Praktische Umsetzung eines Data-Science- Prozesses in einem Tool
  • Tipps, Tricks und Kniffe für ein gutes Data-Science-Produkt
3.-5. Tag: Auch separat buchbar als Einführung R für Data Scientists
  • Funktionale Programmierung
  • Grundlagen der Skriptsprache R
  • Entwicklungsumgebung Rstudio
  • Grundlegende statistische Verfahren
  • Umsetzung exemplarischer Data-Science-Prozesse in R
  • Visualisierung und Vorverarbeitung der Daten
  • Modellbildung mit aktuellen Machine-Learning-Algorithmen
  • Erstellung und Bewertung von Prognosen für typische Anwendungsfälle
Jetzt Buchen
Köln 3 Tage Practitioner
Einführung R für Data Scientists
Kursbeschreibung
Die Schulung vermittelt die Grundlagen zum Einsatz von R, eine der meistverwendeten Data-Science Programmiersprachen weltweit. In der Schulung wird auf konkrete Data-Science Fragestellungen im Unternehmenskontext eingegangen.
Ziele
Nach der Schulung werden Sie in der Lage sein, erste Projekte mit Hilfe der Programmiersprache R unter Einsatz von R Studio zu begleiten oder selbst zu starten.
Inhalte
Folgende Themen werden vermittelt: Diese Agenda ist auch Bestandteil (3.-5. Tag) des Kurses Data Science und R Einführung - Komplett für angehende Data Scientists
  • Funktionale Programmierung
  • Grundlagen der Skriptsprache R
  • Entwicklungsumgebung Rstudio
  • Grundlegende statistische Verfahren
  • Umsetzung exemplarischer Data-Science-Prozesse in R
  • Visualisierung und Vorverarbeitung der Daten
  • Modellbildung mit aktuellen Machine-Learning-Algorithmen
  • Erstellung und Bewertung von Prognosen für typische Anwendungsfälle
Jetzt Buchen
Köln 4 Tage Expert
Deep Learning mit Python & Keras
Kursbeschreibung
Diese Schulung wurde für technisch interessierte Fachkräfte mit Grundkenntnissen in Python konzipiert. Sie ist geeignet für alle Teilnehmer, die mehr über Neuronale Netze lernen und mit Keras eigene Neuronale Netze aufbauen und trainieren und damit den Sprung in fortgeschrittene Machine Learning Techniken wagen möchten.
Ziele
Durch praktische Übungen wird vermittelt, wie Bild-, Text und numerische Daten für Training und Schätzung vorbereitet werden. Nach der Schulung kennen Sie den kompletten Workflow des Machine Learning mit der Deep Learning Bibliothek Keras. Sie sind in der Lage Daten, und Optionen des Einsatzes neuronaler Netze zu prüfen udn Modelle zielsicher auszuwählen und zu trainieren.
Inhalte
Folgende Themen werden behandelt:
  • Wie lernen Neuronale Netze?
    • Variablen, Modelle und Zusammenhänge
    • Künstliche Neuronen und neuronale Netze
    • Mathematische Grundlagen des Anlernprozesses: Backpropagation, Loss und Gradient Descent
  • Neuronale Netze mit Keras aufbauen und trainieren
    • Graphen mit Tensorflow erstellen
    • Ein einfaches Netz mit Keras und Tensorflow aufbauen und anlernen
    • Welches Modell ist das richtige? Evaluation und Anpassung angelernter Modelle.
    • Einsatz angelernter Modelle zur Klassifzierung und Schätzung
    • Modelle speichern und laden
    • Overfitting mit Dropout-Layern verhindern
    • Überwachung des Anlernprozesses mit TensorBoard
  • Maschinelles Sehen: Konvolutionale neuronale Netze (CNN)
    • Bilddateien als mehrdimensionale Matrizen
    • Details sehen und Formen abstrahieren: Konvolutionale Netze (CNN)
    • Konvolutionale Layer mit Keras aufbauen und anlernen
    • Vortrainierte Layer einsetzen
  • Mit Sequenzdaten arbeiten: Rekurrente neuronale Netze (RNN)
    • Zeitreihendaten und Textsequenzen: Eigenschaften und Eigenheiten
    • Neuronale Netze mit Gedächtnis (Feedforward vs. RNN)
    • Sequenzdaten mit LSTM (Long Short-Term Memory) aufbauen
    • Textdaten mit Embedding-Layers interpretieren
  • Feature Extraction: Numerische Daten, Bild und Text-Daten vorbereiten
    • Datenrepräsentation: Skalare, Vektoren & Matrizen in Numpy
    • Daten einlesen und vorbereiten mit Pandas, Scikit-learn und Keras
    • Qualitativer Variablen und Dummy-Sets
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA
    • Bilddateien transformieren
    • Mit Textdaten arbeiten: Zerlegen, tokenizieren, vektorisieren und einbetten.
Jetzt Buchen
Köln 2 Tage Special
Big Data mit Amazon Web Services (AWS)
Kursbeschreibung
Die 2-tägige Schulung vermittelt technisches Grundlagenwissen zu den Big-Data Lösungen von Amazon Web Services (AWS).
Ziele
Nach der Schulung wissen Sie, welche Tools bei der effizienten Verarbeitung von großen Datenmengen hilfreich sind. Auf Basis von Amazon Web Services (AWS) werden Sie sichere und produktive Big Data Umgebungen einrichten können.
Inhalte
Folgende Themen werden behandelt:
  • Big Data - Konzeptuelle Grundlagen
    • Einführung
    • Klassifizierung von Methoden
    • überwachtes und unüberwachtes Lernen
  • Big Data - Grundlegende Tools
    • Apache Hadoop
    • Hadoop distributed File System (HDFS)
    • SQL/NoSQL Abfragen
  • AWS Setup für Big Data
    • AWS Services für Big Data
    • Apache Hadoop und Amazon EMR
    • Installation und Konfiguration einesAmazon EMR Clusters
    • Programmierframeworks für Amazon EMR (z.B.Hive, Pig, usw.)
    • Hadoop User Experience (HUE)
  • AWS Datenverarbeitung
    • In-Memory Datenanalyse mit Apache Spark und Amazon EMR
    • AWS Datenspeicherung
    • (Fast) Realtime Datenverarbeitung mit AWS Kinesis
    • Effiziente Datenspeicherung und Datenanalyse mit Amazon Redshift
  • Kosten,
  • -Sicherheit und Visualisierung
    • AWS Abrechnungsmodelle
    • IT-Sicherheit und AWS Big-Data Anwendungen
    • Interaktive Datenabfrage- und Analyse mit Amazon Athena
    • Automatisiertes extrahieren, transformieren und laden von Daten mittels AWS Glue
    • Visualisierung von Daten und Abfragen via Amazon QuickSight
Jetzt Buchen
Köln 2 Tage Special
Datenmodellierung in Business-Intelligence und Big-Data-Systemen
Kursbeschreibung
Damit ein betriebliches Informationssystem wie etwa ein Data Warehouse reibungslos funktioniert, bedarf es einer grundlegenden Datenmodellierung. Die 2-tägige Schulung vermittelt die methodischen Grundlagen und veweist auf die notwendigen technischen Aspekte. Dabei werden auch beispielhafte Lösungen für verschiedene Anwendungsfälle aufgezeigt.
Ziele
Nach der Schulung kennen Sie die Grundlagen der Datenmodellierung für Business Intelligence und Data Analytics. Als Teilnehmer haben Sie verschiedene konzeptionelle Datenmodellierungsansätze kennengelernt und können nun mit Data Vault klassische Modellierungsarten einen aktuellen Modellansatz gegenüberstellen.
Inhalte
Folgende Themen werden behandelt:
  • Informationssysteme und Kennzahlen
  • Data-Warehouse-Systeme
  • Relationale Datenmodelle
  • Entity-Relationship-Modell
  • Normalformen & Historisierung
  • Dimensionale Datenmodelle
  • Agile dimensionale Modellierung
  • Star- und Snowflake-Schema
  • Modellierung mit ADAPT
  • Data-Vault-Datenmodelle
  • Modellierung von Fachlogik
  • NoSQL-Datenmodelle
Jetzt Buchen
Köln 3 Tage Expert
Machine Learning mit Python
Kursbeschreibung
Wenn Sie Automatisierungsprozesse vorantreiben und ein Gespür für den Wert Ihrer Daten bekommen möchten, ist diese 3-tägige Schulung perfekt geeignet. Sie lernen den Umgang gängiger Lernalgorithmen aus der Scikit-Learn Bibliothek und erhalten anhand praktischer Beispiele ein Verständis zu statischen Grundlagen.
Ziele
Neben der Vermittlung von Machine Learning Grundlagen liegt der Fokus dieser Schulung auf der Vorverarbeitung der Daten und der Extraktion relevanter Variablen für den Anlernprozess. Dank einer Grundlagenschulung  zur praktischen Anwendung von gängigen Lernalgorithmen aus der Scikit-Learn Bibliothek fällt es am Ende der Schulung nicht schwer, Daten zielsicher zu extrahieren, Algorithmen anzulernen und diese zur Klassifizierung oder Prognose einzusetzen.
Inhalte
Folgenden Themen werden behandelt:
  • Daten ziehen und aufbereiten
    • Dateien im Verzeichnis ansteuern
    • Standardverfahren zum Lesen/Schreiben von Text- und CSV-Dateien
    • SQL-Datenbanken ansteuern
    • Arbeiten mit Datenmatrizen: Einführung in Numpy & Pandas
    • Daten inspizieren und beschreiben
    • Fehlende Werte behandeln
  • Machine Learning Grundlagen 
    • Grundlagen, Varianten und Techniken des Machine Learnings.
    • Arbeiten mit der Machine Learning Bibliothek scikit-learn.
    • Einfache Zusammenhänge zwischen stetigen Variablen modellieren: Lineare Regression
    • Klassifizieren mit Logistic Regression, Softmax und Support Vector Machine.
    • Modellen evaluieren: Accuracy, Precision, Recall & Confusion matrix
    • Unterteilen der Daten in Trainings- und Testdaten
  • Feature-Extraction 
    • Kategoriale Daten vorbereiten: One-Hot Codierung
    • Standardisierung von Daten
    • Dimensionsreduktion mit PCA (Principle Component Analysis)
    • Aufbereitung von Textdaten: Tokenizer und Bag-of-words.
  • Machine Learning Workflow
    • Daten aufarbeiten und zusammenführen (DataMapper)
    • Pipelines einrichten
    • Speichern und laden trainierter Klassifizierer
Jetzt Buchen
Köln 3 Tage Practitioner
Data Science mit Python – Einführung in Python
Kursbeschreibung
Nutzen Sie die vielfältigen Möglichkeiten von Python im Bereich Data Science. Die Schulung vermittelt in 3 Tagen das nötige Know-How, um Datenstrukturen, Visualisierungen, Statistiken und Control Flows mit Python und zusätzlichen Data Sciences Paketen wie pandas selbstständig zu erstellen und auszuwerten.
Ziele
Nach der Schulung haben Sie einen guten Überblick über die Möglichkeiten von Python im Bereich Data Science. Sie lernen Machine Learning Algorithmen in Theorie und Praxis kennen und können grundlegende Statistiken mit pandas erstellen.
Inhalte
Folgende Themen werden behandelt:
  • Einführung
    • Kurzer Hintergrund zu Python und Anaconda
    • Installieren von neuen Paketen
    • Die Entwicklungsumgebung (IDE) Spyder
    • Aspekte von Python, die anders als in anderen Programmiersprachen sind
  • Datenstrukturen in Python
    • Unterschied Funktionen vs. Methoden
    • Datenstrukturen in Python (number, tuple, list, dictionary, string)
    • Überblick und wichtige Methoden zu den Datenstrukturen
    • Unterschied list vs. tuple
    • Die Besonderheit des Wertes NaN
    • Wann benutze ich welche Klammer [], (), {}?
    • List comprehension
  • Einführung in das Data Science Paket pandas
    • Elemente eines pandas data.frame
    • Eine Zeile ansprechen, hinzufügen, löschen und verändern
    • Eine Spalte ansprechen, hinzufügen, löschen und verändern
    • Boolean indexing
    • Ein leeres data.frame erstellen
    • Überblick über Methoden, ein data.frame anzupassen (Spaltennamen ändern, Werte ersetzen, ein data.frame sortieren, ein data.frame nach einer kategorischen Variable gruppieren, randomisiert Zeilen aus einem data.frame auswählen)
  • Grundlegende Statistiken mit pandas
    • Überblick über Statistiken, die ich mit einem data.frame berechnen kann (Anzahl an gültigen Beobachtungen, Summe, Mittelwert, Median, Minimum, Maximum, Varianz,...)
    • Eine Kreuztabelle (Kontingenztafel) berechnen
    • Fehlende Werte ergänzen
    • Logische Operatoren
  • Daten einlesen
    • Das Arbeitsverzeichnis in Python setzen
    • Ein CSV einlesen und schreiben und Überblick über die nützlichsten Parameter hierfür
    • Python's pickle modul zum Speichern von Python Objekten
    • Verschiedene Datentypen konvertieren (integer, unsigned integer, float, string)
  • Visualisierung mit matplotlib und seaborn
    • Die Hauptelemente beim Plotten mit matplotlib
    • Einen Plot anpassen (x- und y-Achse ändern, Beschriftungen, Legende und Titel ändern) und speichern
    • Auswahl von Farben
    • Subplots erstellen
    • Erstellen von Scatterplot, Linienplot, Barplot, (gruppiertes) Histogram, Boxplot
  • Control Flows
    • Die range() Funktion
    • Eine eigene Funktion schreiben
    • Default Parameter in einer Funktion setzen
    • For Schleifen
    • If-Else Bedingungen
    • While Schleife
    • Logische Vergleichsoperatoren
    • Zuweisungsoperatoren
  • Überblick über Machine Learning
    • Was ist Machine Learning
    • Die Einteilung von Algorithmen im Machine Learning (supervised Learning - unsupervised learning - reinforcement learning)
    • Overfitting, Train-Test-Split und cross-validation (Kreuzvalidierung)
  • Machine Learning Algorithmen (Theorie und Praxis) 
    • Einführung in den Algorithmus (Lineare Regression, Entscheidungsbaum, Logistische)
    • Train-Test Split der Daten
    • Umsetzung des Algorithmus in Python
    • Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
    • Cross-validation (Kreuzvalidierung)
  • Weitere Machine Learning Algorithmen in Python
    • Erklärung von (SVM), Random Forest und K-means
    • Umsetzung dieser Algorithmen in Python
    • Validieren der Ergebnisse
    • Cross-validation (Kreuzvalidierung)
Jetzt Buchen
Köln 2 Tage Special
Analytics Architekturen für Big Data, BI, DWH und AI
Kursbeschreibung
In zwei intensiven Schulungstagen lernen Sie unterschiedliche Architekturvarianten kennen. Mit diesem Grundlagenwissen können Sie Architekturalternativen bewerten, Risiken einschätzen und eigene Entwürfe einbringen.
Ziele
Nach der Schulung kennen Sie die aktuellen Technologien für analytische Systeme und wissen, welche Systeme für den passenden Unternehmenskontext geeignet sind.
Inhalte
Folgende Themen werden behandelt:
  • Data-Warehouse-Architekturen
  • Datenmodelle
  • Data-Warehouse-Prozesse
  • Reporting und Analyse
  • Moderne Datenhaltungskonzepte
  • Big-Data-Architekturen
  • Data Lake und Big Data Warehouse
Jetzt Buchen
Köln 4 Tage Special
Data Science mit RapidMiner: Grundlagen und fortgeschrittene Themen für Analysten
Kursbeschreibung
Die Schulungen sind auch geeignet, um neue Data Scientists auszubilden oder erfahrenen Data Scientists den Umstieg auf die Plattform RapidMiner zu erleichtern.
Ziele
Nachdem Sie die Schulung besucht haben können Sie durch Ablegen einer Prüfung das Zertifikat „RapidMiner Analyst “ erwerben, mit dem Sie Ihre neue Qualifizierung nach außen sichtbar machen.
Inhalte
Grundlegende Methoden der Datenaufbereitung, Erstellen analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation von Modellen im Hinblick auf verschiedene Gütekriterien, Weiterführende Methoden der Datenaufbereitung, Erstellen komplexer, analytischer Vorhersagemodelle, Anwendung analytischer Vorhersagemodelle, Evaluation und Optimierung von Modellen im Hinblick auf verschiedene Gütekriterien
Jetzt Buchen
Köln 5 Tage Practitioner
Praxiswoche – Data Science mit Python
Kursbeschreibung
Die Teilnehmer erhalten einen Einstieg in Python und Pandas, um Daten zu analysieren und Machine Learning Algorithmen einsetzen zu können. Die durchgängigen Praxisbeispiele mit vielen Übungen führen wie ein roter Faden durch diese Schulung.
Ziele
Nach dem Seminar sind Sie in der Lage Pandas als Data Science Tool für Ihre Projekte zu nutzen. Darüber hinaus lernen Sie die Umsetzung grundlegender Data Science Schritte in Python kennen, sodass sie Ihre Projekte auch direkt in einer Programmiersprache umsetzen können.
Inhalte
Datenstrukturen in Python, Einführung in das Data Science Paket pandas (Daten einlesen, Data handling), grundlegende Statistiken mit pandas, Algorithmen im Data Science
Jetzt Buchen
Köln 2 Tage Practitioner
Einstieg in Data Science mit Pandas
Kursbeschreibung
Das Python-Paket Pandas ist als universeller Werkzeugkasten für den Bereich Data Science nicht mehr wegzudenken. Die 2-tägige Schulung vermittelt die Grundlagen und Funktionsweisen dieses mächtigen Tools und gibt Hilfestellung für einen optimalen Einsatz von Pandas im Unternehmenskontext.
Ziele
Nach der Schulung wissen Sie, wie Sie Datenaufbereitung, Datenaggregation und Datenvisualisierung mit Pandas umsetzen und haben anhand von praktischen Beispielen ein Gefühl für den Einsatz von Pandas im Unternehmenskontext erhalten.
Inhalte
Folgende Themen werden behandelt:
  • Pandas im Überblick
    • Datenaufbereitung
    • Datenaggregation
    • Datenvisualisierung
  • Einführung in Pandas
    • Aggregatfunktionen
    • Zeitreihen
    • Geodaten
    • Best Practices
Jetzt Buchen
Köln 3 Tage Practitioner
Jupyter Notebook Infrastruktur für effiziente Data Science Workflows
Kursbeschreibung
Wer als Datenanalyst tätig ist, wird an Jupyter kaum vorbei kommen. Die 3-tägige Schulung gibt einen Überblick über iPython und den Funktionsumfang von Jupyter. Der Fokus der Schulung liegt auf dem Aufbau einer Infrastruktur auf Basis von Jupyter Notebooks, die den Arbeitsalltag eines Datanalysten deutlich erleichtert.
Ziele
Nach der Schulung können Sie über Jupyter mit Notebooks arbeiten und können auf Basis einer für Datenanalysten zugeschnittenen Infrastruktur effizienter im Projektalltag arbeiten.
Inhalte
Folgende Themen werden behandelt:
  • Einführung, Überblick
    • iPython und Jupyter
    • JupyterHub
    • nbconvert und nbviewer
    • Kernels
  • Notebooks erweitern
    • Widgets
    • nbextensions
    • Dashboards
    • Notebooks einbetten
  • Praxis mit Jupyter
    • Reproduzierbare Notebooks
    • Parametrisierung
    • Zeitplanung
    • Refactoring
Jetzt Buchen

Die Data Science Business Akademie ist eine Initiative der Informationsfabrik, des Instituts für Angewandte Informatik der Knowledge Foundation @ Reutlingen University und der GFU Cyrus AG mit dem Ziel, Unternehmen in ihrem Bestreben der Weiterbildung im Bereich Predictive Analytics, Artificial Intelligence und Big Data zu bündeln und qualitativ auszubauen.

Dabei bieten wir Ihnen eine langfristige, vertrauensvolle und partnerschaftliche Zusammenarbeit.

Unsere Referenten

Über 20 Referenten, Dozenten und Trainer sind für die Data Science Business Akademie tätig.

Sie alle verfügen über einen umfangreichen Erfahrungshorizont, methodische Kompetenz und langjährige Praxiserfahrung in ihrem jeweiligen Fachgebiet. Ein Auszug:

Dr. Thomas Wörmann

Artificial Intelligence und Business Analytics

Dr. Thorben Jensen

Business Analytics und Data Science

Dr. Michael Hoschek

Machine Learning und Business Analytics

Tobias Rippel

Machine Learning und Prognosemodelle

Ulrich Zellbeck

Data Science, Machine Learning, Data Warehouse, Big Data, Business Intelligence

Prof. Dr. Heike Trautmann

Prof. Dr. Heike Trautmann

Data Science, Social Media Analytics

Dr. Pascal Kerschke

Dr. Pascal Kerschke

Machine Learning und Data Science

Dr. Mike Preuß

Dr. Mike Preuß

Data Science und Machine Learning

Dr. Thomas Frontzek

Dr. Thomas Frontzek

Statistische Analysen und Neuronale Netze

Jan Mathias Köhler

Jan Mathias Köhler

Data Science, Data Mining, Deep Learning

IHRE VORTEILE MIT DER DATA SCIENCE BUSINESS AKADEMIE

Die Data Science Business Akademie bietet eine Auswahl von mehr als zwanzig „Hands-on“-Workshops auf drei Zertifizierungslevels. Das modulare System lässt eine flexible Themen- und Terminwahl zu und bleibt dabei jederzeit praxisnah.

Modulares System

Die flexible Themen- und Terminwahl garantiert, dass nur das für Sie relevante Fachwissen vermittelt wird.

Praxisnah

Die Referenten der Data Science Business Akademie vermitteln ihr Fachwissen in praktischen, direkt anwendbaren Übungen.

Drei starke Partner

Drei Partner garantieren praxisnahes Lernen, berufsbegleitende Weiterbildung und ein professionelles Weiterbildungsmanagement.

Ausführlich

Die Data Science Business Akademie vermittelt fachkundige Einblicke und ist dabei ausführlicher als vergleichbare Angebote.

Zertifizierung

Stellen Sie sich Ihren persönlichen Zertifizierungsplan zusammen und gehen Sie den Weg zum Data Science Expert.

Anwendungsorientiert

Die Data Science Business Akademie verbindet theoretische Grundlagen mit wirtschaftlichen Fragestellungen und anwendungsorientierten Projekten.

Unterlagen und Technik sehr gut. Erwartungen mehr als erfüllt. Qualität bestens!

Horst K.

Gute Kombination aus Theorie und Anwendung. Meiner Erwartungen an Data Science und R wurden erfüllt.

(ohne Angabe)

Die Kombination von perfekt organisierter Schulung mit sehr interessantem Themenbereich ist unschlagbar.

Sabine B.

Gute Strukturierung, Angeregte Diskussionen zum Thema, fachlich gute Erläuterungen und Beispiele

Thomas R.

Hat sich echt gelohnt

Heike Thomas,
TUI InfoTec GmbH

Die Schulung hat Spaß gemacht, war anschaulich und vor allem wegen des großen Praxisanteils sehr hilfreich

Andreas Ochs

Rundum top

Stephan Frenzel,
Kybeidos GmbH

Sehr professionelle Schulung, immer wieder gerne.

Stefanie de Buhr,
Erste Abwicklungsanstalt

Unser Standort

Data Science Seminare in Köln

Die Seminare am Standort Köln finden in ausgesprochen netter und persönlicher Atmosphäre in den Räumen der GFU statt – zentral gelegen und äußerst verkehrsgünstig. Das erleichtert die Anreise und erhöht so die Nettoseminarzeit erheblich.

Unsere Partner

Drei starke Partner bilden das Fundament für die Data Science Business Akademie: sie garantieren praxisnahes Lernen, berufsbegleitende Weiterbildung und ein professionelles Weiterbildungsmanagement.

Die Informationsfabrik ist auf die Bereiche Predictive Analytics, Business Analytics, Business Intelligence, Big Data sowie Data Science spezialisiert. Sie stellt wertvolles und praxisnahes Expertenwissen für die Zertifizierung zur Verfügung.

informationsfabrik.de

Das Institut für Angewandte Informatik (IAI) gehört zur Knowledge Foundation @ Reutlingen University. Die Professoren sind renommierte Wissenschaftler mit langjähriger Erfahrung. Das IAI als Institut der Knowledge Foundation @ Reutlingen University übernimmt die Ausstellung des Zertifikats.

iai-reutlingen.de

knowledge-reutlingen.de

Die GFU ist mit mehr als 1.350 Seminarthemen, 100 Dozenten Ihr Partner für IT in der D-A-CH-Region. Die GFU übernimmt das Weiterbildungsmanagement und die Durchführung der Seminare.

gfu.net

Ihre Nachricht!

Ob online oder telefonisch – unsere Experten für Data Science Seminare beraten Sie bei der Entwicklung der für Sie idealen Lernlösung.
Sprechen Sie uns an.

Köln

Am Grauen Stein 27
51105 Köln
Telefon +49 221 828090
E-Mail info@gfu.net