84

Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Citizen Data Science

Balázs Bárány

Linuxwochen Wien 2016

29. April 2016

Citizen Data Science Linuxwochen Wien 2016

Page 2: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Inhalt

Einführung: Data Science

Werkzeuge und Methoden

Citizen Data ScienceDaten holenDaten verstehenDaten-VorverarbeitungPrädiktive ModellierungAnwendungen im privaten Kontext

Zusammenfassung

Citizen Data Science Linuxwochen Wien 2016

Page 3: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Über mich

Selbständiger Data Scientist � https://datascientist.at

SCO2T � Roller-Sharing in Wien � https://sco2t.com

Citizen Data Science Linuxwochen Wien 2016

Page 4: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Über mich

Selbständiger Data Scientist � https://datascientist.at

SCO2T � Roller-Sharing in Wien � https://sco2t.com

Citizen Data Science Linuxwochen Wien 2016

Page 5: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

�Sexiest job of the 21st century�

I Sagen Google, LinkedIn, ...

I Wer ist ein Data Scientist?

Citizen Data Science Linuxwochen Wien 2016

Page 6: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

�Sexiest job of the 21st century�

I Sagen Google, LinkedIn, ...

I Wer ist ein Data Scientist?

Citizen Data Science Linuxwochen Wien 2016

Page 7: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Data Science Venn Diagram

(c) Drew Conway, 2010. CC-BY-NC

Citizen Data Science Linuxwochen Wien 2016

Page 8: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Was machen Data Scientists?

Citizen Data Science Linuxwochen Wien 2016

Page 9: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Aufgaben

I Daten holen und zusammenführen

I Verknüpfen und umformen für Analytik

I Analysieren und visualisieren

I Vorhersagen und Handlungen empfehlen

I Operationalisieren

I Big Data?

Citizen Data Science Linuxwochen Wien 2016

Page 10: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Aufgaben

I Daten holen und zusammenführen

I Verknüpfen und umformen für Analytik

I Analysieren und visualisieren

I Vorhersagen und Handlungen empfehlen

I Operationalisieren

I Big Data?

Citizen Data Science Linuxwochen Wien 2016

Page 11: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Aufgaben

I Daten holen und zusammenführen

I Verknüpfen und umformen für Analytik

I Analysieren und visualisieren

I Vorhersagen und Handlungen empfehlen

I Operationalisieren

I Big Data?

Citizen Data Science Linuxwochen Wien 2016

Page 12: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Aufgaben

I Daten holen und zusammenführen

I Verknüpfen und umformen für Analytik

I Analysieren und visualisieren

I Vorhersagen und Handlungen empfehlen

I Operationalisieren

I Big Data?

Citizen Data Science Linuxwochen Wien 2016

Page 13: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Aufgaben

I Daten holen und zusammenführen

I Verknüpfen und umformen für Analytik

I Analysieren und visualisieren

I Vorhersagen und Handlungen empfehlen

I Operationalisieren

I Big Data?

Citizen Data Science Linuxwochen Wien 2016

Page 14: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Aufgaben

I Daten holen und zusammenführen

I Verknüpfen und umformen für Analytik

I Analysieren und visualisieren

I Vorhersagen und Handlungen empfehlen

I Operationalisieren

I Big Data?

Citizen Data Science Linuxwochen Wien 2016

Page 15: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

The Data Mining process

Cross Industry Standard Process for Data Mining (Kenneth Jensen/Wikimedia Commons)

Citizen Data Science Linuxwochen Wien 2016

Page 16: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Fehlende Data Scientists

I Prognosen: 50 % der Stellen nicht besetzbar

I Ausbildung kommt nicht nach

I Citizen Data Scientists

Citizen Data Science Linuxwochen Wien 2016

Page 17: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Fehlende Data Scientists

I Prognosen: 50 % der Stellen nicht besetzbar

I Ausbildung kommt nicht nach

I Citizen Data Scientists

Citizen Data Science Linuxwochen Wien 2016

Page 18: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Werkzeuge und Methoden

Werkzeuge und Methoden

Citizen Data Science Linuxwochen Wien 2016

Page 19: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Scripting und Programmierung

I R

I Python mit Modulen

I Octave/Matlab, andere mathematische Sprachen

I Hadoop, Big Data libraries (Java)

I Cloud services

Citizen Data Science Linuxwochen Wien 2016

Page 20: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Gra�sche Werkzeuge

I (teilweise) Open Source: RapidMiner, KNIME, Orange

I Open-Source-Data-Warehouse-Werkzeuge mit Erweiterungenfür Analytik: Pentaho, Talend

I Kommerzielle Werkzeuge, z. B. SAS, IBM SPSS

I Hadoop-Newcomer: z. B. Datameer

Citizen Data Science Linuxwochen Wien 2016

Page 21: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Infrastruktur

I Datenbanken und Datenspeicher

I Relational, NoSQLI Hadoop-ClusterI In-memory

I Datenströme

I Unstrukturiert: Text, Bilder, Video, Audio, ...

I Web APIs

I Open Data

Citizen Data Science Linuxwochen Wien 2016

Page 22: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen und zusammenführen

I Daten im �Rohformat�

I Join, Aggregierung, Filterung, Berechnung, ...

I Säuberung

I Fehlende WerteI Ausreiÿer

I Ergebnis: Für Analytik geeignete Tabelle

Citizen Data Science Linuxwochen Wien 2016

Page 23: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen und zusammenführen

I Daten im �Rohformat�

I Join, Aggregierung, Filterung, Berechnung, ...

I Säuberung

I Fehlende WerteI Ausreiÿer

I Ergebnis: Für Analytik geeignete Tabelle

Citizen Data Science Linuxwochen Wien 2016

Page 24: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen und zusammenführen

I Daten im �Rohformat�

I Join, Aggregierung, Filterung, Berechnung, ...

I Säuberung

I Fehlende WerteI Ausreiÿer

I Ergebnis: Für Analytik geeignete Tabelle

Citizen Data Science Linuxwochen Wien 2016

Page 25: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen und zusammenführen

I Daten im �Rohformat�

I Join, Aggregierung, Filterung, Berechnung, ...

I Säuberung

I Fehlende WerteI Ausreiÿer

I Ergebnis: Für Analytik geeignete Tabelle

Citizen Data Science Linuxwochen Wien 2016

Page 26: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

I Zielvariable bekannt?

I Supervised/unsupervised (überwacht/unüberwacht)

I Klassi�kation (supervised): Vorhersage einer Kategorie

I Regression (supervised): Vorhersage eines numerischen Wertes

I Clustering (unsupervised): Automatische Gruppierung

I Assoziationsanalyse, Ausreiÿererkennung, Zeitreihen-Prognose,...

Citizen Data Science Linuxwochen Wien 2016

Page 27: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

I Zielvariable bekannt?

I Supervised/unsupervised (überwacht/unüberwacht)

I Klassi�kation (supervised): Vorhersage einer Kategorie

I Regression (supervised): Vorhersage eines numerischen Wertes

I Clustering (unsupervised): Automatische Gruppierung

I Assoziationsanalyse, Ausreiÿererkennung, Zeitreihen-Prognose,...

Citizen Data Science Linuxwochen Wien 2016

Page 28: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

I Zielvariable bekannt?

I Supervised/unsupervised (überwacht/unüberwacht)

I Klassi�kation (supervised): Vorhersage einer Kategorie

I Regression (supervised): Vorhersage eines numerischen Wertes

I Clustering (unsupervised): Automatische Gruppierung

I Assoziationsanalyse, Ausreiÿererkennung, Zeitreihen-Prognose,...

Citizen Data Science Linuxwochen Wien 2016

Page 29: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Operationalisierung

I Anwendung des Modells auf neue Daten ergibt Vorhersage

I (+ Kon�denz)

I Im ERP- oder CRM-System speichern

I Aufmerksam machen (E-Mail, Popup)

I Markieren (z. B. E-Mail als Spam)

I Transaktion unterbrechen

I Waren nachbestellen

I ...

Citizen Data Science Linuxwochen Wien 2016

Page 30: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Operationalisierung

I Anwendung des Modells auf neue Daten ergibt Vorhersage

I (+ Kon�denz)

I Im ERP- oder CRM-System speichern

I Aufmerksam machen (E-Mail, Popup)

I Markieren (z. B. E-Mail als Spam)

I Transaktion unterbrechen

I Waren nachbestellen

I ...

Citizen Data Science Linuxwochen Wien 2016

Page 31: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Operationalisierung

I Anwendung des Modells auf neue Daten ergibt Vorhersage

I (+ Kon�denz)

I Im ERP- oder CRM-System speichern

I Aufmerksam machen (E-Mail, Popup)

I Markieren (z. B. E-Mail als Spam)

I Transaktion unterbrechen

I Waren nachbestellen

I ...

Citizen Data Science Linuxwochen Wien 2016

Page 32: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Citizen Data Science

Data Science für Alle

Citizen Data Science Linuxwochen Wien 2016

Page 33: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Mein Werkzeugkasten

I Datenbank: PostgreSQL

I Features, Erweiterungen, Ökosystem, ...

I Programmiersprache: R

I Geschmackssache

I Gra�sches Data-Mining-Tool: RapidMiner

I Für Geodaten: QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 34: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Mein Werkzeugkasten

I Datenbank: PostgreSQL

I Features, Erweiterungen, Ökosystem, ...

I Programmiersprache: R

I Geschmackssache

I Gra�sches Data-Mining-Tool: RapidMiner

I Für Geodaten: QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 35: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Mein Werkzeugkasten

I Datenbank: PostgreSQL

I Features, Erweiterungen, Ökosystem, ...

I Programmiersprache: R

I Geschmackssache

I Gra�sches Data-Mining-Tool: RapidMiner

I Für Geodaten: QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 36: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Mein Werkzeugkasten

I Datenbank: PostgreSQL

I Features, Erweiterungen, Ökosystem, ...

I Programmiersprache: R

I Geschmackssache

I Gra�sches Data-Mining-Tool: RapidMiner

I Für Geodaten: QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 37: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Daten holen

Datenquellen

Citizen Data Science Linuxwochen Wien 2016

Page 38: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Wetterdaten von Weather Underground

I Gratis-API

I Vorhersage, aktuelles Wetter, historische Daten

I JSON- und XML-Format verfügbar

I Demo mit RapidMiner

Citizen Data Science Linuxwochen Wien 2016

Page 39: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Wetterdaten von Weather Underground

I Gratis-API

I Vorhersage, aktuelles Wetter, historische Daten

I JSON- und XML-Format verfügbar

I Demo mit RapidMiner

Citizen Data Science Linuxwochen Wien 2016

Page 40: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Wien: Bezirksgrenzen

I Open Data, in verschiedenen Formaten verfügbar

I Bezirksgrenzen als Polygone; Fläche, Umfang

Beispiel

Einlesen in PostgreSQL in einem Befehl:COPY bezirksgrenzen_wien

FROM PROGRAM 'curl -s "http://data.wien.gv.at/daten/geo?..."'

WITH CSV delimiter ',' HEADER;

Citizen Data Science Linuxwochen Wien 2016

Page 41: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Wien: Bezirksgrenzen

I Open Data, in verschiedenen Formaten verfügbar

I Bezirksgrenzen als Polygone; Fläche, Umfang

Beispiel

Einlesen in PostgreSQL in einem Befehl:COPY bezirksgrenzen_wien

FROM PROGRAM 'curl -s "http://data.wien.gv.at/daten/geo?..."'

WITH CSV delimiter ',' HEADER;

Citizen Data Science Linuxwochen Wien 2016

Page 42: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Bezirksgrenzen - Fortsetzung

I Geodaten noch im Textformat

I Umwandlung in echte Geo-Objekte mit PostGIS oder QGIS

Beispiel

PostGIS:ALTER TABLE bezirksgrenzen_wien

ADD COLUMN geo geometry;

UPDATE bezirksgrenzen_wien

SET geo = ST_GeomFromText(shape);

I Demo mit QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 43: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Bezirksgrenzen - Fortsetzung

I Geodaten noch im Textformat

I Umwandlung in echte Geo-Objekte mit PostGIS oder QGIS

Beispiel

PostGIS:ALTER TABLE bezirksgrenzen_wien

ADD COLUMN geo geometry;

UPDATE bezirksgrenzen_wien

SET geo = ST_GeomFromText(shape);

I Demo mit QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 44: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten holen

Bezirksgrenzen - Fortsetzung

I Geodaten noch im Textformat

I Umwandlung in echte Geo-Objekte mit PostGIS oder QGIS

Beispiel

PostGIS:ALTER TABLE bezirksgrenzen_wien

ADD COLUMN geo geometry;

UPDATE bezirksgrenzen_wien

SET geo = ST_GeomFromText(shape);

I Demo mit QGIS

Citizen Data Science Linuxwochen Wien 2016

Page 45: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten verstehen

Daten verstehen

Data Understanding

Citizen Data Science Linuxwochen Wien 2016

Page 46: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten verstehen

Data understanding

I Erster Schritt nach dem Import neuer Daten

I Was ist enthalten?

I Datenqualität

I Datenmenge

I Schlüssel zu anderen Datenbeständen

Citizen Data Science Linuxwochen Wien 2016

Page 47: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten verstehen

Data understanding

I Erster Schritt nach dem Import neuer Daten

I Was ist enthalten?

I Datenqualität

I Datenmenge

I Schlüssel zu anderen Datenbeständen

Citizen Data Science Linuxwochen Wien 2016

Page 48: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten verstehen

Data understanding

I Erster Schritt nach dem Import neuer Daten

I Was ist enthalten?

I Datenqualität

I Datenmenge

I Schlüssel zu anderen Datenbeständen

Citizen Data Science Linuxwochen Wien 2016

Page 49: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten verstehen

Visualisierung (RapidMiner)

Citizen Data Science Linuxwochen Wien 2016

Page 50: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten verstehen

Visualisierung (R)

Citizen Data Science Linuxwochen Wien 2016

Page 51: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Daten-Vorverarbeitung

Vorverarbeitung = Preprocessing

Bis zu 80 % der Projektzeit!

Citizen Data Science Linuxwochen Wien 2016

Page 52: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Daten-Vorverarbeitung

I Hereinkommende Daten selten �fertig�

I Zusammenführung unterschiedlicher Datensätze

I Filtern, Bereinigung

I Erstellung/Berechnung neuer Attribute

I Aggregierung

Citizen Data Science Linuxwochen Wien 2016

Page 53: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Daten-Vorverarbeitung

I Hereinkommende Daten selten �fertig�

I Zusammenführung unterschiedlicher Datensätze

I Filtern, Bereinigung

I Erstellung/Berechnung neuer Attribute

I Aggregierung

Citizen Data Science Linuxwochen Wien 2016

Page 54: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Daten-Vorverarbeitung

I Hereinkommende Daten selten �fertig�

I Zusammenführung unterschiedlicher Datensätze

I Filtern, Bereinigung

I Erstellung/Berechnung neuer Attribute

I Aggregierung

Citizen Data Science Linuxwochen Wien 2016

Page 55: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Daten-Vorverarbeitung

I Hereinkommende Daten selten �fertig�

I Zusammenführung unterschiedlicher Datensätze

I Filtern, Bereinigung

I Erstellung/Berechnung neuer Attribute

I Aggregierung

Citizen Data Science Linuxwochen Wien 2016

Page 56: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Beispiel in RapidMiner

I 2 Datensätze von OGD Wien

I Bevölkerungsprognose pro BezirkI Bezirksdaten

I Prognose nach Geschlecht gruppiert => aggregieren

I Über Bezirkscode verknüpfen

I Prognostizierte Bevölkerungsdichte berechnen

I Demo

Citizen Data Science Linuxwochen Wien 2016

Page 57: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Beispiel in RapidMiner

I 2 Datensätze von OGD Wien

I Bevölkerungsprognose pro BezirkI Bezirksdaten

I Prognose nach Geschlecht gruppiert => aggregieren

I Über Bezirkscode verknüpfen

I Prognostizierte Bevölkerungsdichte berechnen

I Demo

Citizen Data Science Linuxwochen Wien 2016

Page 58: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Beispiel in RapidMiner

I 2 Datensätze von OGD Wien

I Bevölkerungsprognose pro BezirkI Bezirksdaten

I Prognose nach Geschlecht gruppiert => aggregieren

I Über Bezirkscode verknüpfen

I Prognostizierte Bevölkerungsdichte berechnen

I Demo

Citizen Data Science Linuxwochen Wien 2016

Page 59: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Beispiel in RapidMiner

I 2 Datensätze von OGD Wien

I Bevölkerungsprognose pro BezirkI Bezirksdaten

I Prognose nach Geschlecht gruppiert => aggregieren

I Über Bezirkscode verknüpfen

I Prognostizierte Bevölkerungsdichte berechnen

I Demo

Citizen Data Science Linuxwochen Wien 2016

Page 60: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Daten-Vorverarbeitung

Beispiel in RapidMiner

I 2 Datensätze von OGD Wien

I Bevölkerungsprognose pro BezirkI Bezirksdaten

I Prognose nach Geschlecht gruppiert => aggregieren

I Über Bezirkscode verknüpfen

I Prognostizierte Bevölkerungsdichte berechnen

I Demo

Citizen Data Science Linuxwochen Wien 2016

Page 61: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung

Prädiktive Modellierung

Citizen Data Science Linuxwochen Wien 2016

Page 62: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung

I Modell aufbauen (lassen)

I Zielvariable

I Modell auf neue Daten anwenden

I Vorhersage, Kon�denz

I Validierung

Citizen Data Science Linuxwochen Wien 2016

Page 63: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung

I Modell aufbauen (lassen)

I Zielvariable

I Modell auf neue Daten anwenden

I Vorhersage, Kon�denz

I Validierung

Citizen Data Science Linuxwochen Wien 2016

Page 64: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung

I Modell aufbauen (lassen)

I Zielvariable

I Modell auf neue Daten anwenden

I Vorhersage, Kon�denz

I Validierung

Citizen Data Science Linuxwochen Wien 2016

Page 65: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Richtige Validierung

I Modell nicht auf Eingangsdaten anwenden!

I Split Validation

I Cross Validation

I Demo in RapidMiner

Citizen Data Science Linuxwochen Wien 2016

Page 66: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Richtige Validierung

I Modell nicht auf Eingangsdaten anwenden!

I Split Validation

I Cross Validation

I Demo in RapidMiner

Citizen Data Science Linuxwochen Wien 2016

Page 67: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Richtige Validierung

I Modell nicht auf Eingangsdaten anwenden!

I Split Validation

I Cross Validation

I Demo in RapidMiner

Citizen Data Science Linuxwochen Wien 2016

Page 68: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Richtige Validierung

I Modell nicht auf Eingangsdaten anwenden!

I Split Validation

I Cross Validation

I Demo in RapidMiner

Citizen Data Science Linuxwochen Wien 2016

Page 69: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung � Fortsetzung

I Vergleich verschiedener Lernverfahren

I Parameteroptimierung

I Variation der Vorverarbeitung

I Attributselektion

I Attributgenerierung

Citizen Data Science Linuxwochen Wien 2016

Page 70: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung � Fortsetzung

I Vergleich verschiedener Lernverfahren

I Parameteroptimierung

I Variation der Vorverarbeitung

I Attributselektion

I Attributgenerierung

Citizen Data Science Linuxwochen Wien 2016

Page 71: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung � Fortsetzung

I Vergleich verschiedener Lernverfahren

I Parameteroptimierung

I Variation der Vorverarbeitung

I Attributselektion

I Attributgenerierung

Citizen Data Science Linuxwochen Wien 2016

Page 72: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Prädiktive Modellierung � Fortsetzung

I Vergleich verschiedener Lernverfahren

I Parameteroptimierung

I Variation der Vorverarbeitung

I Attributselektion

I Attributgenerierung

Citizen Data Science Linuxwochen Wien 2016

Page 73: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Deployment

I Operationalisierung der Ergebnisse

I Automatisierte Vorverarbeitung und Vorhersagen

I Regelmäÿige Evaluierung und Optimierung

Citizen Data Science Linuxwochen Wien 2016

Page 74: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Deployment

I Operationalisierung der Ergebnisse

I Automatisierte Vorverarbeitung und Vorhersagen

I Regelmäÿige Evaluierung und Optimierung

Citizen Data Science Linuxwochen Wien 2016

Page 75: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Prädiktive Modellierung

Deployment

I Operationalisierung der Ergebnisse

I Automatisierte Vorverarbeitung und Vorhersagen

I Regelmäÿige Evaluierung und Optimierung

Citizen Data Science Linuxwochen Wien 2016

Page 76: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Anwendungen im privaten Kontext

Anwendungen im privaten Kontext

I Lebensgestaltung: Open Data, OpenStreetMap

I Kontrolle: Open Government Data, Firmen-Verö�entlichungen

I Hobbies

I Wetter, Geodaten, GPS-Tracks, ...I ...

I �Egometrics�, �Quanti�ed self�

I Fitness- und Gesundheitstracker, Smart Meter, Smart VehicleI Internet of Things

Citizen Data Science Linuxwochen Wien 2016

Page 77: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Anwendungen im privaten Kontext

Anwendungen im privaten Kontext

I Lebensgestaltung: Open Data, OpenStreetMap

I Kontrolle: Open Government Data, Firmen-Verö�entlichungen

I Hobbies

I Wetter, Geodaten, GPS-Tracks, ...I ...

I �Egometrics�, �Quanti�ed self�

I Fitness- und Gesundheitstracker, Smart Meter, Smart VehicleI Internet of Things

Citizen Data Science Linuxwochen Wien 2016

Page 78: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Anwendungen im privaten Kontext

Anwendungen im privaten Kontext

I Lebensgestaltung: Open Data, OpenStreetMap

I Kontrolle: Open Government Data, Firmen-Verö�entlichungen

I Hobbies

I Wetter, Geodaten, GPS-Tracks, ...I ...

I �Egometrics�, �Quanti�ed self�

I Fitness- und Gesundheitstracker, Smart Meter, Smart VehicleI Internet of Things

Citizen Data Science Linuxwochen Wien 2016

Page 79: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Anwendungen im privaten Kontext

Anwendungen im privaten Kontext

I Lebensgestaltung: Open Data, OpenStreetMap

I Kontrolle: Open Government Data, Firmen-Verö�entlichungen

I Hobbies

I Wetter, Geodaten, GPS-Tracks, ...I ...

I �Egometrics�, �Quanti�ed self�

I Fitness- und Gesundheitstracker, Smart Meter, Smart VehicleI Internet of Things

Citizen Data Science Linuxwochen Wien 2016

Page 80: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Zusammenfassung

I Data Science � ein spannendes Thema

I Frei verfügbare, einfach bedienbare Werkzeuge

I Vorgehensweise

I Anwendung im privaten Bereich

Citizen Data Science Linuxwochen Wien 2016

Page 81: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Zusammenfassung

I Data Science � ein spannendes Thema

I Frei verfügbare, einfach bedienbare Werkzeuge

I Vorgehensweise

I Anwendung im privaten Bereich

Citizen Data Science Linuxwochen Wien 2016

Page 82: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Zusammenfassung

I Data Science � ein spannendes Thema

I Frei verfügbare, einfach bedienbare Werkzeuge

I Vorgehensweise

I Anwendung im privaten Bereich

Citizen Data Science Linuxwochen Wien 2016

Page 83: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Zusammenfassung

I Data Science � ein spannendes Thema

I Frei verfügbare, einfach bedienbare Werkzeuge

I Vorgehensweise

I Anwendung im privaten Bereich

Citizen Data Science Linuxwochen Wien 2016

Page 84: Citizen Data Science...Selbständiger Data Scientist SCO2T Roller-Sharing in Wien Citizen Data Science Linuxwochen Wien 2016 ÜberEinführung: Data ScienceWerkzeuge und Methoden Citizen

Über Einführung: Data Science Werkzeuge und Methoden Citizen Data Science Zusammenfassung

Fragen?

I Balázs Bárány, <[email protected]>

I https://datascientist.at/

Citizen Data Science Linuxwochen Wien 2016