© FernUniversität in Hagen / Horst Pierdolla
Big Data: Neue Taxonomien in Forschung und Alltag
10. Juni 2015
Wissenschaftsgespräche, FernUniversität in Hagen
Karolin Eva Kappler
FernUniversität in Hagen - Institut für Soziologie
Soziologie II – Soziologische Gegenwartsdiagnosen
Gliederung
1. Big Data – Annäherung und Abgrenzung
2. Empirisches Beispiel 1: Selbstvermessung
3. Empirisches Beispiel 2: Digital Humanitarians
4. Schlussfolgerungen
11.06.2015 Folie 2
Wertschöpfungs- und Kontrollpotential, basierend auf
ihrem vernetzten Charakter
Hauptrohstoff in der Informations- bzw.
Wissensgesellschaft (Mayer-Schönberger/Cukier 2013,
182), zu vergleichen mit der Rolle von Erdöl in der
Industriegesellschaft
11.06.2015 Folie 3
Big Data soll hierbei verstanden werden als Praktik
„Daten zu sammeln, Software nach Mustern suchen zu
lassen und anschlieβend aus den Ergebnissen die
richtigen Schlüsse zu ziehen“ (Geiselberger und
Moorstedt 2013, 9).
11.06.2015 Folie 4
Big Data:
Valuation Studies, Soziokalkulation und Taxonomien
Valuation Studies:
- In welcher Weise „objects become amenable to valuation and trade through
the market“? (Lamont 2012: 203)
- Fourcade (2011: 1721): „How do we attribute a monetary value to intangible
things?“
Soziokalkulation (Vormbusch 2012): Ausweitung und Formveränderung
kalkulativer Praktiken
Bewertung als Kulturtechnik der Konstruktion und Zuweisung von Wert
11.06.2015 Folie 7
11.06.2015 Folie 8
Erstes Beispiel:
Selbstvermessung
DFG-Projekt: Taxonomien des Selbst.
Zur Genese und Verbreitung kalkulativer
Praktiken der Selbstinspektion
LG Soziologie II: Soziologische
Gegenwartsdiagnosen
Explorative Untersuchungen
2013 Quantified Self Europe Conference in Amsterdam
21 Interviews online verfügbar : http://quantifiedself.com/2013/05/the-
2013-quantified-self-europe-conference-roundup/
2014 Quantified Self Europe Conference in Amsterdam
8 qualitative Interviews mit Quantified Selfern, die selbst Glück
vermessen bzw. die hierzu sogar Apps entwickelt haben
1 breakout session zum Thema „Grief and Mood Tracking“
4 Show and Tells zu „Tracking Happiness“ bzw. „Mood,
Emotion, and Meaning“ von der QS-Internetseite
11.06.2015 Folie 10
Big Data und Selbstvermessung –
soziale Normierung
„Quantified Sex” (Lupton 2013): Retraditionalisierung von
Geschlechterrollen
Wie glücklich bin ich? Die Optimierung von Glück
“Question: So, optimal happiness for you is not necessarily like a 10
every day…
A.M.: I do not think that a 10 for every day would be sustainable, I
mean a seven is good and I am working towards improving it, but
in the 8s and 9s I am so happy that it is not…” (AM – SnT)
11.06.2015 Folie 11
Big Data und Selbstvermessung –
gesteigerte Autonomie, Kontrolle und Rechenschaft!
Autonomie und Kontrolle:
“You are not depending on health care any more.” (I 11)
“More data means more informed choices.”(I 15)
Rechenschaft:
“... one of the principles of Quantified Self is it makes you accountable in
a very numeric quantitative way. [...] The data has power because it tells
you a story. And it’s a story that you can’t sort of twist out of shape and
spin because it has numbers behind it.” (I 14)
11.06.2015 Folie 12
Selbstkontrolle vs. Kontrolle von auβen (Surveillance)
Big Data als Fortsetzung von Ratgebern
11.06.2015 Folie 13
Big Data und Selbstvermessung –
gesteigerte Autonomie, Kontrolle und Rechenschaft?
Big Data und Selbstvermessung –
wissenschaftlicher Paradigmentwechsel
“So what I am trying to do is to derive my personal formula that includes all
the different variables and factors in my life that kind of influence and define
happiness. Last December, I started tracking data points in my everyday life in
order to test some psychological and behavioral theories of happiness.” (KA –
SnT)
Ziel fast aller Vermessungspraktiken ist es, die Glücksvariable
mit anderen Messdaten zu korrelieren, um herauszufinden, was
„glücklich macht“.
Frage nach Korrelation, Kausalität und Vorhersagbarkeit
treten auf
11.06.2015 Folie 14
Big Data – Paradigmenwechsel
(nach Mayer-Schönberger und Cukier (2013))
1. Erhebung und Analyse ‚aller‘ Daten (N=alle) und den daraus
folgenden Verzicht auf Stichproben;
2. Akzeptanz von teilweise unordentlichen und chaotischen
Daten, d.h. der Abschwächung von Qualitäts- und
Präzisionsmerkmalen;
3. der Verschiebung der Bedeutung und Suche von
Kausalitätsbeziehungen hin zu reinen Korrelationen.
11.06.2015 Folie 15
Zwischen-Résumé
Zahlen als sozio-technische Artefakte
Alte und neue Formen von “Wertschreibung”
Neue interdisziplinäre Herausforderungen
11.06.2015 Folie 16
Crowd Computing
11.06.2015 Folie 18
http://news.nationalgeographic.com/2015/05/150501-nepal-crisis-
mapping-disaster-relief-earthquake/
Big (crisis) Data
Die „Nadel im Heuhaufen suchen“
Bsp.: Yahoo! Research (Barcelona)
„the propagation of tweets that correspond to rumors differs from tweets
that spread [accurate] news by the Twitter community. Notice that this
fact suggests that the Twitter community works like a collaborative filter
of information“ (Mendoza/Castillo/Poblete, 2012)
11.06.2015 Folie 19
“Predicting Information Credibility in Time-Sensitive Social
Media” Average number of tweets posted by authors of the tweets on the topic in past
Average number of followees of authors posting these tweets.
Fraction of tweets having a positive sentiment
Fraction of tweets having a negative sentiment
Fraction of tweets containing a URL that contains most frequent URL
Fraction of tweets containing a URL
Fraction of URLs pointing to a domain among top 10,000 most visited ones
Fraction of tweets containing a user mention
Average lenth of the tweets
Fraction of tweets containing a question mark
Fraction of tweets containing an exclamation mark
Fraction of tweets containing a question or an exclamation mark
Fraction of tweets containing a “smiling” emoticon
Fraction of tweets containing a first-person pronoun
Fraction of tweets containing a third-person pronoun
Maximum depth of the propagation trees
11.06.2015 Folie 20
Big (crisis) Data
Die „Nadel im Heuhaufen suchen“
Bsp.: Yahoo! Research (Barcelona)
„the propagation of tweets that correspond to rumors differs from tweets
that spread [accurate] news by the Twitter community. Notice that this
fact suggests that the Twitter community works like a collaborative filter
of information“ (Mendoza/Castillo/Poblete, 2012)
Diskriminierung und neue soziale Ungleichheiten durch Big
(crisis) Data
Ethische Bedenken
11.06.2015 Folie 21
“Perhaps the biggest threat that a data-driven world presents
is an ethical one. Our social safety net is woven on
uncertainty. We have welfare, insurance, and other institutions
precisely because we can’t tell what’s going to happen — so
we amortize that risk across shared resources. The better we
are at predicting the future, the less we’ll be willing to share
our fates with others.”
(Alistair Croll - http://radar.oreilly.com/2012/10/new-ethics-for-
a-new-world.html)
11.06.2015 Folie 23