34
Timo Honkela, 11.3.2014 Digitaalisen humanismin tutkimuksesta ja uusista liiketoiminta- mahdollisuuksista Timo Honkela 11.3.2014 -esitelmä Helsingin yliopisto Nykykielten laitos Kansalliskirjasto Digitointi- ja konservointikeskus

Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Embed Size (px)

DESCRIPTION

Digitalmikkeli-aamukahvitilaisuudessa 11.3.2014 esitetty materiaali: TIMO HONKELA, digitaalisten aineistojen professori, Helsingin Yliopisto, Kansalliskirjaston digitointi- ja konservointikeskus

Citation preview

Page 1: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Digitaalisen humanismin tutkimuksesta ja

uusista liiketoiminta-mahdollisuuksista

Timo Honkela

11.3.2014

-esitelmä

Helsingin yliopistoNykykielten laitos

KansalliskirjastoDigitointi- ja

konservointikeskus

Page 2: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Digitaalinen humanismi

● Humanististen tieteiden tutkimusta tietokoneiden avulla– Digitaaliset aineistot

– Laskennalliset mallit

● Teesit:– Paperia osataan jo valmistaa ja kuuhun osataan

lentää

– Tärkeimmät ratkaisemattomat kysymykset maailmassamme liittyvät humanististen ja sosiaalitieteiden alueelle

Page 3: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Digitaalisten aineistojentutkimuksesta

Page 4: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Arkistot

Kirjastot

Yliopistot

Kansalaiset

Tutkijat

Media

DIGITAALISETAINEISTOT

Museot

Opettajat

Taiteilijat

Yritykset

Yhdistykset

Kunnat

ValtioPäätöksen-

tekijät

Toimittajat

Informaatikot

Page 5: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Tekstit

Kuvat

Videot

Laskennallisetmallit

Numeerisetaineistot

DIGITAALISET AINEISTOT

Ääni-tallenteet

Monimedia-dokumentit

Vuorovaikutteisetjärjestelmät

Tietokone-ohjelmat

Page 6: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Aineisto

Sisältö- jainformaatio-

ammattilaiset

Aineistoistakiinnostuneetmaallikot ja

asianharrastajat

Koneoppimis- jahahmontunnistus-

järjestelmät

Formaali metadata

Kieliteknologisetresurssit jajärjestelmät

Sisällönkuvailun muut muodot

Page 7: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Lähiaikojentutkimusaiheita

Page 8: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Skannattujen tekstienlaadun parantaminen

lääniiT firtgemööriltö pyytänyt, että Satvonlinnan tailvlingin poliisilaitokseen määrättäisiin paltuelemaon Mikkelin poliisilaitokssei!...

määräyksestä tilapäifesil Sawonlinnasta muuannekin lähettää, Siltä »aralta, ettei pyydettyä mieliistöä saada Mikkelistä riittämään, anoo maistraatti, että sille myönnettäisiin siitä määrärahasta, jola Mik» kelin lääniä warten on...

Page 9: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Laatutekstiä

OCR-tekstiä

Kielimalli

Tunnistin

KorjainParempaa

tekstiä

Tuotanto-Järjestelmä

Ocricola-osahanke (Helsinki+Mikkeli)

Page 10: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Sisältöanalyysi:

ihmiset paikat

tapahtumatteemat

sentimentit

Paukkeri, Nieminen, Pöllä & Honkela. A language­independent approach to keyphrase extraction and evaluation. Coling 2008.

Honkela, Korhonen, Lagus & Saarinen. Five­dimensional 

sentiment analysis of corpora, documents and 

words. WSOM 2014 (to appear).

Menetelmiä

Page 11: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Haasteita:

Sisältökuvauksien käytettävyyden jayhtenäisyyden tavoitteen

ja

kielen ja tulkinnan moninaisuuden,muuttumisen, laji- ja tyylivariaation,

yksilöllisyyden ja kulttuurisidonnaisuuden

välinen jännite

Page 12: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Tulkinnan moninaisuusja kontekstisidonnaisuus

“Shall I Compare Thee To A Summer's Day”

Pieni norsu versus suuri hiiri

Kaunis rantamaisema, maalaus tai sävellys

Demokratia, tasa-arvo, yhdenvertaisuus,kestävä kehitys, oikeudenmukaisuus, ...

Page 13: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Mahdollisuuksia

Kontekstitiedon tallentaminenaiempaa suuremmassa mittakaavassa

Inhimillisen tulkinnananalysointi ja tulosten

hyödyntäminen aineistojenmerkkaamisessa

Sisältöanalyysikoneoppimisen ja

hahmontunnistuksenkeinoin

Page 14: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Chemistry

Physics andengineering

Biosciences

Medicine

Culture and society

Tuotettu automaattisesti ilman ihmisluokitteluita Suomen Akatemialle osoitetuista3324 hakemuksesta käyttäen tilastollista termi-irrotusta ja itseorganisoivaa karttaa.

Tila

stol

linen

ter

mi-i

rrot

us:

ks.

Pau

kker

i et a

l. 20

08

Hon

kela

& K

lam

i 200

7Suomen tieteen kartta

Page 15: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Analyzing Emotional Semantics of Abstract Art Using Low-Level Image Features.He Zhang , Eimontas Augilius , Timo Honkela, Jorma Laaksonen, Hannes Gamper and Henok Alene, Proceedings of IDA 2011.

Page 16: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Kysymys:

Milloin apuvälineet ovatkehittyneet niin pitkälle, että

voimme tunnistaa uutislähetyksestäuutislukijan tai haastateltavankasvoista tai äänensävystä,

päätellä aihealueenvideokuvasta ja muuttaa

eri puhujien äänen tekstiksi?

Page 17: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Page 18: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Kiitän Jorma Laaksosta ja Mikko Kurimoa tutkimusryhmineen mahdollisuudesta esittää

seuraava esimerkki automaattisen sisällönkuvailun nykytilasta

users.ics.aalto.fi/jorma/scholar.google.com/citations?user=suHzeyIAAAAJ&hl=en

users.ics.aalto.fi/mikkok/elec.aalto.fi/en/about/careers/professors/mikko_kurimo/

Page 19: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Puhujan-tunnistus

Videokuva-analyysi

Puheentunnistus(puheesta tekstiksi)

Page 20: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Videokuva-analyysi

Puhujan-tunnistus

Puheentunnistus(puheesta tekstiksi)

Tekstin-tunnistus(OCR)

Page 21: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Mahdollisuuksia:

Tulkinnan kontekstisidonnaisuudenja yksilöllisyyden

mallintaminen

Page 22: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

GICA: Grounded IntersubjectiveConcept Analysis

Sanat,fraasit,tulkinnat tms.

Kontekstit

Yksilöt

Page 23: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Sanan “health” käytön analyysiState of the Union -puheissa

Subjects on objects in contexts: Using GICA method to quantify epistemological subjectivity. Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.IJCNN 2012.

Page 24: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Mikkelin ja Helsingintyönjako professuurin

puitteissa

Dynaaminen suunnitelma: sisältö elää ja kokonaistavoitteiudenaikatauluja ei anneta, koska se aiheuttaa tehottomuutta ja

vääränlaista kaavamaisuutta!

(vrt.kommunismin ja suunnitelmatalouden epäonnistuminen)

Page 25: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

MIKKELI Tutkimus Opetus Soveltaminen

Kansalliskirjasto

MUC Vierailuesitelmät

MAMK

Otavan opisto

DigitalMikkeli

Digitaalisten aineistojen

jalostaminen ja sisältöanalyysi;

Koneoppimisen ja joukkoistamisen soveltaminen;

Kirjastojen kehittyvä rooli ja

toimintatavat

Soveltuvin osin siirrot tuotanto-

järjestelmiin

Kansalais- ystävällinen

tietoyhteiskunta

Joukkoistaminen ja koneoppiminen

tietoyhteis- kunnan välineiksi;

Merkitys- ja vuorovaikutus-

teoria; Kansalais- ystävällinen

tietoyhteiskunta

Tutkimukseen liittyvien

opinnäytetöiden ohjaus

Tietoyhteis-kuntasovellukset

(erit.kunnallis- hallinto)

Osallistuva tutkimus

Tietoyhteis-kuntasovellukset

(erit.itse- ohjautuvuus)

Erilaiset sovellukset (erit. KK:n ja MAMKin

kautta)Versio 0.51

Page 26: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

HELSINKI Tutkimus Opetus Soveltaminen

Nykykielten laitos

Filosofian laitos Työpajat

Aalto-yliopisto

Merkitys- ja vuorovaikutus-

teoria; Tekstilouhinnan menetelmät ja sovellukset; Monikielinen

kieliteknologia; Variaation tutkimus

Digitaalisen humanismin seminaari- ja luento-opetus (mahdollisuus

etäläsnäoloon); Tilastollisen

kieliteknologian ja siihen liittyvän

filosofian opetus

Tietojenkäsittely- tieteen laitos

Teksti- ja sisältö-louhinnan

menetelmät ja sovellukset;

Koneoppimisen menetelmät

Digital Humanities Hackathon (mukana

humanistinen tiedekunta)

Merkitys- ja vuorovaikutus-

teoria;

Kuluttajatutkimus- laitos

Rikkaiden kontekstien tutkimus;

Hyvinvointi- sovellukset

Helsingin yliopisto kokonaisuutena

Tietoyhteis-kuntasovellukset (erit.hyvä hallinto ja vuorovaikutus)

Koneoppiminen ja sovellukset; Monimedia-

analyysi (puhe, video);

Sentimentti- analyysi

Seminaarit, joissa sisältö- ja/tai osallistuja- yhteistyö

Versio 0.51

(osa HY:a 2015)

' '

Page 27: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Tämän lisäksi

● Muu kansallinen yhteistyö– Digitaalisuus opetuksessa

(mm. uudistuva ylioppilastutkinto)

– Tampereen, Jyväskylän ja Turun yliopisto

● Kansainvälinen yhteistyö ja verkostoituminen– Muistiorganisaatiot

– Digitaalinen humanismi

– Koneoppiminen ja hahmontunnistus

Page 28: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Liiketoimintaympäristöstäja -mahdollisuuksista

Page 29: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 1

● Digitaaliset välineet ovat muuttaneet sisältö-tuotannon työnjakoa ja kustannusrakennetta

● Tietoverkko on mahdollistanut sisältöjen jakelun ja jakamisen

● Ihmisten odotukset ja vaatimukset sisältöjen ja hinnan suhteet ovat muuttuneet olennaisesti

● Personointi- ja suosittelutekniikat ovat muokanneet tuotteiden ja palvelujen myynnin tapoja

Page 30: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 2

● Ansaintalogiikoissa on tapahtunut todennäköisesti peruuttamattomia muutoksia

● Suositut palvelut ovat ilmaisia ja keräävät tehokkaasti mainosdollarit ja -eurot

● Tekijänoikeus- ja ipr -lainsäädäntö suojaa käytännössä vain suuria ja taloudellisesti vahvoja toimijoita sekä hidastaa innovaatiosykliä

● Yksityisyydensuoja on pitkälti murentunut – tai: palannut takaisin kyläyhteisön tapaiseen tilanteeseen

Page 31: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 3

● Pääomien suhteellisen vapaan liikkuvuuden takia investoinnit valuvat tarpeettomankin laajasti rajojemme ulkopuolelle (suomalaisten käänteinen NIH-ilmiö)

● Esimerkiksi mediasektorilla suurimmatkin kansalliset toimijat ovat vaarassa jäädä kansainvälisen kilpailun jalkoihin

Page 32: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Toimintaympäristön kokonaisvaltainen muutos on käynnissä, 4

● Valtaosa suomalaisesta investointikapasiteetista(eläkevakuutukset) sijoitetaan kilpailijoiden aseman parantamiseen Suomen rajojen ulkopuolelle riskien hajauttamisen nimissä

● Automaatio ja robotisaatio muuttavat työn tekemisen puitteita niin, että 20-30 vuoden tähtäimellä koneet pystyvät ainakin periaatteessa korvaamaan ihmisen hyvin suuressa osassa nykyisistä työtehtävistä

Page 33: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Page 34: Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014

Timo Honkela, 11.3.2014

Mitä jää jäljelle?

IHMINEN PALJON TÖITÄ&

Yrityksille

Lainsäätäjille

“Isojenkin laivojen” kulkiessa olkoot itsemääräämisoikeus ja inhimillinen yhteistyö kehityksen keskiössä