Upload
timo-honkela
View
169
Download
3
Embed Size (px)
DESCRIPTION
Helsingin yliopisto, Juhlaluennot 28.5.2014
Citation preview
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Koneoppiminenhumanismin
palveluksessa
Timo HonkelaDigitaalisten aineistojentutkimuksen professori
28.5.2014
Helsingin yliopistoNykykielten laitos
KansalliskirjastoDigitointi- ja
konservointikeskus
PROFESSORIEN JUHLALUENNOT
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Humanismin laajenevat kehät
EsteettinenEettinen
SosiaalinenEkologinen
Wright, Georg Henrik von (1916 – 2003)Kansallisbiografia
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Voivatko koneetauttaa ihmisiä
ja ihmisyhteisöjähyvän elämän
rakentamisessa?
Prof. Anne Birgitta Pessi jaDekaani Ismo Dunderberg
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
“Digital humanities”
● Humanististen tieteiden tutkimusta tietokoneiden avulla– Digitaaliset aineistot
– Laskennalliset mallit
● Teesi:– Tärkeimmät avoimet kysymykset maailmassamme
liittyvät ihmistieteiden alueelle
Research withinhumanities with
the help of computers- Digital resources
- Computational models
The most important open research questions in the world belong tohumanities and social sciences
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Digitaalinen Laskennallinen
Humanistisettieteet
Sisältöjentallentaminenja siirtäminen
Sisältöjenmuokkaaminen
ja tulkinta
Digital Computational
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Arkistot
Kirjastot
Yliopistot
Kansalaiset
Tutkijat
Media
DIGITAALISETAINEISTOT
Museot
Opettajat
Taiteilijat
Yritykset
Yhdistykset
Kunnat
ValtioPäätöksen-
tekijät
Toimittajat
Informaatikot
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Tekstien louhinta
● Tilastollisen koneoppimisen keinoin kone voidaan laittaa “lukemaan” suuria tekstimääriä ja selvittämään asioita, joita yksittäinen ihminen ei voisi koskaan tehdä.
● Kone voi käydä läpi miljoonia tai tarvittaessa jopa miljardeja tekstejä.
● Tässä on kyse paljon muustakin kuin vain perinteisestä tiedonhausta, koska tavoitteena ei ole löytää yksittäisiä dokumentteja tai tiedonsirpaleita vaan muodostaa ymmärrystä suurista kokonaisuuksista.
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Chemistry
Physics andengineering
Biosciences
Medicine
Culture and society
Tuotettu automaattisesti ilman ihmisluokitteluita Suomen Akatemialle osoitetuista3324 hakemuksesta käyttäen tilastollista termi-irrotusta ja itseorganisoivaa karttaa.
Tila
stol
linen
ter
mi-i
rrot
us:
ks.
Pau
kker
i et a
l. 20
08
Hon
kela
& K
lam
i 200
7Suomen tieteen kartta
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Esimerkkejä aiemmasta tutkimuksesta
● Honkela & Vepsäläinen (1991): Kokoilmaisujen tulkinta
● Honkela (1993): Tulkinnan subjektiivisuuden ja kontekstuaalisuuden mallintaminen
● Honkela, Pulkki & Kohonen (1995): Grimmin satujen analyysi; sanakategorioiden kehkeytyminen
● Honkela, Kaski, Kohonen, Lagus (1996): Dokumenttikartat
● Legrady & Honkela (1999-2002): Joukkoistettu kartta taidemuseoissa
● Honkela, Hyvärinen & Väyrynen (2003-): Sanapiirrekehkeytys
● Pyysiäinen, Lindeman & Honkela (2003): Uskonnollistenväittämien tulkinnan analyysi
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Esimerkkejä aiemmasta tutkimuksesta
● Honkela, Nordfors & Tuuli (2004): Osaamisen mallintaminen
● O. Kohonen, Katajamäki & Honkela (2004): Shakespearen sonettien analyysi
● Lindh-Knuutila, Honkela & Lagus (2006): Merkitysneuvotteluiden mallintaminen
● Rusanen, Lappi, Honkela & Nederström (2008):Filosofisten väittämien tulkinnan analyysi
● Ellis, Creutz, Honkela & Kurimo (2008):Puheesta puheeseen konekäännös
● Janasik, Honkela & Bruun (2009):Tekstinlouhinta laadullisen tutkimuksen apunaorganisaatiotutkimuksessa
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Esimerkkejä aiemmasta tutkimuksesta
● Van Heeswijk, Miche, Lindh-Knuutila, Hilbers, Honkela, Oja & Lendasse (2009): Aikasarja-analyysi
● Hakkarainen, Engeström, Paavola, Pohjola & Honkela (2009):Tietämyskäytännöt
● Paju, Malmi & Honkela (2011): Historiaa koskevien haastatteluiden sisältö- ja verkostoanalyysi
● Zhang, Augilius, Honkela, Laaksonen, Gamber & Alene (2011): Abstraktin taiteen tuottamien tunnereaktioiden ja kuvasisältöjen vertailu
● Honkela, Izzatdust & Lagus (2012): Vertaistukea edistävätekstinlouhinta
● Mehmood & Honkela (2012): Ympäristökokouksen puheiden analyysi
● Lagus, Vatanen, Kettunen, Heikkilä, Heikkilä, Pantzar & Honkela (2012):Hyvinvointipolkujen etsiminen data-aineistoista
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Digitaalisen humanismin lupaus
● Uusien lähestymistapojen avulla voidaan saada ymmärrystä suurista kokonaisuuksista ja asioiden välisistä hienovaraisistakin suhteista
● Ei olla kaukana siitä, että tietokone voi toimia ihmisten apuna sivistyksen edistämisessä
● On syntymässä liittoutuma humanististen ja sosiaalitieteiden sekä tietojenkäsittelytieteiden välillä monimutkaisten inhimillisten ja yhteiskunnallisesti keskeisten ilmiöiden ymmärtämiseksi.
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Keskeinen tutkimuksen kohde:
Kieli,kielen oppiminen
ja kielen rooliinhimillisen toiminnankeskeisenä välineenä
Central research topic: Language, language learning and its role as a central tool in human activities
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
yli 6000 kieltä,paljon murteita
Miljardeja ihmisiäblogs.state.gov
en.wikipedia.org
Suuri määräerilaisia kulttuureja
en.wikipedia.org Yksilölliset tavat suhteuttaa kieli, käsitteet ja maailma toisiinsa
Over 6000 languages,many more dialects
Billions of people
Large number of different culturesSubjectivity of relating language, concepts
and the world to each other
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Merkityksen tilannekohtaisuus
red winered skinred shirt
Gärdenfors: Conceptual Spaces
Hardin: Color for Philosophers
Contextuality of meaning
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Merkityksen tilannekohtaisuus
“Shall I compare thee to a summer's day?”
? ?
Contextuality of meaning
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Tieteenalat järjestettynähakemusten englanninkielisten
osuuksien suhteellisen määrän mukaan(*)
Matematiikka 95.3
Farmasia 94.1
Kemia 93.7
Fysiikka 93.4
Biokemia, molekyylibiologia, mikrobiologia, perinnöllisyystiede ja biotekniikka
93.4
Solu- ja kehitysbiologia, fysiologia ja ekofysiologia 93.4
Tietojenkäsittelytieteet 93.0
Sähkötekniikka ja elektroniikka 92.8
Ympäristötekniikka 92.7
Geotieteet 92.1
Ekologia, evoluutiotutkimus ja systematiikka 92.1
Kone- ja valmistustekniikka 91.9
Metsätieteet 91.4
Avaruustieteet ja tähtitiede 91.0
Prosessi- ja materiaalitekniikka 90.8
Tilastotiede 90.7
Muu ympäristön ja luonnonvarojen tutkimus 90.1
Kliininen lääketiede 89.6
Ekotoksikologia, ympäristön tila ja ympäristövaikutukset 89.5
Ravitsemustiede 89.3
Psykologia 89.0
Liikuntatiede 88.9
Hoitotiede 88.9
Eläinlääketiede 88.5
Kansanterveystiede 88.1
Kielitieteet 87.6
Filosofia 87.3
Liiketaloustiede, talousmaantiede ja tuotantotalous 87.2
Hammaslääketiede 86.7
Kansantaloustiede 86.3
Rakennus- ja yhdyskuntatekniikka 85.9
Maatalous- ja elintarviketieteet 85.4
Ympäristöpolitiikka, -talous ja -oikeus 85.3
Maantiede 84.8
Arkkitehtuuri ja teollinen muotoilu 83.7
Viestintä- ja informaatiotieteet 83.1
Kasvatustiede 82.6
Valtio-oppi ja hallintotiede 82.2
Taiteiden tutkimus 81.6
Sosiaalitieteet 80.4
Kulttuurien tutkimus 79.3
Historia ja arkeologia 78.1
Teologia 77.0
Oikeustiede 70.8
(*) SuomenAkatemialleosoitettujenhakemustenkorpuksessa
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Matematiikka 95.3
Farmasia 94.1
Kemia 93.7
Fysiikka 93.4
Biokemia, molekyylibiologia, mikrobiologia, perinnöllisyystiede ja biotekniikka
93.4
Solu- ja kehitysbiologia, fysiologia ja ekofysiologia 93.4
Tietojenkäsittelytieteet 93.0
Sähkötekniikka ja elektroniikka 92.8
Ympäristötekniikka 92.7
Geotieteet 92.1
Ekologia, evoluutiotutkimus ja systematiikka 92.1
Kone- ja valmistustekniikka 91.9
Metsätieteet 91.4
Avaruustieteet ja tähtitiede 91.0
Prosessi- ja materiaalitekniikka 90.8
Tilastotiede 90.7
Muu ympäristön ja luonnonvarojen tutkimus 90.1
Kliininen lääketiede 89.6
Ekotoksikologia, ympäristön tila ja ympäristövaikutukset 89.5
Ravitsemustiede 89.3
Psykologia 89.0
Liikuntatiede 88.9
Hoitotiede 88.9
Eläinlääketiede 88.5
Kansanterveystiede 88.1
Kielitieteet 87.6
Filosofia 87.3
Liiketaloustiede, talousmaantiede ja tuotantotalous 87.2
Hammaslääketiede 86.7
Kansantaloustiede 86.3
Rakennus- ja yhdyskuntatekniikka 85.9
Maatalous- ja elintarviketieteet 85.4
Ympäristöpolitiikka, -talous ja -oikeus 85.3
Maantiede 84.8
Arkkitehtuuri ja teollinen muotoilu 83.7
Viestintä- ja informaatiotieteet 83.1
Kasvatustiede 82.6
Valtio-oppi ja hallintotiede 82.2
Taiteiden tutkimus 81.6
Sosiaalitieteet 80.4
Kulttuurien tutkimus 79.3
Historia ja arkeologia 78.1
Teologia 77.0
Oikeustiede 70.8
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
“Einsiedeln Abbey is a Benedictine monastery in the town of Einsiedeln in the Canton of Schwyz, Switzerland. The abbey is dedicated to Our Lady of the Hermits, the title being derived from the circumstances of its foundation, for the first inhabitant of the region was Saint Meinrad, a hermit. It is a territorial abbey and, therefore, not part of a diocese, subject to a bishop. It has been a major resting point on the Way of St. James for centuries.” (Wikipedia)
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Eri näkökulmatDifferent perspectives
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Sanat heijastelevat todellisuutta, eivät ole sen jäännöksetön jäljennösWords reflect reality, not being an exact copy of it
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
“... tre slutsatser ...”
Prof. Mårten Knuts
“... situationskänsligsätt ...”
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Merkitykset ovat yksilöllisiä
● HyväGood
● ReiluFair
● HyödyllinenUseful
● TieteellinenScientific
● DemokraattinenDemocratic
● KestäväSustainable
● jne.etc.
Asianmukaisessa merkityksenteoriassa tämä on huomioitava.
A proper theory of meaning has to take this into account.
Meanings are subjective
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Kieli on sosiokognitiivineneli sekä yksilö- ettäyhteisötason ilmiö
Language is a socio-cognitive phenomenon,it exists both at an individual
and a social level
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Kielen yksilötason oppimisen jayhteisötason muuttumisen
kehityskulut ovatsekä konvergentteja
että divergenttejä
Both convergent and divergent processestake place when language
is learned at an individual leveland is changing at social level
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Merkitys on pikemminkintilastollinen kuinlooginen ilmiö
It is more fruitful to consider meaning as a statistical
than a logical phenomenon
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Menetelmällinen moninaisuus
● Tilastotiede● Todennäköisyys-
laskenta● Informaatioteoria● Simulointi● Matriisilaskenta● Tensorialgebra
● Hahmontunnistus● Koneoppiminen● Dynaamisten
järjestelmienteoria
● jne.
Kielen, sen tulkintaan ja oppimiseenliittyvien ilmiöiden monimutkaisuuden
ja hienovaraisuuden takia tarvitaanmonipuolinen menetelmäjoukko
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Kaksi esimerkkiä
● Kielen ilmaisut suhteutettuina visuaalisiinhavaintoihin
(Multimodally Grounded Language Technology-niminen akatemiaprojekti)
● Merkitysten yksilöllisen tulkinnan mittaaminen
(GICA-menetelmä,Grounded Intersubjective Concept Analysis)
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Multimodally Grounded Language Technology
Suomen Akatemian rahoittama hanke 2011-14
Mukana olevat laitokset:
* Tietojenkäsittelytieteen laitos
* Mediateknologian laitosJuha Raitio
Modelingsubjectivity
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Liike Kieli
KäveleeLöntysteleeHyppelehtiiKäppäileeNilkuttaaJuokseeHölkkääAstelee
Raahustautuu...
nopeastisurullisesti
iloisestiväsyneestivaikeastinilkuttaenmadellen
tyylikkäästiontuen
...
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Liike Kieli
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar.
Subjects on objects in contexts: Using GICA method to quantify epistemological subjectivity.
Proceedings of IJCNN 2012, International Joint Conference on Neural Networks, pp. 2875-2883, 2012.
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
GICA: Grounded Intersubjective Concept Analysis- Tulkinnan yksilöllisyyden mallintaminen
Sanat,fraasit,tulkinnat tms.
Kontekstit
Yksilöt
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Sanan 'terveys' (health) analyysi
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Humanismin laajenevat kehät
EsteettinenEettinen
SosiaalinenEkologinen
Wright, Georg Henrik von (1916 – 2003)Kansallisbiografia
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
TiedeScience
YhteiskuntaSociety
KulttuuriCulture
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
TiedeScience
YhteiskuntaSociety
KulttuuriCulture
OppiminenLearning
PäätöksentekoDecision making
InfrastruktuuritInfrastructures
MoninäkökulmaisuusMultiple perspectives
VaaliminenPreservation
YmmärtäminenUnderstanding
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
TiedeScience
YhteiskuntaSociety
KulttuuriCulture
OppiminenLearning
PäätöksentekoDecision making
InfrastruktuuritInfrastructures
MoninäkökulmaisuusMultiple perspectives
VaaliminenPreservation
YmmärtäminenUnderstanding
VAPAUTUMINENMÄÄRÄMUOTOISUUDEN
TAAKASTA
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Toiminta verkostossa
Helsinginyliopisto
Tietojenkäsittely-tieteen laitos
Nykykieltenlaitos
Muut laitoksetja tiedekunnat
Mikkelinyliopisto-keskus
Mikkelinammatti-
korkeakoulu
Kansallis-kirjasto
Mikkelinkaupunki
Digitointi- jakonservointi-
keskus
FIN-CLARIN
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Toiminta verkostossa
Helsinginyliopisto
Tietojenkäsittely-tieteen laitos
Nykykieltenlaitos
Muut laitoksetja tiedekunnat
Aalto-yliopisto
Mikkelinyliopisto-keskus
Mikkelinammatti-
korkeakoulu
Kansallis-kirjasto
Turunyliopisto
Kansallis-arkisto
Tampereenyliopisto
Kuluttaja-tutkimus-keskus
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Toiminta verkostossa
Helsinginyliopisto
Tietojenkäsittely-tieteen laitos
Nykykieltenlaitos
Muut laitoksetja tiedekunnat
Aalto-yliopisto
Mikkelinyliopisto-keskus
Mikkelinammatti-
korkeakoulu
Kansallis-kirjasto
Turunyliopisto
Kansallis-arkisto
Tampereenyliopisto
Kuluttaja-tutkimus-keskus
Kansainvälinentutkimus- jamuistiorganisaatio-yhteisö
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Toimintatavat
Vapaamuotoinentutkimus
Tutkimus-projektit
Opiskelija-projektit
Digital humanitieshackathon
“Maailman-parannusillat”
Yhteis-kunnallinenkeskustelu
javaikuttaminen
Muut julkaisut
Tieteellinenjulkaiseminen
Luennot
Esitelmät
Activities
Timo Honkela, Koneoppiminen humanismin palveluksessa, Juhlaluento, Helsingin yliopisto, 28.5.2014
Kiitos!Tack!
Thank you!Merci!
Obrigado!
¡Gracias!Danke schön!有り難う謝謝
Σας ευχαριστούμε!