18
Attribution-Share Alike 1.0 Finland Google Refine Datan siivousta tehokkaasti – duskuntavaaliehdokkaiden itse ilmoittamat arvot/ammatit/asemat siivottuna Antti Poikola – Otavan Opisto Kuva: 1854 Broad Street cholera outbreak (wikipedia)

Datan siivousta tehokkaasti – Google Refine

Embed Size (px)

DESCRIPTION

Tutoriaali http://datajournalismi.fi/tutoriaaleja/ Haaste: Mitkä ovat yleisimpiä ammatteja eduskuntavaaliehdokkaiden joukossa? Vaaditut ohjelmat / työkalut: Google Refine -ohjelma asennettuna Sisältö tiivistetysti: - Miten siivotaan Oikeusministerion ehdokasdatan sarake, jossa on ehdokkaiden itse ilmoittama arvo/ammatti/asema -tieto? - Datan tuominen Google refineen - Facet text facet - Samankaltaisten klusterointi ja yhdistäminen - Edit cells / split multi-valued cells - Datan vieminen Refinesta exceliin Tutoriaalissa käytettävä data: Lataa data osoitteesta http://192.49.229.35/E2011/s/ehd_listat/kokomaa.htm Suora linkki taulukkoon on http://192.49.229.35/E2011/s/ehd_listat/e2011ehd.xls

Citation preview

  • 1. Google RefineDatan siivousta tehokkaasti Eduskuntavaaliehdokkaidenitse ilmoittamat arvot/ammatit/asemat siivottunaAntti Poikola Otavan OpistoKuva: 1854 Broad Street cholera outbreak (wikipedia)Attribution-Share Alike 1.0 Finland

2. Haaste: Mitk ovat yleisimpi ammatteja eduskuntavaali-Haaste: Millainen on ehdokkaiden poliittinen historia, kuka sai paljonkin ni aiemmissa vaaleissa? ehdokkaiden joukossa? Attribution-Share Alike 1.0 Finland 3. Data Vaalit.fi -sivustoltaAttribution-Share Alike 1.0 Finland 4. Uuden Refine Projektin luominenAttribution-Share Alike 1.0 Finland 5. Projektin nimeminenAttribution-Share Alike 1.0 Finland 6. Dataan tutustuminenAttribution-Share Alike 1.0 Finland 7. Vaalipiirien ehdokasmrtAttribution-Share Alike 1.0 Finland 8. Pilkulla erotellut ammatit omille riveilleenAttribution-Share Alike 1.0 Finland 9. Textfacet ammateilleAttribution-Share Alike 1.0 Finland 10. Eri tavoin kirjoitettujen ammattien yhdistminen 1.Attribution-Share Alike 1.0 Finland 11. Eri tavoin kirjoitettujen ammattien yhdistminen 2.Attribution-Share Alike 1.0 Finland 12. Eri tavoin kirjoitettujen ammattien yhdistminen 3.Attribution-Share Alike 1.0 Finland 13. Ammattien lukumrt tekstin ulosAttribution-Share Alike 1.0 Finland 14. Tyhjien solujen tyttAttribution-Share Alike 1.0 Finland 15. Tiedon tallentaminen Excel-muotoon 1.Attribution-Share Alike 1.0 Finland 16. Tiedon tallentaminen Excel-muotoon 2.Attribution-Share Alike 1.0 Finland 17. Yleisimmt ammatit puolueittainpluottamusmiessairaanhoitaja KESK toimitusjohtaja KOK kasvatustieteiden maisteriyhteiskuntatieteiden maisteriPS toimittajaRKP filosofian maisteri SDPopiskelija VASkansanedustaja VIHR yrittj 0 20 40 60 80 100 120 140 160 Attribution-Share Alike 1.0 Finland 18. Suomalainen datajournalistien verkostoYhdess oppien ja toisia auttaen Datajournalismisivusto: http://datajournalismi.fi/ Datavaalit sivu: http://www.datavaalit.fi/ Twitteriss: @datajournalismi ja #datajournalismi Facebookissa: www.facebook.com/datajournalismi Teemo Tebestin blogi: datajournalismi.blogspot.com Jens Finnsin blogi: dataist.wordpress.com HsOpen blogi: blogit.hs.fi/hsnextAttribution-Share Alike 1.0 Finland