35
Обука за отворени податоци 18 и 19 март, 2015

Податоци и отворени податоци

Embed Size (px)

Citation preview

Page 1: Податоци и отворени податоци

Обука за отворени податоци

18 и 19 март, 2015

Page 2: Податоци и отворени податоци

ШТО СЕ ПОДАТОЦИ?

Page 3: Податоци и отворени податоци

Поставување прашања

Page 4: Податоци и отворени податоци

● Повеќето луѓе не управуваат со податоци за забава. Тие имаат

приказна што сакаат да ја раскажат или проблем што сакаат

да го решат.

● Прашањето може да биде од каков било тип, почнувајќи од:

„Колку денови во годината се сончеви во мојот град?“, па

сè до прашања како „Како мојата Влада ги троши парите? И

од каде доаѓаат тие пари?“ и „Како здравствените трошоци

влијаат на животниот век?“

Page 5: Податоци и отворени податоци

Што може да кажеме за нив?

● Топчиња за голф (се користат за

играње голф - класификација)

● Бела боја

● Искористени се

● Сите тие имаат иста, одредена

големина

● Има одреден број топчиња Имаат

одредена парична вредност...

Page 6: Податоци и отворени податоци

Видови податоци

● Квалитативни податоци се оние што се

однесуваат на квалитетот на нешто: опис по боја,

текстура, опис на искуства и податоци од интервју

– сите претставуваат квалитативни податоци.

● Квантитативни податоци се оние кои се

изразуваат со број. На пример, бројот на голф-

топчиња, нивната големина, цена итн.

Page 7: Податоци и отворени податоци

Видови податоци

● Одделни податоци: нумерички податоци кои имаат

празнини во нив. На пример, бројот на топчиња.

Може да има само цел број топчиња (не може да

име 0,3 топчиња). Други примери би биле резултати

на испит или број на чевли.

● Континуирани податоци: нумерички податоци со

контиуниран опсег. Може да бидат избројани,

подредени и измерени. Пример: висина, тежина,

температура, количество на шеќер во портокал...

Page 8: Податоци и отворени податоци

● Категорички податоци: објектот што го

објаснуваме го ставаат под одредена категорија: во

нашиот пример податокот „искористени“ е

категоричен податок (каде категориите би биле:

нови, искористени, скршени итн.)

● Редни податоци: податоци што може да бидат

рангирани (подредени) или бидат изразени преку

скала. Може да бидат избројани и подредени, но не

може да бидат измерени. Пример: скала од 1 до 5

Видови податоци

Page 9: Податоци и отворени податоци

Категорија Спорт – Голф Категоричен податок

Боја Бела Квалитативен податок

Состојба Користени Категоричен податок

Дијаметар 43 mm Континуиран податок

Цена (по топче) 30 ден. Квантитативен податок

Page 10: Податоци и отворени податоци

Квиз: видови податоци

Улога: Тапанар

❏ Континуиран податок

❏ Категоричен податок

❏ Квалитативен податок

Година на раѓање: 1963

❏ Квалитативен

❏ Одделен

❏ Континуиран

❏ Категоричен

Име: Елена Игнатова

❏ Квантитативен

❏ Квалитативен

❏ Одделен податок

Големина: M

❏ Реден податок

❏ Категоричен

❏ Континуиран

Висина: 187cm

❏ Одделен

❏ Категоричен

❏ Континуиран

❏ Квалитативен

Дата: 18 март 2015

❏ Одделен

❏ Категоричен

❏ Континуиран

Page 11: Податоци и отворени податоци

Име Пол Возраст Висина Чувство

Дона Ж 21 190cm Изненадене

Елена Ж 23 167cm Благодарна

Тин М 25 167cm Заинтересиран

Дарко М 22 163cm Релаксиран

Ана Ж 22 156cm Оптимистична

Борис М 36 200cm Избезумен

Владимир М 35 167cm Возбуден

Бане M 24 180cm Нервозен

Милена Ж 29 160cm Многу

возбудена

Page 12: Податоци и отворени податоци

Неструктурирани наспроти структурирани податоци

Податоци за луѓе

● „Имаме 5 користени топчиња за голф со дијаметар 43 mm и секое чини 30 ден.“

● Неструктуриран податок. Нема одредена структура – реченицата може лесно да

биде променета и не е јасно секој збор на што се однесува.

● Скениран ПДФ и фотографии - пријатни за око, не за машина

● Најчесто употребувани машински читливи формати: JSON, XML, RDF, CSV (Comma

Separated Files)...

Податоци за компјутери

● Некои задачи се лесни за луѓе, комплицирани за компјутерите.

● Пример: Текст претставен како слика.

● Одредена структура = машински читливи.

Page 13: Податоци и отворени податоци

Концепт: Отворени податоци

Page 14: Податоци и отворени податоци

Што се отворени податоци?

Отворени податоци се сите информации кои

може да бидат слободно употребувани,

реупотребувани и дистрибуирани од секого,

секаде и за секоја цел.

- OpenDefinition.org

Page 15: Податоци и отворени податоци

Отворените податоци не се PDF!

● Машински читливи - во формат кој лесно може да биде обработен од

страна на компјутер

● Дигитално ≠ машински читливо

● Машински читливи формати: XML, CSV (comma separated values),

JSON

Page 16: Податоци и отворени податоци

Отворени податоци и податоци од јавен

карактер НЕ е исто.

Page 17: Податоци и отворени податоци

Бизнис сектор

...Медиуми

Истражувања

НВО

$

Секој има право на владините податоци!

Page 18: Податоци и отворени податоци

Услови на споделување

Page 19: Податоци и отворени податоци

Буџетите не се единствените владини

податоци кои треба/може да бидат

отворени!

Владините податоци НЕ се единствените

отворени податоци!

Page 20: Податоци и отворени податоци

Кои податоци може да бидат

отворени?

● Административни: Буџети, трошоци, потрошувачка на енергија...

● Демографски: Приходи, возраст, струка...

● Демократски: Податоци од избори, податоци за средби, членови...

● Просторни: Згради на јавни институции, паркови, велосипедски

патеки, автобуски станици...

● Податоци за квалитет на животна средина: квалитет на вода,

воздух, почва...

● Плански: Искористеност на земја, катастарски податоци, барања...

Page 21: Податоци и отворени податоци

Отворени владини податоци во Македонија

● www.otvorenipodatoci.gov.mk

● Државен завод за статистика

● World Bank

● Народна Банка на РМ

Page 22: Податоци и отворени податоци

Малку инспирација

Page 23: Податоци и отворени податоци
Page 24: Податоци и отворени податоци
Page 25: Податоци и отворени податоци
Page 26: Податоци и отворени податоци
Page 27: Податоци и отворени податоци
Page 28: Податоци и отворени податоци
Page 29: Податоци и отворени податоци
Page 30: Податоци и отворени податоци

Алатки за обработка на

податоци

Page 31: Податоци и отворени податоци

ScraperWiki [преземање на податоци]

Page 32: Податоци и отворени податоци

Open Refine [чистење на податоци]

Page 33: Податоци и отворени податоци

Google Sheets / OpenOffice Calc

[анализирање на податоци]

Page 34: Податоци и отворени податоци

TileMill [презентирање на податоци]

Page 35: Податоци и отворени податоци

The Data Hub [споделување на податоци]