Податоци и отворени податоци

Preview:

Citation preview

Обука за отворени податоци

18 и 19 март, 2015

ШТО СЕ ПОДАТОЦИ?

Поставување прашања

● Повеќето луѓе не управуваат со податоци за забава. Тие имаат

приказна што сакаат да ја раскажат или проблем што сакаат

да го решат.

● Прашањето може да биде од каков било тип, почнувајќи од:

„Колку денови во годината се сончеви во мојот град?“, па

сè до прашања како „Како мојата Влада ги троши парите? И

од каде доаѓаат тие пари?“ и „Како здравствените трошоци

влијаат на животниот век?“

Што може да кажеме за нив?

● Топчиња за голф (се користат за

играње голф - класификација)

● Бела боја

● Искористени се

● Сите тие имаат иста, одредена

големина

● Има одреден број топчиња Имаат

одредена парична вредност...

Видови податоци

● Квалитативни податоци се оние што се

однесуваат на квалитетот на нешто: опис по боја,

текстура, опис на искуства и податоци од интервју

– сите претставуваат квалитативни податоци.

● Квантитативни податоци се оние кои се

изразуваат со број. На пример, бројот на голф-

топчиња, нивната големина, цена итн.

Видови податоци

● Одделни податоци: нумерички податоци кои имаат

празнини во нив. На пример, бројот на топчиња.

Може да има само цел број топчиња (не може да

име 0,3 топчиња). Други примери би биле резултати

на испит или број на чевли.

● Континуирани податоци: нумерички податоци со

контиуниран опсег. Може да бидат избројани,

подредени и измерени. Пример: висина, тежина,

температура, количество на шеќер во портокал...

● Категорички податоци: објектот што го

објаснуваме го ставаат под одредена категорија: во

нашиот пример податокот „искористени“ е

категоричен податок (каде категориите би биле:

нови, искористени, скршени итн.)

● Редни податоци: податоци што може да бидат

рангирани (подредени) или бидат изразени преку

скала. Може да бидат избројани и подредени, но не

може да бидат измерени. Пример: скала од 1 до 5

Видови податоци

Категорија Спорт – Голф Категоричен податок

Боја Бела Квалитативен податок

Состојба Користени Категоричен податок

Дијаметар 43 mm Континуиран податок

Цена (по топче) 30 ден. Квантитативен податок

Квиз: видови податоци

Улога: Тапанар

❏ Континуиран податок

❏ Категоричен податок

❏ Квалитативен податок

Година на раѓање: 1963

❏ Квалитативен

❏ Одделен

❏ Континуиран

❏ Категоричен

Име: Елена Игнатова

❏ Квантитативен

❏ Квалитативен

❏ Одделен податок

Големина: M

❏ Реден податок

❏ Категоричен

❏ Континуиран

Висина: 187cm

❏ Одделен

❏ Категоричен

❏ Континуиран

❏ Квалитативен

Дата: 18 март 2015

❏ Одделен

❏ Категоричен

❏ Континуиран

Име Пол Возраст Висина Чувство

Дона Ж 21 190cm Изненадене

Елена Ж 23 167cm Благодарна

Тин М 25 167cm Заинтересиран

Дарко М 22 163cm Релаксиран

Ана Ж 22 156cm Оптимистична

Борис М 36 200cm Избезумен

Владимир М 35 167cm Возбуден

Бане M 24 180cm Нервозен

Милена Ж 29 160cm Многу

возбудена

Неструктурирани наспроти структурирани податоци

Податоци за луѓе

● „Имаме 5 користени топчиња за голф со дијаметар 43 mm и секое чини 30 ден.“

● Неструктуриран податок. Нема одредена структура – реченицата може лесно да

биде променета и не е јасно секој збор на што се однесува.

● Скениран ПДФ и фотографии - пријатни за око, не за машина

● Најчесто употребувани машински читливи формати: JSON, XML, RDF, CSV (Comma

Separated Files)...

Податоци за компјутери

● Некои задачи се лесни за луѓе, комплицирани за компјутерите.

● Пример: Текст претставен како слика.

● Одредена структура = машински читливи.

Концепт: Отворени податоци

Што се отворени податоци?

Отворени податоци се сите информации кои

може да бидат слободно употребувани,

реупотребувани и дистрибуирани од секого,

секаде и за секоја цел.

- OpenDefinition.org

Отворените податоци не се PDF!

● Машински читливи - во формат кој лесно може да биде обработен од

страна на компјутер

● Дигитално ≠ машински читливо

● Машински читливи формати: XML, CSV (comma separated values),

JSON

Отворени податоци и податоци од јавен

карактер НЕ е исто.

Бизнис сектор

...Медиуми

Истражувања

НВО

$

Секој има право на владините податоци!

Услови на споделување

Буџетите не се единствените владини

податоци кои треба/може да бидат

отворени!

Владините податоци НЕ се единствените

отворени податоци!

Кои податоци може да бидат

отворени?

● Административни: Буџети, трошоци, потрошувачка на енергија...

● Демографски: Приходи, возраст, струка...

● Демократски: Податоци од избори, податоци за средби, членови...

● Просторни: Згради на јавни институции, паркови, велосипедски

патеки, автобуски станици...

● Податоци за квалитет на животна средина: квалитет на вода,

воздух, почва...

● Плански: Искористеност на земја, катастарски податоци, барања...

Отворени владини податоци во Македонија

● www.otvorenipodatoci.gov.mk

● Државен завод за статистика

● World Bank

● Народна Банка на РМ

Малку инспирација

Алатки за обработка на

податоци

ScraperWiki [преземање на податоци]

Open Refine [чистење на податоци]

Google Sheets / OpenOffice Calc

[анализирање на податоци]

TileMill [презентирање на податоци]

The Data Hub [споделување на податоци]

Recommended