Upload
metamorphosis
View
257
Download
9
Embed Size (px)
Citation preview
Обука за отворени податоци
18 и 19 март, 2015
ШТО СЕ ПОДАТОЦИ?
Поставување прашања
● Повеќето луѓе не управуваат со податоци за забава. Тие имаат
приказна што сакаат да ја раскажат или проблем што сакаат
да го решат.
● Прашањето може да биде од каков било тип, почнувајќи од:
„Колку денови во годината се сончеви во мојот град?“, па
сè до прашања како „Како мојата Влада ги троши парите? И
од каде доаѓаат тие пари?“ и „Како здравствените трошоци
влијаат на животниот век?“
Што може да кажеме за нив?
● Топчиња за голф (се користат за
играње голф - класификација)
● Бела боја
● Искористени се
● Сите тие имаат иста, одредена
големина
● Има одреден број топчиња Имаат
одредена парична вредност...
Видови податоци
● Квалитативни податоци се оние што се
однесуваат на квалитетот на нешто: опис по боја,
текстура, опис на искуства и податоци од интервју
– сите претставуваат квалитативни податоци.
● Квантитативни податоци се оние кои се
изразуваат со број. На пример, бројот на голф-
топчиња, нивната големина, цена итн.
Видови податоци
● Одделни податоци: нумерички податоци кои имаат
празнини во нив. На пример, бројот на топчиња.
Може да има само цел број топчиња (не може да
име 0,3 топчиња). Други примери би биле резултати
на испит или број на чевли.
● Континуирани податоци: нумерички податоци со
контиуниран опсег. Може да бидат избројани,
подредени и измерени. Пример: висина, тежина,
температура, количество на шеќер во портокал...
● Категорички податоци: објектот што го
објаснуваме го ставаат под одредена категорија: во
нашиот пример податокот „искористени“ е
категоричен податок (каде категориите би биле:
нови, искористени, скршени итн.)
● Редни податоци: податоци што може да бидат
рангирани (подредени) или бидат изразени преку
скала. Може да бидат избројани и подредени, но не
може да бидат измерени. Пример: скала од 1 до 5
Видови податоци
Категорија Спорт – Голф Категоричен податок
Боја Бела Квалитативен податок
Состојба Користени Категоричен податок
Дијаметар 43 mm Континуиран податок
Цена (по топче) 30 ден. Квантитативен податок
Квиз: видови податоци
Улога: Тапанар
❏ Континуиран податок
❏ Категоричен податок
❏ Квалитативен податок
Година на раѓање: 1963
❏ Квалитативен
❏ Одделен
❏ Континуиран
❏ Категоричен
Име: Елена Игнатова
❏ Квантитативен
❏ Квалитативен
❏ Одделен податок
Големина: M
❏ Реден податок
❏ Категоричен
❏ Континуиран
Висина: 187cm
❏ Одделен
❏ Категоричен
❏ Континуиран
❏ Квалитативен
Дата: 18 март 2015
❏ Одделен
❏ Категоричен
❏ Континуиран
Име Пол Возраст Висина Чувство
Дона Ж 21 190cm Изненадене
Елена Ж 23 167cm Благодарна
Тин М 25 167cm Заинтересиран
Дарко М 22 163cm Релаксиран
Ана Ж 22 156cm Оптимистична
Борис М 36 200cm Избезумен
Владимир М 35 167cm Возбуден
Бане M 24 180cm Нервозен
Милена Ж 29 160cm Многу
возбудена
Неструктурирани наспроти структурирани податоци
Податоци за луѓе
● „Имаме 5 користени топчиња за голф со дијаметар 43 mm и секое чини 30 ден.“
● Неструктуриран податок. Нема одредена структура – реченицата може лесно да
биде променета и не е јасно секој збор на што се однесува.
● Скениран ПДФ и фотографии - пријатни за око, не за машина
● Најчесто употребувани машински читливи формати: JSON, XML, RDF, CSV (Comma
Separated Files)...
Податоци за компјутери
● Некои задачи се лесни за луѓе, комплицирани за компјутерите.
● Пример: Текст претставен како слика.
● Одредена структура = машински читливи.
Концепт: Отворени податоци
Што се отворени податоци?
Отворени податоци се сите информации кои
може да бидат слободно употребувани,
реупотребувани и дистрибуирани од секого,
секаде и за секоја цел.
- OpenDefinition.org
Отворените податоци не се PDF!
● Машински читливи - во формат кој лесно може да биде обработен од
страна на компјутер
● Дигитално ≠ машински читливо
● Машински читливи формати: XML, CSV (comma separated values),
JSON
Отворени податоци и податоци од јавен
карактер НЕ е исто.
Бизнис сектор
...Медиуми
Истражувања
НВО
$
Секој има право на владините податоци!
Услови на споделување
Буџетите не се единствените владини
податоци кои треба/може да бидат
отворени!
Владините податоци НЕ се единствените
отворени податоци!
Кои податоци може да бидат
отворени?
● Административни: Буџети, трошоци, потрошувачка на енергија...
● Демографски: Приходи, возраст, струка...
● Демократски: Податоци од избори, податоци за средби, членови...
● Просторни: Згради на јавни институции, паркови, велосипедски
патеки, автобуски станици...
● Податоци за квалитет на животна средина: квалитет на вода,
воздух, почва...
● Плански: Искористеност на земја, катастарски податоци, барања...
Отворени владини податоци во Македонија
● www.otvorenipodatoci.gov.mk
● Државен завод за статистика
● World Bank
● Народна Банка на РМ
Малку инспирација
Алатки за обработка на
податоци
ScraperWiki [преземање на податоци]
Open Refine [чистење на податоци]
Google Sheets / OpenOffice Calc
[анализирање на податоци]
TileMill [презентирање на податоци]
The Data Hub [споделување на податоци]