24
以開放資料指標(Open Data Index)為例 台灣開放資料評比排名提升對策分析 行政院科技會報辦公室 104年6月1日 0

20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

  • Upload
    eric-tu

  • View
    407

  • Download
    2

Embed Size (px)

Citation preview

Page 1: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

以開放資料指標(Open Data Index)為例台灣開放資料評比排名提升對策分析

行政院科技會報辦公室

104年6月1日

0

Page 2: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

何謂開放資料指標(Open Data Index)?

1

Page 3: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

何謂開放資料指標(Open Data Index)?

指標簡介:英國開放資料推動組織『開放知識基金會(Open Knowledge Foundation)』研擬之政府開放資料評鑑指標,目的在於檢核世界各國重要開放資料集(Dataset)之開放程度,包括資料集是否已開放(Accessibility)?資料集是否易於使用(Availability)?此評估指標並非官方報告,而是從公民角度以集體智慧(Crowdsourcing)方式進行開放資料程度的獨立評估

評比公布:2015年1月發布第二次評估結果,2015年底預計發布第三次評估結果

評比方式:分為兩階段,首先由關注開放資料的社群(稱為volunteer contributor,任何人均可,無資格限制)提出評比分數(Submission,結果不公開),再由OKF認可的專家(Expert Reviewer)進行第二階段的評比結果審核,並正式公告評估結果

涵蓋國家:包含歐、美、亞洲、拉丁美洲,全球超過97個國家(或區域)

說明:顏色偏綠分數越高,顏色偏紅則分數越低

2

Page 4: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

受評鑑之十大重要資料集項目

資料集(Dataset)評鑑項目

參考G8 Open Data Charter公布的關鍵資料集類別,進行評核

1. 交通時刻表(Transport timetables):大眾運輸交通時刻表資料(特別指國家層級、

寡佔的交通服務, ex:高鐵、台鐵)2. 政府預算(Government budget):政府部門年度規劃之預算資料

3. 政府支出(Government spending):政府部門實際之支出交易記錄,例如人事費中的

薪酬成本,業務費中的勞務與產品採購內容,且金額超過10萬美元即須公開

4. 選舉結果(Election results):中央或地方選舉結果

5. 公司登記(Company register):包括公司行號、統一編號、住址等資料(並不需要詳

細的財務數據、資產負債表)

6. 地理圖資(National map):尺度在1:250,000 (即1cm = 2.5km)以上的高階地圖。

7. 國家統計數據(National statistics):GDP、失業率以及人口數量等關鍵的人口普

查與經濟統計數據,如每季GDP或年度人口統計的匯總資料(Aggregate

data)均可被採納8. 法律規範(Legislation):國家的法律和法規

9. 郵遞區號(Postcodes/Zipcodes):郵遞區號或可對應經緯度位置的國家座標資料庫

10. 污染散播(Emissions of pollutants):對人體有直接或潛在危害的空氣污染物,其排放

總量資料 (包含溫室氣體、一氧化碳、氮氧化物、懸浮微粒)3

Page 5: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

OKFN建議以國家級data.gov網站為優先評鑑

OKFN的教戰手冊中,指導submitter如何尋找資料集。依其方法,可佐證若將資料集放在國家級的data.gov.xxx平台,則資料集最優先被找到,評比分數自然就高。

4

Page 6: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

開放資料指標評鑑示意圖(以交通時刻表為例)

「資料存在(exist)」:政府部門確實有此因業務而產生的資料集【權重5】

「資料為數位化格式(digital)」:資料集以數位化儲存方式(網路或實體硬碟中) 【權重5】

「資料為免費可用(free)」:不需收取費用)【權重15】

「資料可以整包(in bulk)下載」:在滿足資料容易存取的目的下,同一種類資料集可一次在網站上整包直接下載,無須分批下載原始檔案,亦不需再經過資料庫查詢篩選【權重10】

「資料即時更新(update)」:依據不同資料集屬性有不同更新頻率,若即時交通時刻就需頻繁更新【權重10】

「資料可以公開(Publicly)取得」:資料可以直接在data.gov.tw單一入口網站(portal)或官方網站公開下載,不需特別註冊登入【權重5】

「資料為機器可讀(machine readable)」:必須符合以下格式:XLS、CSV、JSON、XML才可視為機器可讀【權重15】

「資料為開放授權(openly licensed)」:採用政府資料開放平台使用規範,符合開放資料精神【權重30】

「資料可線上(online)取得」:資料可以在網路上(透過Website, URL)下載(或許需要註冊) 【權重5】

5

Page 7: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

2014年開放資料指標評比結果

6

Page 8: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

2014年評比排名結果分析

標竿國家排名

交通時刻表

政府預算

政府支出

選舉結果

公司登記

國家統計數據

地理圖資

法律規範

郵遞區號

污染擴散

總分

1. 英國 100 90 100 100 100 90 100 100 100 90 970

2. 丹麥 60 100 40 100 85 90 100 60 100 90 830

3. 法國 70 100 10 100 50 100 100 70 100 100 800

4. 芬蘭 100 90 10 100 55 100 100 70 45 60 730

5. 澳洲 45 100 10 100 70 100 100 45 90 60 720

5. 紐西蘭 45 100 10 100 60 100 100 100 45 60 720

7.挪威 90 70 10 100 100 100 100 30 10 100 710

8.美國 45 100 10 70 15 100 100 100 90 70 700

9.德國 25 100 10 100 30 100 100 100 25 100 690

10.印度 45 100 10 70 100 100 40 100 10 100 680

11. 台灣 100 70 10 45 90 50 70 75 70 90 670

19. 日本 45 70 10 70 30 70 70 75 100 70 610

28.南韓 90 70 10 45 60 60 40 55 10 90 530

前十名概況:英國、丹麥、法國位居前三名,美國第8,印度異軍突起由第27躍居第10。

資料集評比:『政府支出』資料集為各國開放罩門,僅英國獲得滿分,其餘資料集得分有高有低,各國家均有改善空間(如挪威之郵遞區號僅得10分、美國之公司登記為15分)

台灣排名為第11名,與美國、德國、印度相距不遠,有相當機會迎頭趕上

7

Page 9: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

英國連續兩年評比居全球之冠,值得學習

英國已連續兩年(2013 & 2014年)取得開放資料指標評鑑冠軍,10大關鍵開放資料集(Dataset)開放程度(Availability)總分平均高達97分

因英國大力推動開放資料授權(Open Government License for public sector information)與開放資料平台建置(data.gov.uk),故其10大關鍵開放資料集均符合:可公開取得、免費使用、機器可讀、特定網站下載、與開放授權等衡量標準,僅少數資料集因無法批次下載(汙染排放、國家統計)或是即時更新(政府預算)而未獲得滿分

8

Page 10: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

印度將資料集上傳至data.gov.in平台大幅提升排名

資料來源:http://index.okfn.org/place/india/

2014年

2013年 NO. 27

NO. 10

將國家統計、公司登記、法律規範、政府預算、環境汙染等資料集均放置在data.gov.in網站

大幅提升整體排名

9

Page 11: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

影響台灣排名提升之關鍵資料集問題分析

10

Page 12: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

台灣最具改進空間的前三項評估指標政府支出、選舉結果、國家統計數據

指標評比分數低落關鍵在於缺乏『整包批次下載』與『開放資料授權』;亦有『資料是否免費』、『資料可否線上下載』、『資料即時更新』與『機器可讀』等問題

資料是否存在

是否為數位化格式

是否可公開取得

是否可免費使用

是否可線上取得

是否為機器可讀

是否可批次下載

是否為開放授權

是否即時更新

總分

交通時刻 O O O O O O O O O 100

政府預算 O O O O O O O X O 70

政府支出 O O X X X X X X X 10

選舉結果 O O O ? O O X X O 45

公司登記 O O O O O O X O O 90

地理圖資 O O O O O O O X O 70

國家統計數據 O O O O O O X X X 50

法律規範 O O O O O X X O O 75

郵遞區號 O O O O O O O ? O 70

汙染散播 O O O O O O X O O 90

O代表得分,X代表失分,?代表不確定 11

Page 13: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

台灣『政府支出』開放資料集須改善之問題主計總處公告資料非詳細交易資料影響評比結果

台灣政府103全年度支出(決算)提供彙整的整合資料,包含有:• 經常支出:人事費(6億)、業務費(2

億)、獎補助費(2百萬)• 資本支出:設備及投資(2.9千萬)

細項拆解

一級單位「歲出用途別決算分析表」

•OKFN認為主計處網站所提供資料是已彙整的整合資料(Aggregated data ),而非詳細的交易(transactional spending data)原始資料(raw data)。•故此資料集僅符合「資料存在」與「資料已數位化」兩項評估指標,其餘評估指標得分均為0。

比較

非詳細之單筆交易支出資料,即非raw data

不符合開放資料要求

評比結果分析

行政院主計總處「統計專區」首頁->中央政府總決算->歲出機關決算總表.xls

12

Page 14: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

英國『政府支出』開放資料集內容

『政府支出』資料集內容為各部門每筆「原始交易支出明細」,而非「彙整」後的整合資料

政府部門名稱 交易時間 交易費用明細 交易費用種類

供應商 交易編號 交易金額 交易備註說明

13

Page 15: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

『政府支出』資料集改善借鏡案例英國強調開放透明,「政府支出」徹底公開

• 符合Open Data Index定義:細節包含各組織名稱、單位支出金額、公共支出統計分析類別名稱與編碼(PESA)(包含折舊、薪資成本、採購勞務與商品、資產購入等內容)

• 政策明訂開放:中央政府規定需定期公布滿2萬5千元的交易名單,甚至有些部門還規定需公布500英鎊以內的

• 資料開放授權:財政部(HMTreasury)的「COIN/OSCAR」資料庫(Online System for Central Accounting and Reporting)採用UK Open Government License,該資料庫資料集滿足免費、線上取得、機器可讀、批次下載、即時更新與開放授權等多重衡量條件

評比得分關鍵分析

14

Page 16: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

台灣『選舉結果』開放資料集須改善之問題

需改善之關鍵議題

1. 資料無法批次下載

2. 資料未開放授權

3. 不確定資料是否可免費取得?

現況

評比

http://db.cec.gov.tw/1. 無法批次下載:資料需

要逐層點選,才能知道詳細得票明細,或檔案提供「Zip 壓縮檔」

2. 未開放授權:版權限制,網頁註明「中央選舉委員會版權所有」

3. 不確定資料是否免費可得:網站中沒有資料使用規範,不確定是否免費

評比結果分析

15

Page 17: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

英國『選舉結果』開放資料集推動做法

• 開放資料內容:含括英國中央、地方政府以及歐盟議會選舉結果

• 開放資料使用:可批次下載、提供CSV/Excel檔案格式

• 資料開放授權:2013年10月,英國選委會(Electoral Commission)於其官方網站公布網站使用條款,宣稱所屬資料集均適用Open Government License,可免費下載、再利用 16

Page 18: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

台灣『國家統計數據』開放資料集須改善之問題

http://www.dgbas.gov.tw1. 無法批次下載:資料需要逐層點選(如另開視窗到「內政部統計月報」)

2. 未開放授權:網頁註明「行政院主計總處版權

所有 CopyRight」3. 未及時更新:資料張貼時間為2006/2/21

無法在單一平台,整批下載

評比結果分析

以全國統計資料->「人口」->人口靜態統計為例,需逐層點選、另開網頁到「內政部統計月報」方可下載!

平台一:主計總處官網

平台二:內政部統計月報

1

3

平台三:政府資料開放平台

2 資料所有權橫跨其他業務單位(e.g. 內政部),同時涉及戶籍法的規費限制,現階段暫時無法開放授權 17

Page 19: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

英國『國家統計數據』開放資料集推動做法

主管機關:國家統計局(Office of National Statistics)

資料屬性:國家層級之經濟與人口資料(如:人口普查、GDP、失業率…)

資料授權:所有資料均適用開放資料授權(Open Government License for public sector information)

開放資料集滿足以下要求

可公開取得

免費使用

機器可讀(主要為excel, 亦有CSV & XML格式檔案)

特定網站下載

18

Page 20: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

台灣開放資料集其他問題資料集授權條件不一致:郵遞區號

下載途徑一:原業務單位所屬網頁 下載途徑二:政府資料開放平台

資料集授權條件不一致:OKFN不易評鑑,民眾也無所適從

授權條款不一致

沒有開放授權:網頁標示-「中華郵政版權所有」

有開放授權:但非機器可讀取格式(txt)

19

Page 21: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

開放資料集改善狀況與台灣排名提升建議

20

Page 22: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

十大開放資料集之開放程度改善現況

除了『交通時刻表』外,『選舉結果』、『公司登記』與『汙染散播』均已完全改進,得分滿分。 總得分由2014年的670分,增加為745分,假設其他國家分數不變的話,將躍升為第4名

資料是否存在

是否為數位化格式

是否可公開取得

是否可免費使用

是否可線上取得

是否為機器可讀

是否可批次下載

是否為開放授權

是否即時更新

總分

交通時刻 O O O O O O O O O 100

政府預算 O O O O O O O ? O 70

政府支出 O O X X X X X X X 10

選舉結果 O O O O O O 100

公司登記 O O O O O O O O 100

地理圖資 O O O O O O O X O 70

國家統計數據 O O O O O O X ? X 50

法律規範 O O O O O X X O O 75

郵遞區號 O O O O O O O ? O 70

汙染散播 O O O O O O O O 100

O代表得分、X代表失分、?代表不確定、 代表已改進

OK OK OK

OK

OK

21OK 備註:上述評比來源為各部會之官方網站

Page 23: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

台灣排名提升改善建議

短期:

建議10大關鍵資料集之主政單位均應將其開放資料集於data.gov.tw平台同步完整開放

開放資料集於主政單位官網與data.gov.tw平台之開放條件應相同(如郵遞區號資料集之授權條件問題)

長期:建議中央所屬部會均應落實開放資料政策之推動

由上而下推動開放資料政策,強化公務員之政府資料開放意識與文化

全面盤點部會所屬資料集,提升開放資料集之品質與可用性

鼓勵各部會開立資料相關(data-related)教育課程(如open data policy, big data analysis、data privacy risk…),以提升公務員對於資料的了解與運用能力

22

Page 24: 20150601 以開放資料指標(open data index)為例 台灣開放資料排名提升對策分析

提請討論

23