21
26/11/2012 1 1 地點 :香港會議展覽中心3G展覽廳 時間 2012 11 23 15:45 - 17:45 講者 :香港教育學院 心理研究學系 莫慕貞 學與教博覽2012 2 「對學習評估」 、 「促進學習的評 估」及「作為學習的評估」 在電子 學習的意義 評估「電子學習」的成果 運用電子軟件,評估學習的成果 電子評估例子 3 評估: 學到甚麼? 教學: 如何學? 如何教? 課程:要學甚麼? 要教甚麼? 電子學習 電子評估 4 觀察表現、測驗、考試 ……等方式 收集知識、能力、價值觀和態度等的學習顯證 讓學生了解自己在學習上的強項和短處 訂定下一步學習目標及策略 根據回饋,改善學習 讓家長: 了解子女的強、弱項 思考如何協助子女改善學習 對子女有合理期望 讓教師監察和了解學生的學習進度、難點及已掌握的知識和技能 思考如何協助學生在這基礎上更進一步 反思如何改善教學,以進一步配合學生的學習需要 回饋 形成性評估 促進學習的評估 形成性評估 形成性評估 5 總結性評估 總結性評估 對學習評估 元認知評估/ 自我評估 作為學習的評估 參考: Black 2011; Wiliam, 2011; Shepard, 2008; McTighe & O’Connor, 2005; Shute & Becker, 2010 6 根據 Wiliam and Thompson (2007) 的分類: 總結性評估 (Summative Assessment ): 總結學生在某個學習時期之後的學習成果 目的:分類,排序、認證或選拔 雖然有時會有激勵作用, 但不是最佳的回饋來源 形成性評估 (Formative Assessment ) : 在學習過程中,提供回饋和信息,以促進學習 元認知評估/ 自我評估(Metacognitive / Self- Assessment ) 在學習過程中, 或某個學習時期之後,學生反思自己在學 習上的進度、 困難、 得著、 強弱項、 策略、 歸因等 思考如何在這基礎上訂定下階段的學習目標、 計劃 評鑑 (Evaluation)評估教學習過程本身

Self-Regulation in the Classroom: A Perspective on ... · 在「在線教學」上有沒有用以下的質量指標? 教師 學生 1. 持續的,直接的,詳細的反饋 86

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • 26/11/2012

    1

    1

    地點 :香港會議展覽中心3G展覽廳

    時間 :2012 年 11 月 23 日 15:45 - 17:45

    講者 :香港教育學院 心理研究學系

    莫慕貞

    學與教博覽2012

    2

    「對學習評估」 、 「促進學習的評

    估」及「作為學習的評估」 在電子

    學習的意義

    評估「電子學習」的成果

    運用電子軟件,評估學習的成果

    電子評估例子

    3

    評估: 學到甚麼?

    教學: 如何學? 如何教?

    課程:要學甚麼? 要教甚麼?

    電子學習 電子評估

    4

    • 觀察表現、測驗、考試 ……等方式

    • 收集知識、能力、價值觀和態度等的學習顯證

    讓學生:

    • 了解自己在學習上的強項和短處

    • 訂定下一步學習目標及策略

    • 根據回饋,改善學習

    讓家長:

    • 了解子女的強、弱項

    • 思考如何協助子女改善學習

    • 對子女有合理期望

    讓教師:

    • 監察和了解學生的學習進度、難點及已掌握的知識和技能

    • 思考如何協助學生在這基礎上更進一步

    • 反思如何改善教學,以進一步配合學生的學習需要

    回饋

    形成性評估 促進學習的評估

    形成性評估

    形成性評估

    5

    總結性評估

    總結性評估

    對學習評估

    元認知評估/ 自我評估

    作為學習的評估

    參考: Black 2011; Wiliam, 2011; Shepard, 2008; McTighe & O’Connor, 2005; Shute & Becker, 2010 6

    根據 Wiliam and Thompson (2007) 的分類:

    總結性評估 (Summative Assessment ):

    • 總結學生在某個學習時期之後的學習成果

    • 目的:分類,排序、認證或選拔

    • 雖然有時會有激勵作用, 但不是最佳的回饋來源

    形成性評估 (Formative Assessment ) :

    • 在學習過程中,提供回饋和信息,以促進學習

    元認知評估/ 自我評估(Metacognitive / Self- Assessment ) : • 在學習過程中, 或某個學習時期之後,學生反思自己在學

    習上的進度、 困難、 得著、 強弱項、 策略、 歸因等

    • 思考如何在這基礎上訂定下階段的學習目標、 計劃

    評鑑 (Evaluation):評估教學習過程本身

    對學習評估

    促進學習的評估

    作為學習的評估

  • 26/11/2012

    2

    調控 評估 與回饋

    監察 目標

    與計劃 學生 老師 家長

    7

    對學習評估

    促進學習的評估

    作為學習的評估

    8

    「對學習評估」 、 「促進學習的評估」 、 「作為學習的評估」

    回饋乃影響學習的最重要因素 (Black & Wiliam, 1997; Hattie)

    認知與元認知因素為影響學習的四個主要因素之首 (American Psychological Association, 1997)

    可透過評估提供回饋, 建立元認知 (Black & Wiliam, 1997; Hattie)

    9

    Influence No. of effects Effect Size

    回饋 139 1.13

    之前的認知能力 896 1.04

    教學質量 22 1.00

    教學量 80 0.84

    整體效果 >500,000 0.4

    模擬與遊戲 111 0.34

    電腦輔助教學 566 0.31

    測試 1817 0.30

    Source:譯自www.arts.auckland.ac.nz/staff/index.cfm?P=5049 10

    效果量 = 1.0 的意義:

    • 推進學習所取得的成就的一年

    • 在 GCSE飛躍兩級(例如從C

    跳升至A)

    11

    1. 評估「電子學習」的成果

    2. 運用電子軟件,評估學習的成果

    3. 電子評估例子

    12

    「電子評估」的定義 “the use of ICT to support the iterative process

    of gathering and analysing information about

    student learning by teachers as well as learners

    and of evaluating it in relation to prior

    achievement and attainment of intended, as well

    as unintended learning outcomes”

    (Pachler, Daly, Mor, Mellar, 2010, p. 716)

  • 26/11/2012

    3

    13

    Bennett (1998)

    第一代:類似紙筆評估

    第二代:非多項選擇題、自動化項目生成、多媒體、

    自動評分

    第R代:複雜的模擬情景 (例如: 外科手術試),智能

    輔導 (Reinvention)

    前景:

    按需測試、電子檔案,診斷評估

    Goguadze & Melis, 2008; Pachler, Daly, Mor, & Mella,

    2010 ; Winters, 2005; Whitelock & Brasher, 2006 14

    一 般 「電子學習」 (Computer-based learning environment :

    CBLE) :包括超媒體(Hypermedia),多媒體(multimedia),模

    擬 (simulation),微觀世界 (micro-world),互聯網 (web-

    based) 等等學習環境, 對建構學習提供極為有利的條

    若設計得宜,在學習過程中,學生能控制自己的進度,

    選擇合適自己的方法和方向 , 並能透過電腦/電子產

    品,靈活而快速地監察和評估自己的學習成果。

    Goguadze & Melis, 2008; Pachler, Daly, Mor, & Mella,

    2010 ; Winters, 2005

    15

    很多 CBLE 設計, 還刻意地加入形成性評估,

    及提升學生元認知的回饋因素。

    關鍵是:學生能否善用CBLE所提供的學習環

    Goguadze & Melis, 2008; Pachler, Daly, Mor, & Mella,

    2010 ; Winters, 2005 16

    1. 電子教學涉及範式轉移 (Gayton, 2002):

    • 教師主導、課堂作業 → 學生中心、依重科技

    • 過程依靠學生自己監控學習過程,並主動完成作業

    • 有利於主動學習能力強的學生

    2. 學習變得更有趣味 (Robles & Braathen, 2002)

    3. 線上教學要求教師懂得:在培養學生利用電子技術來

    學習的同時,也處理學生同步和異步通信 (Perrin &

    Mayhew, 2000)

    4. 評估線上教學效益,要包含對人際溝通的質和量的評

    鑑(Singh & Pan, 2004)

    17

    Gaytan, J., & McEwen B. C. (2007). Effective online instructional and

    assessment strategies. The American Journal of Distance Education,

    27(3), 117-132

    1. 在網上學習的教師和學生有什麼特點?

    2. 如何保持在線課程的教學質量?

    3. 教師通常用甚麼策略來評估在線學習課程?

    4. 什麼類型的在線評估被學生和教師認為是有

    效的?

    5. 電子學習者認為互聯網是一種有效的教學環

    境嗎 , 抑或僅僅是一個方便呢 ? 18

    Gaytan & McEwen (2007)

    方法:

    • 通過 Blackboard 和 WebCT 課程管理系統,

    進行問卷調查(Questionnaire by Gay, Mills,

    & Airasian 2006 )。

    • 85教師,1963學生(響應的教師為34%,

    學生為17% ; 即29教師,332學生)

  • 26/11/2012

    4

    19

    在「在線教學」上有沒有用以下的質量指標? 教師 學生

    1. 持續的,直接的,詳細的反饋 86 57

    2. 嚴謹度起碼和傳統課程相等 83 80

    3. 適當地使用電郵,以協助教學 76 83

    4. 多元化教學策略 72 42

    5. 建立良好師生關係 72 67

    6. 在串聯的討論上,提出令人深思的問題 62 54

    7. 所有組員都參與討論區 52 36

    8. 使用多元化科技(例如視頻會議、異步討論版) 52 45

    9.分析聊天室交流,以確定需要注意的問題 48 26

    10.在線學習環境充滿動態交流 45 52

    11.分析聊天室交流,以確定團體凝聚力 38 37

    (Gaytan & McEwen 2007)

    20

    教師用的評估策略 (Gaytan & McEwen 2007)

    在「在線教學」上有沒有用以下的評估策略? 教師 學生

    1. 定期清楚解釋各種各樣的作業 93 69

    2.評估學生的作業,以確定是否達到預期學習成果 93 73

    3. 對學生的觀感,保持持續、直接、詳細的反饋 83 56

    4. 用量表來確定學習成果是否達到 66 58

    5.用學生自評來確定學習成果是否達到 66 59

    6.用串聯的討論來確定學生明白作業要求 59 70

    7.用多元評估策略(例如電子檔案) 48 43

    8. 檢視學生自評以確定學生明白教學內容 38 21

    9. 透過學生互評提供即時回饋 28 29

    10.用聊天室交流製作功課 17 21

    11.用自評以提供有關學習的即時及誠實的回饋 17 49

    12.用量表來評估交流的質量(例如網帖的深度) 15 43

    21

    哪些評估策略最有功效?(Gaytan & McEwen 2007)

    教師 學生

    專題研習 (21%) 自評 (19%)

    量表 (rubrics) (21%) 實踐測驗 (19%)

    及時小測 (21%) 串聯的討論 (10%)

    串聯的討論 (21%) 含即時回饋的每周功課 (7%)

    網上聊天室 (21%) 量表 (rubrics) (7%)

    同學互評 (21%) 專題研習/檔案 (7%)

    限時小測 (21%)

    檔案 (10%) 如何才能提升評估效用?

    自評 (7%) 提供有意義和及時的回饋 (16%)

    用多元評估策略 (7%)

    教師和學生眼中 最有功效的評估策略

    22

    1. 使用監考制度,以核實考生身份並避免作弊事件

    (Byrd & Lott, 2003; Singh & Pan, 2004)

    2. 同一試題,不要重覆使用

    3. 同 Project-based 評估或短答題 (例如利用WebCT)

    4. 提供適時回饋 (Bocchi, Eastman & Swift, 2004)

    5. 建構豐盛學習環境:內容豐富、形式多樣化、社際

    合作、群體動態強 (Roblyer & Ekhaml, 2000; Singh & Pan,

    2004) ,但要注意避免超載

    6. 評估題目可從紙筆評估改良而來

    7. 善用電子檔案

    23

    「互聯網學習」環境對科學學習的影響 Internet-based Science Learning Environment (ISLE)

    Lee, S. W.-Y., Tsai, C.-C., Wu, Y.-T., Tsai, M.-J., Liu, T.-C., Hwang, F.-K.,

    Liu, C.-H., Liang, J.-C., Wu., H.-C. & Chang, C.-Y. (2011). Internet-based

    Science Learning Environment: A review of journal publications.

    International Journal of Science Education, 33(14), 1893-1925.

    1995-2008

    科學學習: 生物、 物理、 化學 互聯網 實證研究 小學、中學、 大學 SSCI期刊出版

    研究問題

    1. 學生的性別及社經背景對透過互聯網學習科學有何

    影響?

    2. 互聯網對學習科學的學習成果有甚麼影響?

    A. 態度

    B. 動機

    C. 概念理解

    D. 概念上的變化

    24

    Lee et al. (2011) 文獻統整:

    E. 一般的認知能力

    F. 科學探究的認知技能

    G. 學生互動

  • 26/11/2012

    5

    學生背景特徵

    A. 性別及社經背景

    在要求自我主動學習、 運用互聯網學習科學的環

    境下,女生比男生強

    女生受益於在網上討論, 但男生比女生更享受網

    上談判,表現批判性判斷,或反思能力

    很少研究探討學生社經背景對透過互聯網學習科

    學的影響

    25

    Lee et al. (2011) 文獻統整:

    學生背景特徵

    B.先驗知識 (prior knowledge)

    領域先驗知識對透過互聯網學習科學有正面影響

    一般先驗知識及元認知對透過互聯網學習科學也

    有正面影響

    能力高低對透過互聯網學習科學的影響未有定論

    良好的 ISLE 設計能誘發學生運用領域先驗知識

    26

    Lee et al. (2011) 文獻統整:

    ISLE: Internet-based Science Learning Environment

    對學習成果的影響

    A. 態度(attitudes)

    研究發現,一般學生對互聯網學習科學(ISLE)態度

    正面,對科學態度也正面

    學生對控制學習進度的操制自由度 、學生的成績、

    能力和邏輯思維能力, 皆影響學生對ISLE的態度

    27

    Lee et al. (2011) 文獻統整:

    ISLE: Internet-based Science Learning Environment

    對學習成果的影響

    B. 動機(motivation): 可視化 (visualization) 、 給予學生的控

    制度和自我調節進度的自由度 、非威脅性的學習環

    境、評估時類近遊戲的功能, 以及混合課程皆影響

    學生對ISLE的學習動機

    28

    Lee et al. (2011) 文獻統整:

    ISLE: Internet-based Science Learning Environment

    對學習成果的影響

    C. 概念理解(Conceptual understanding)

    許多研究報告指出 ISLE 對學習理解科學概念有效

    益,如在線作業、在線評估、 利用在線資源作 科

    學探究、在線同步和異步通信、虛擬現實、仿真等

    但不是所有研究都發現ISLE 對學習理解科學概念有

    效益

    29

    Lee et al. (2011) 文獻統整:

    ISLE: Internet-based Science Learning Environment

    對學習成果的影響

    D. 概念上的變化(Conceptual change)

    刻意用 ISLE 引發科學概念上的變化的研究,能減

    低學生的誤解或替代概念

    30

    Lee et al. (2011) 文獻統整:

    ISLE: Internet-based Science Learning Environment

  • 26/11/2012

    6

    對學習成果的影響

    E.一般的認知能力 (General cognitive skills)

    ISLE可以 :

    促進自我主動學習

    促進視覺空間能力的發展

    提高學生的分析能力

    但學生在ISLE 學習時,卻傾向使用支援低層次認

    知技能的在線功能以解決問題 31

    Lee et al. (2011) 文獻統整:

    Internet-based Science Learning Environment

    對學習成果的影響

    F. 針對科學探究的具體認知技能(cognitive skills specific to science enquiry)

    ISLE 可以促進學生的:

    科學論證

    數據處理

    解釋能力

    科學過程技能能力

    32

    Lee et al. (2011) 文獻統整:

    Internet-based Science Learning Environment

    對學習成果的影響

    G. 學生互動 (Interaction)

    在線互動受以下因素影響:

    學生對學習環境所感受到的價值

    對在線討論和在網上發帖所要求的詳細程度

    視頻會議所顯示的資訊與科學學習的相關性

    不是所有網上發的帖都和科學學習有關

    過多的在線互動可能會導致信息負荷超載 33

    Lee et al. (2011) 文獻統整:

    34

    Lee et al. (2011)

    學習環境

    學生:

    • 態度

    • 動機

    • 概念理解

    • 概念上的變化

    • 一般的認知能力

    • 科學探究的認知技能

    • 學生互動

    35

    某個迷思的題項

    2. 更正

    對 確認方法正確

    對 某個迷思的題項

    1. 更正

    2. 回饋:KR及與錯誤有關回饋 • 用顏色指出錯誤所在 • 系統錯誤 :提示正確答案 • 非系統錯誤 : 用實例提示

    1. 回饋:提供結果資訊(KR) 、再試 錯

    某個迷思的題項

    對 確認方法正確

    3. 回饋:KR,與錯誤有關回饋及KCR • 用顏色指出錯誤所在 • 同時呈現正確答案 • 演示和說明正確答案

    Narciss (2008) 36

    1. 評估「電子學習」的成果

    2. 運用電子軟件,評估學習的成果

    3. 電子評估例子

  • 26/11/2012

    7

    37

    網上評估回饋的概念架構

    本質上 : 材料庫

    作業、 試題

    幾乎沒有提供即時回饋

    智能教學系統(例:Intelligent

    Tutoring System;

    Wolf, 2008)

    試圖跟踪和模彷學生

    提供即時、合適的, 和具體的回饋

    提供廣泛,但預設的回饋 和解難方法(例: Calvo & Ellis, 2010; Heeren & Jeuring,

    2010; Lee, Palazzo, Warnakulasooriya, &

    Pritchard, 2008)

    38

    考生回答每一個題目之後, 除非函數已到達預設的標準, 否則電腦會根據考生的整體反應, 選擇下一個題目, 直至函數已達到該標準。

    學生

    選擇深淺程度

    資料庫

    報告

    否 選擇下一題目

    答案達標? 是

    題數達標? 估計準確度

    達標?

    39

    優點 測驗「量身打造」 快速檢驗, 提供有關學生程度的回饋 對低能力者, 可減少猜答機率及焦慮 節省施測時間及題數:當精準度為95% 時,

    可節省一半施測題數(郭伯臣, 2010) 施測時間、 地點均極具彈性 試題容易修訂、保密

    缺點 若大規模同時試題, 需要大量電腦設施 診斷功能薄弱, 老師難以跟進

    40

    加、減混合運

    加法 減法

    乘法

    除法

    四則運算

    括號的處理

    加、減、乘混合運算

    乘、除混合運算

    41

    5 (2 3)

    7 2 6 2

    5 3

    14 2

    (8 2) (4 3)

    括號的處理

    18 (2 3) (4 2) 3

    ? ?

    42

    References:

    Wu, H.-M., Kuo, B.-C., & Yang, J.-M. (in press).

    Developing a knowledge structure based

    computerised adaptive test system.

    Educational Technology & Society,

    郭伯臣網站:KSAT;以知識結構為基礎的電

    腦適性測驗

  • 26/11/2012

    8

    43

    提供 優質回饋

    前題:是次評估是針對

    哪些學習點 (attributes)?

    認知診斷評估

    44

    45

    1. 學生–題項 表 ( 表) 是甚麼?

    2. 表能提供哪些促進學習的評估

    回饋?

    3. 表具備哪些優點和局限?

    4. 如何使用 表?

    如果甲的總分比乙高,則所有乙答對的題項,甲也必然

    答對。

    46

    47

    P 題目號碼 總分 高分 S 學 號 低分 答對人數 多 少

  • 26/11/2012

    9

    49 50

    •學生從高至低的能力排序

    •每位學生在每題的作答情況

    •作答情況是否合符統計推算

    •若否, 如何不合理?

    •題項從淺至深排序

    •題項的對、錯情況是否合符統計推算

    •若否, 如何不合理?

    51

    ® (version 2.2)

    53

    G. 產出

    1 3

    2 4 5

    7

    6

    學生

    題項

    • 學生 - 題項表 ( 表)

    學生從高至低的能力排序

    每位學生在每題的作答情況

    作答情況是否合符統計推算

    若否, 如何不合理?

    • 學生的總分 (原始分、百分數)

    • 學生在多項選擇題和對 、錯題的得分

    • 學生改良警告系數 (Student Modified Caution Index: MCI)

    • 學生類型

    54

  • 26/11/2012

    10

    55

    5

    學生在多項選擇題的得分(原始分)

    學生在對 、錯題的得分(原始分)

    學生的總分 (原始分)

    學生改良警告系數 (Student

    Modified Caution Index: MCI)

    學生類型

    56

    Source: Harnisch, D. L. (1980); Sato (1975)

    1 1

    1 1

    1

    i

    i

    i

    i

    n

    j

    J

    nJj

    jj

    n

    j

    J

    nj

    jijjij

    i

    nn

    nunu

    c

    0

    0.3

    0.5

    1

    異常情況 非常嚴重

    正常

    或有 異常情況

    MCI :

    反映答題情況異常的程度

    數值在 0 與 1 之間

    MCI 愈大,異常情況愈嚴重

    57

    學生

    能力

    100%

    50%

    0%

    學生改良警告系數 0.0 0.3 1.0

    學習表現良好,穩定性高

    學習表現高,但穩定性低

    學習不夠充份 、學力不足

    學習表現弱,學習不夠熟練,穩定性低

    A型 : 總分 > 50% ; MCI 0.3 B型 : 總分 > 50% ; MCI > 0.3 D型 : 總分 50% ; MCI > 0.3 C型 : 總分 50% ; MCI 0.3

    58

    學生MCI x 學生能力圖

    School X

    Class A

    59

    School X

    Class B

    School X

    Class D

    School X

    Class C

    鳴謝: 香港教育學院前評估研究中心劉清香主任

    School Y

    Class A

    School Y

    Class B

    鳴謝: 香港教育學院前評估研究中心劉清香主任

    60

  • 26/11/2012

    11

    School Z

    Class D

    鳴謝: 香港教育學院前評估研究中心劉清香主任 61

    • 學生 - 題項表 (Student-Problem Chart)

    題項從淺至深排序

    題項的對、錯情況是否合符統計推算

    若否, 如何不合理?

    • 題項的容易度 (Item Facility)

    • 題項改良警告系數 (Item Modified Caution Index)

    • 題項的鑑別度 (Item Discrimination)

    • 題項的信度 (Reliability)

    • 點二系列相關系數 (Point-biserial Correlation Coefficient)

    • 題項的效度

    • 選項分析 (Distractor Analysis)

    • 痕跡線分析 (Trace line analysis)

    62

    6

    63

    100%

    50%

    0% 0.0 0.3 1.0

    試題優良, 能區分強、 弱學生

    試題容易度, 但含異質沙石, 需修正

    試題困難度高。 比較適用於

    試題拙劣、答對率偏低, 而且含異質成份, 必須修正

    64

    小明 比 亞輝 強得多

    小明 亞輝

    65

    小明和亞輝一樣

    小明 亞輝

    小明比亞輝稍強

    小明 亞輝

    高、中、低分組答對和答錯的比例 選項 高分組 中分組 低分組

    0 0 20 50

    1 (Key) 100 80 50

    M (Missing) 0 0 0

    Total 100 100 100

    高、中、低分組所選取各選項的比例 選項 高分組 中分組 低分組

    A 0 20 100

    B 0 50 0

    C 50 10 0

    D (Key) 50 20 0

    M (Missing) 0 0 0

    Total 100 100 100

    Q3

    Q7

    66

  • 26/11/2012

    12

    67 68

    • 形成性評估資料的分析與診斷

    • 學生人數 30-45人 (基本上沒有上限)

    • 題目20-30題 (基本上沒有上限)

    • (統計數據+視覺) 判斷

    • 讓老師更深入瞭解學生的學習程度與題目困難度的關係

    • 具有基本統計知識的老師使用

    69

    優點 :

    • 評估診斷資料豐富、容易使用

    • 為老師提供每位學生在每一題的作答情況

    • 可用作改良評卷、 建立題庫的工具

    • 若設題時把學習點、 迷思等加入選項 , 則可利用痕跡線分析、選項、SP 曲線等 , 更深入瞭解學生的學習程度、困難與迷思

    局限性 :

    • 運用(統計數據+視覺) 判斷 , 故人數和題數不宜太多

    • 人和題互動 , 用家要小心判斷因果關係

    • SP Xpress (2.2) 暫時未能分析多分題或評卷效度數據 70

    71

    1. 羅氏模型是甚麼?

    2. 羅氏分析能提供哪些促進學習的

    評估回饋?

    3. 羅氏分析具備哪些優點和局限?

    72

    • 羅氏模型(Rasch Analysis) 是指

    丹麥數學家 George Rasch 所發

    展的統計分析方法

    • 目的 : 建構有信度效度的量表

    或尺規

    • 可用於總結性及形成性評估

  • 26/11/2012

    13

    73

    學習動機 學業成績

    如何測量學生

    的學業成績?

    • 測驗

    • 對錯題

    • 多項選擇題

    • 短答題

    如何測量學生

    的學習動機?

    • 問卷

    • 量表

    74

    唏!你去年80 分, 今年70分, 怎麼越

    讀越倒退啊 ?

    80分

    75

    運用「配對比較法」(Paired

    Comparison)

    把原始分數模化為機率

    (Probability)

    76

    人與題項的相對關係

    例子 - 跳高項目

    考生能力水平 (Person

    ability) 和題項難度 (Item

    Difficulty)之差異的模化

    77

    跳高的能力低於竿的高度

    失敗

    能力不及題項難度

    答錯

    跳高的能力超過竿的高度

    過竿

    能力超過題項難度

    答對

    78

    學習動機超過題項要求

    相當同意 學習動機: 我對學習感到興趣 。

    學習動機遠遠超過題項要求

    極之同意

    學習動機低于題項要求

    不太同意

    學習動機遠遠低于題項要求

    毫不同意

  • 26/11/2012

    14

    79

    學習動機超過題項要求

    相當同意

    學習動機遠遠超過題項要求

    極之同意

    學習動機感低于題項要求

    不太同意

    學習動機遠遠低于題項要求

    毫不同意

    學習動機:我在假期裏也想回校學習。

    比較難的題項(難:難於同意)

    A

    B

    C

    80

    比較難同意的題項

    比較容易同意的題項

    學習動機 較強的學生

    學習動機 較弱的學生

    81 P3 P6 S3

    小明

    某學生

    全港平均

    KEY

    82

    1. 題項- 考生地圖

    2. 「意料之外」的學生表現

    3. 孩子圖

    4. 評卷的維度、效度、 信度

    5. 題項的合適度

    6. 選項的效度

    83

    點選 Output Tables 內的表格 以理解學生數學表現及試題素質

    1. 漸近發展區 (ZPD) :在這區域內,若能得

    到支援,便可做到/學到新知識,否則不可。

    2. Scaffolding:在學生的 ZPD 區域內,提供

    鷹架支援,使他便可做到/學到新知識。

  • 26/11/2012

    15

    85

    比較難

    比較易

    能力較強

    能力較弱

    題項 學生

    將來努力的方向

    目前 (ZPD)

    已掌握

    86

    答對了 答錯了

    孩子的漸近發展區 ZPD

    診斷與補救教學 已掌握

    努力目標 拔尖

    87 88

    拔尖

    𝟏

    𝟓+

    𝟏

    𝟏𝟎

    𝟐

    𝟑+

    𝟏

    𝟔

    𝟑

    𝟖+

    𝟐

    𝟑

    𝟓

    𝟕+

    𝟓

    𝟔

    𝟓

    𝟕+

    𝟕

    𝟗

    𝟕

    𝟏𝟐+

    𝟖

    𝟐𝟏

    𝟏𝟏

    𝟏𝟐+

    𝟑

    𝟏𝟒 難,而且答錯

    了的題項

    𝟏

    𝟑+

    𝟏

    𝟑

    𝟏

    𝟓+

    𝟐

    𝟓

    𝟏

    𝟗+

    𝟒

    𝟗

    𝟑

    𝟒+

    𝟏

    𝟒

    𝟓

    𝟕+

    𝟑

    𝟕

    容易,而且答對了的題項

    診斷與補 救教學

    孩子圖 Kid Map

    89 𝟏

    𝟑+

    𝟏

    𝟑

    𝟏

    𝟓+

    𝟐

    𝟓

    𝟏

    𝟗+

    𝟒

    𝟗

    𝟑

    𝟒+

    𝟏

    𝟒

    𝟓

    𝟕+

    𝟑

    𝟕

    𝟏

    𝟓+

    𝟏

    𝟏𝟎

    𝟐

    𝟑+

    𝟏

    𝟔

    𝟑

    𝟖+

    𝟐

    𝟑

    𝟓

    𝟕+

    𝟓

    𝟔

    𝟓

    𝟕+

    𝟕

    𝟗

    𝟕

    𝟏𝟐+

    𝟖

    𝟐𝟏

    𝟏𝟏

    𝟏𝟐+

    𝟑

    𝟏𝟒 孩子圖

    Kid Map

    90

    1. 評估「電子學習」的成果

    2. 運用電子技術,評估學習的成果

    3. 電子評估例子

  • 26/11/2012

    16

    www.lexile.com

    91 92

    純文字檔 Multitrial.txt

    93

    語義和句法 semantic and syntactic

    94

    1500L

    1400L

    1300L

    1200L

    1100L

    1000L

    900L

    … ….

    The Decameron

    Don Quixote

    Little Women

    Hobbit or There and Back Again

    Harry Potter and the

    Chamber of Secrets (940L)

    The Dark Game

    Pride and Prejudice

    95 96

    深的閱讀材料

    淺的閱讀材料

    高閱讀能力水平

    低閱讀能力水平

    匹配能力的閱讀材料

    太深!

    太淺!

  • 26/11/2012

    17

    97

    鳴謝: 浸信會沙田圍呂明才小學 98

    2008年1月29日 至 2008年4月28日 • Lexile 水平 • 自信 • 動機 • 具體回饋

    99

    http://www.alearningoasis.com/

    100

    101

    kenny was alone in the dark, and he was cold. What had

    started as the first nice weekend of spring had now become

    a wintery storm, complete with freezing rain that formed ice

    as it collected along the roof of his tent. He think that if he

    left the tent and gathered some wood; he might be able to

    peel the bark off to reveel dry wood to start a fire. The

    problem was that if he failed to start a fire; then he’d be cold

    and wet, which was much worse than his current state, cold

    and dry. He decide to stay inside and bundle up as well as

    he could. He have an extra sweatshirt, which he rapped

    around his head to slow, the escape of whatever body heat

    he could muster. Then he rip pages from his notebook and

    crumpled them into makeshift gloves. All that was left to do

    was lie back, picture one of his mothers warm, homemade

    pies, and hope fo the best. 102

    Kenny was alone in the dark, and he was cold. What had

    started as the first nice weekend of spring had now become

    a Wintery storm, complete with freezing rain that formed ice

    as it collected along the roof of his tent. He thinks that if he

    left the tent and gathered some wood, he might be able to

    peel the bark off to reveel dry wood to start a fire. The

    problem was that if he failed to start a fire; then he’d be

    cold and wet, which was much worse than his current state,

    cold and dry. He decided to stay inside and bundle up as

    well as he could. He had an extra sweatshirt, which he

    rapped around his head to slow, the escape of whatever

    body heat he could muster. Then he rip pages from his

    notebook and crumpled them into makeshift gloves. All that

    was left to do was lie back, picture one of his mothers warm,

    homemade pies, and hope fo the best.

  • 26/11/2012

    18

    103

    拼寫錯誤 標點錯誤

    104

    http://blogs.edweek.org/edweek/on_innovation/201

    2/11/better_more_writing_review_of_42_apps.html

    Tom Vander Ark (CEO, International Association for K-12

    Online Learning) 於 2012年11月6日在Education

    Week 發表了一份題為 “Better & More

    Writing: Review of 42 Apps” 的文章內,評

    論了 42 個電子評估的應用程式,甚具參考

    價值。

    105

    http://www.wamap.com/

    106

    107 108

  • 26/11/2012

    19

    109 110

    http://genscope.concord.org/downloads/index.html

    http://concord.org/projects

    The Concord Consortium

    111 112

    113

    1. 評估「電子學習」的成果

    2. 運用電子技術,評估學習的成果

    3. 電子評估例子

    114

    人類基本需求:

    成就感 (achievement/competence)

    親和感 / 歸屬感 (affiliation/belonging)

    自主 /自由(autonomy/freedom)

    e.g. Ryan & Deci (2000) Self-Determination Theory

    其他參考: Glasser (2010) Choice Theory: 1. 生存 2. 愛與歸屬感 3. 成就 4. 自由 5. 有趣的

    這些電子評估設計滿足這些基本需求嗎?

  • 26/11/2012

    20

    115

    期望價值論 (Pintrich: Expectancy-Value Theory)

    價值成份

    這件工作有意義嗎?

    情感成份

    我喜歡做這份工作嗎?

    預期成份

    我有能力做好它嗎?

    會有甚麼後果?

    動機

    這些電子評估設計能激發學習動機

    嗎?

    116

    學習

    評估

    元認知 回饋

    O’Malley (1985):

    「沒有掌握元認知策略的學生基本上是一個沒有方向和沒有能力評估自己進步,自己的成績和確定自己未來學習方向的人。 」

    沒有評估難有好質素的回饋

    沒有高質素的回饋難發展高階思維及學習能力

    Selected References: e-learning & e-assessment

    Daanen, H., & Facer, K. (2007). 2020 and beyond. Available from:

    www.futurelab.org.uk/openingeducation

    DiPietro, M., Ferdig, R. e., Black E. W., Preston, M. (2011). Best practices in

    teaching K-12 online: Lessons learned from Michigan Virtual School teachers.

    Journal of Interactive Online Learning, 7(1), 10-35.

    Hart, C. (2012). Factors associated with student persistence in an online program

    study: A review of literature. Journal of Interactive Online Learning, 11(1), 19-42

    Gikandi, J. W., Morrow, D., Davis, N. E. (2011). Online formative assessment in

    higher education: A review of the literature. Computers & Education, 57, 2333-

    2351, Stödberg, U. (2011). A research review of e-assessment. Assessment &

    Evaluation in Higher Education, 37(5), 591-604.

    Lawton, D., Vye, N., Bransford, J., Sanders, E., Richey, M., French, D., & Stephens,

    R. (2012). Online learning based on essential concepts and formative

    assessment. Journal of Engineering Education, 101(2), 244-287.

    Mashaw, B. (2012). A model for measuring effectiveness of an online course.

    Decision Sciences Journal of Innovative Education, 10(2), 189-221.

    Narciss, S. (2008). Feedback strategies for interactive learning tasks. In J. M.

    Spector, M. D. Merrill, J. J. G. Van Merrienboer, & M. P. Driscoll (Eds.),

    Handbook of research on educational communications and technology (3rd ed.)

    (pp. 125-143). Mahwah, NJ: Erlbaum.

    117

    Selected References: SP Curve

    何英奇(1989) 。 精熟學習策略配合微電腦化S-P表分析診斷對學生

    學習效果的實驗研究。教育心理學報,22,頁191-214。

    余民寧(2002) 。第八章:學生問題表分析。《教育測驗與評量:成

    就測驗與教學評量》。台北市:心理出版社股份有限公司。頁

    325-369。

    陳騰祥 (1988) 。SP表分析理論及其在學習評鑑上教師命題技術改

    進態度的效用之探究。《輔導學報》,11,頁1-69。

    莫慕貞、丁彥銓、何昊璇、黃英華、謝棹南、徐坤、姚靜靜 (2011)

    。優化學習導向評估之SP Xpress 2.2。Hong Kong: Pace Pub. Ltd.

    黃桂君、吳裕益(2001)。應用S-P分析模式診斷學生數學計算能

    力—以聽障學生分數減法學習為例。特殊教育與復建學報,9,

    101-131。

    顏明仁(2011) 。第八章:試題分析(二)。促進學生學習的當代教

    育評估理論與實踐。香港:培生教育出版南亞洲有限公司。

    118

    Connell, M., & Harnisch, D. (2004). SP Charts: Creating a longitudinal view of a technology

    enabled intervention. In Crawford, C., Willis, D., Carlsen, R., Gibson, I., McFerrin, K.,

    Price, J., & Weber, R. (Eds.), Proceedings of Society for Information Technology and

    Teacher Education International Conference 2004 (pp. 951-954). Chesapeake, VA: AACE.

    Dai, C., Cheng, J., & Hsu, Y. (2005). The new meaning of S-P Chart. In P. Kommers, & G.

    Richards, (Eds.), Proceedings of World Conference on Educational Multimedia,

    Hypermedia and Telecommunications 2005 (pp. 3074-3079). Chesapeake, VA: AACE.

    Harnisch, D. L. (1983). Item response patterns: applications for educational practice.

    Journal of Educational Measurement, 20(2), 191-206.

    Harnisch, D. L., & Linn, R. L. (1981). Analysis of item patterns: Questionable test data and

    dissimilar curriculum practices. Journal of Educational Measurement, 18(3), 133-46.

    Harnisch, D. L., & Romy, N. (1985). SPP: Student Problem Package on the IBM-PC. User's

    Guide, Version 1.0. Champaign, IL: Office of Educational Testing, Research, and Service,

    University of Illinois at Urbana-Champaign.

    Sato, M., V., Fong, E., Gilbertson, J., Liebig, T., & Schwartzfarb, N. (2006) Changing

    mindsets about classroom assessment. Science Educator, 15(1), 21-28.

    Sato, T. (1980). The S-P chart and caution index. NEC Educational Information Bulletin, 80-1,

    C&C Systems Research Laboratories, Nippon Eletric Co., Ltd.

    Sato, T. (1985). Introduction to student-problem curve theory analysis and evaluation. Meiji

    Tosho: Tokyo.

    Switzer, D. M., & Connell, M. L. (1990). Practical applications of student response analysis.

    Educational Measurement: Issues and Practices, 9(2), 15-17.

    Tatsuoka, K. K. (1984). Caution indices based on item response theory. Psychometrika,

    49(1), 95-110.

    Wu, H.-Y. (1998). Software based on S-P chart analysis and its applications. Proc. National

    Science Counc. ROC(D), 8(3), 108-120.

    119

    120

    Rasch References Bond, T., & Fox, C. (2007). Applying the Rasch Measurement :Fundamental

    Measurement in the Human Sciences. 2nd ed. Mahwah, N.J. : Lawrence

    Erlbaum

    Garner, M. L. et al. (2011). Advances in Rasch measurement. Maple Grove, MN:

    Jam Press.

    Journal of Applied Measurement : http://www.jampress.org/

    Journal of Outcome Measurement

    Linacre, J. M. (Ed.)(1995-). Rasch Measurement Transactions. Chicago, Ill.: MESA

    Press

    Mok, M. M. C. (2008). 羅氏模型之應用 Applications of Rasch Model. HK: HKIEd. Smith, R. M. (1999). Rasch measurement models: Interpreting

    WINSTEPS/BIGSTEPS and FACETS output. Maple Grove, Minn: Jam Press.

    Smith, E., & Smith, R. M. (2004). Introduction to Rasch Measurement. Maple

    Grove, Minn. : JAM Press

    Waugh, R. (Ed.)(2010). Applications of Rasch measurement in education. NY:

    Nova Science Publishers.

    Wilson, M. (2004). Constructing Measures: An Item Response Modeling Approach.

    Mahwah NJ: Lawrence Erlbaum Associates

    Wright, B. D., & Stone, M. H. (1979). Best Test Design. Chicago, Ill. : MESA Press

    Wright, B. D., & Masters, G. N. (1982). Rating scale analysis. Chicago, Ill. : MESA

    www.winsteps.com

    www.Rasch.org

    http://www.futurelab.org.uk/openingeducation

  • 26/11/2012

    21

    121

    莫慕貞 [email protected]