Edutainme: Большие данные в образовании

Preview:

DESCRIPTION

 

Citation preview

БОЛЬШИЕ ДАННЫЕ в образовании

ИСТОЧНИКИ •  Ryan Baker, Associate Professor, Human Development,

Teachers College, Columbia University

•  Arthur Graesser, editor, Journal of Education Psychology

•  Baker & Siemens, in press, building off Baker & Yacef

•  Aleven et al’s help-seeking model

ЧТО ТАКОЕ БОЛЬШИЕ ДАННЫЕ? Всего лишь много данных. Очень много

•  Фамилии учеников •  Годовые оценки •  Пропуски по болезни •  Количество потерянных учебников •  Количество забитых

на физкультуре голов

ПОЧЕМУ МЫ НЕ СЛЫШАЛИ ОБ ЭТОМ РАНЬШЕ?

•  Требовало много ресурсов на сбор

•  Требовало много ресурсов на обработку

•  Сложно применять

А СЕЙЧАС?

•  Документооборот в электронном виде

•  Аппаратные системы учета (турникеты, магнитные карточки)

•  Электронные системы

ЭЛЕКТРОННЫЕ СИСТЕМЫ

•  Онлайн-курсы (в том числе MOOCs) •  Электронные учебники •  Системы для смешенного и дистанционного обучения

•  Данные легко накапливать •  Данные применяются мгновенно, адаптируя обучение

под каждого ученика

Возможности

ПЕРВЫЙ АРХИВ ДАННЫХ PSLC Datashop

•  250.000 часов •  30 млн. действий, ответов и результатов

https://pslcdatashop.web.cmu.edu

АНАЛИЗ БОЛЬШИХ ДАННЫХ

•  Используется в научных, исследовательских и педагогических целях

•  Для формирования индивидуальных траекторий и комплексных систем

•  Родом из машинного обучения, распознавания образов, психометрии и статистики

С ПОМОЩЬЮ БОЛЬШИХ ДАННЫХ

•  Улучшают педагогический дизайн

•  Автоматизируют реакцию системы

•  Помогают информировать учителей и родителей

ОСНОВНЫЕ МОДЕЛИ

ПРОГНОЗ

Комбинация известных данных позволяет прогнозировать искомое неизвестное

ИСХОДНЫЕ ДАННЫЕ

•  Записи школьных систем •  Интернет-сервисы •  Опросы •  Эксперименты

ПРОГНОЗИРУЕМЫЕ ДАННЫЕ

•  время, потраченное на решение

•  % просмотренного видео

•  результат теста в баллах

•  количество использованных

подсказок

•  бросит/не бросит курс

•  запишется на курс А/Б/В/Г

•  попросит пример/попробует

решить/попросит подсказку/

Число Категория

ПРИМЕР АЛГОРИТМА «ДЕРЕВО РЕШЕНИЙ»

ПРИМЕР АЛГОРИТМА K*

ПРОГНОЗЫ ТИПА «ДА/НЕТ» Не только решение, но и вероятность

•  В минуту ученик усваивает 0.05% курса

•  Неправильный прогноз «стоит» 1 лишнюю минуту обучения

•  Правильный прогноз добавляет 0.03%.

ВАЛИДАЦИЯ

•  Зависимости или случайные совпадения?

•  Повторяется ли зависимость из одной группы в остальных? Применимо ли это к каждой из групп?

•  Обобщение: применима ли найденная зависимость к новым данным?

ОЦЕНКА ЗНАНИЙ

ЗАЧЕМ ОЦЕНИВАТЬ ЗНАНИЯ

•  Расширить знания ученика

•  Оценить работу преподавателя

•  Подстраивать работу системы под ученика

УСПЕВАЕМОСТЬ В СИСТЕМЕ ≠ РЕАЛЬНЫЕ ЗНАНИЯ

•  Может не знать, но правильно ответить («угадать»)

•  Может ответить неправильно по ошибке или случайно

ОЦЕНКА ПОВЕДЕНИЯ

ЕСЛИ НЕ ИНТЕРЕСНО

1.  Пытается «переиграть», то есть добиться успеха без обучения

Перебирает все варианты ответов или вызывает подсказки, пока не появится правильный ответ

2.  Отвлекается на другие задачи

Разговаривает с учителем или проверяет Вконтакт

3.  Отвечает бездумно, наугад, даже не пытаясь подумать

ЕСЛИ НЕ ИНТЕРЕСНО

4.  Ведет себя черт-знает-как

В виртуальном мире, где нужно понять, от какой болезни умирают люди, забирается на виртуальное дерево, срывает виртуальный банан, слезает и пытаться спустить его в виртуальный унитаз

ЕСЛИ НЕ ИНТЕРЕСНО

МЕТА-КОГНИТИВНЫЕ ПРОБЛЕМЫ •  Не использует подсказки, даже когда долго не может

решить задачу

•  После совершения ошибки останавливается на правильном ответе

•  Прощелкивает подсказки, правильно отвечает на вопрос (превращая его в пример решения), и потом останавливается

РАЗНЫЕ УРОВНИ ИНТЕРПРЕТАЦИИ

•  Какой урок – самый скучный

•  Какой день недели наименее эффективный

•  Кто из учеников пытался “переиграть” систему (кому

назначить дополнительные занятия)

После недели наблюдений за поведением учеников

ДРУГИЕ МОДЕЛИ

СЕТЕВОЙ АНАЛИЗ

•  Люди (учителя, ученики, авторы проектов и обычные участники) = “узлы”

•  Узлы соединяются связями •  Связи: сильные или слабыми в зависимости от интенсивности и частоты общения

СЕТЕВОЙ АНАЛИЗ

ТИПЫ ВЗАИМОДЕЙСТВИЯ

•  Коллективная работа с одним источником или ресурсом, •  Лидерство •  Помощь •  Критика •  Или даже оскорбление

ДАННЫЕ ОПРЕДЕЛЯЮТ

•  Плотность: сколько возможных связей установлено между учениками

•  Доступность: есть ли такие ученики, с которыми никто не общается?

•  Поток: сколько существует возможных маршрутов (через разные “узлы”) от одного ученика к другому

•  Центричность: насколько важен каждый ученик или кто самый влиятельный в классе. Определяется исходя из:

•  Количество связей, ведущих к ученику (входящие и исходящие связи считаются отдельно)

•  Близость = сумма расстояний до каждого другого ученика. Сильные связи считаются за более близкие.

•  Количество проходящих через ученика маршрутов между другими “узлами”

ДАННЫЕ ОПРЕДЕЛЯЮТ

•  Взаимность: количество двунаправленных связей во всех парах

•  Собственный вектор: параметр, вычисляемый математически, отталкиваясь от количества и силы связей. (Google PageRank)

ПРИМЕНИМОСТЬ

http://www.knewton.com

СПАСИБО НАТАЛЬЯ ЧЕБОТАРЬ

ВЛАДИМИР СИНЕЛЬНИКОВ

Recommended