55
27.10.20 1 IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering IN1050 - Introduksjon til design, bruk, interaksjon Gjennomføring av evaluering 27. oktober 2020 Institutt for Informatikk, Universitetet i Oslo [email protected]

IN1050 - Introduksjon til design, bruk, interaksjon Gjennomføring … · 27.10.20 IN1050 –Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

  • 27.10.20 1IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    IN1050 - Introduksjon til design, bruk, interaksjon

    Gjennomføring av evaluering

    27. oktober 2020

    Institutt for Informatikk, Universitetet i Oslo

    [email protected]

  • 27.10.20 2IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Dagens forelesning

    • Årets eksamen og neste ukes forelesning

    • Repetisjon av sist ukes pensum

    • Tre tilnærminger for evaluering

    • Kombinasjon av tilnærminger

    • Evalueringsmetoder

    • DECIDE-rammeverket

    • Bestemme mål

    • Utforske spørsmålene

    • Velge tilnærming og metode for evaluering

    • Identifisere praktiske forhold

    • Beslutte hvordan etiske forhold skal håndteres

    • Evaluere, analysere, tolke og presentere data

    • Obligatorisk oppgave 4

    • Repetere

    • Tydeliggjøre og oppklare

    • Eksemplifisere

    • Utvide

    • Kontekstualisere

  • 27.10.20 3IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Årets eksamen

    • Dato: onsdag 2. desember kl. 15:00 – 19:00

    • Sted: Inspera (digital hjemmeeksamen)

    • Format: alle hjelpemidler tillatt og det skal ikke være kommunikasjon studenter i mellom under eksamen

    • Husk! Samme pensum og samme læringsmål som tidligere, men et annet eksamineringsformat enn tidligere

    • Hva blir annerledes med innholdet i eksamen i år?

    • Færre konkrete spørsmål om definisjons- og begrepsteori (tilsvarende tidligere del 1 og 2)

    • Fortsatt oppgaver med et gitt case (tilsvarende tidligere del 3)

    • Mer fokus på spørsmål hvor dere ikke kan skrive av svaret fra et lysark eller rett av boka

    • Mer fokus på åpne diskusjonsoppgaver hvor dere selv må trekke inn relevante begreper (tilsvarende tidligere del 4)

    • Avklaring rundt trøsterunde kommer til uka

  • 27.10.20 4IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Neste uke (med forbehold om endringer)

    • Vi gjør oss ferdig med pensum i dag, så fra neste uke er det fokus på oppsummering, repetisjon og eksamen

    • Neste uke starter vi med å snakke mer om faglig innhold eksamen

    • Vi ser også på Inspera (system for digital hjemmeeksamen)

    • (Hvis tid) Vi snakker om hvordan sensorer typisk vurderer oppgaver i dette emnet

    • Vi kommer tilbake neste uke med en plan for resten av semesteret, inkl. plenums- og gruppeundervisningen

  • 27.10.20 5IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Hvordan bruke oss best mulig frem mot eksamen?

    • Med utgangspunkt i det du allerede har:

    Spørsmål til konkrete tilbakemeldinger du har fått på innleverte obligatoriske oppgaver → Obligretter, gruppelærer, Joshi

    • Raske spørsmål som er raskt avklart:

    Spørsmål rundt begreper du er usikker på om du har forstått korrekt → Gruppelærer, plenumslærer, Joshi

    • Når du har kommet i gang med repetisjonen:

    Konkrete spørsmål til tolkning av tidligere eksamensoppgaver → Gruppelærer, plenumslærer, Joshi

    • Når du har begynt å øve på å svare konkret:

    Gjennomlesing av konkrete svar på konkrete oppgaver fra tidligere eksamener → Plenumslærer, Joshi

    • Når du er klar for generalprøven:

    Vurdering av en hel eksamensbesvarelse som er besvart som en ekte innlevering → Joshi

    • Vi er kan sette av tid allerede fra i dag, så dere bestemmer når dere er klare – det er ingen grunn til å vente

    Husk:

    - Start gjerne med et spørsmål på Teams

    → så svarer vi hvis vi kan og gir beskjed

    om det heller bør rettes til noen konkrete

    - Vi foretrekker å ikke ta ting over e-post

    da det av erfaring fungerer bedre og går

    raskere over Zoom eller ansikt-til-ansikt

    → send e-post for å avtale tid, ikke

    for å stille mange spørsmål

    - Vi må prøve å få tid til alle

    → jo flere som kan delta samtidig, desto

    mer tid kan vi sette av (men man kan fint

    ta kontakt på vegne av bare seg selv)

    - Jo nærmere eksamen, desto flere

    henvendelser og mindre tid for oss

    → tar dere tidlig kontakt har vi garantert

    tid, venter dere til nærmere eksamen kan

    det hende vi ikke klarer å finne et

    passende tidspunkt

  • 27.10.20 6IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Nøkkelbegreper

    • DECIDE → s. 30-39

    • Bias → s. 39

  • 27.10.20 7IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Rask repetisjon: evaluering

    • Evaluering: teste, eksperimentere, eksaminere, sjekke, prøve ut, verifisere, validere…

    • Iterativ utvikling: design og evaluering er kontinuerlige prosesser (tatt ut av pensum i år)

    Behovsanalyse →

    kravspesifikasjon

    Design →

    prototype

    Evaluering →

    analyse

    Obligatorisk oppgave 2

    Obligatorisk oppgave 3

    Obligatorisk oppgave 4

  • 27.10.20 8IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Rask repetisjon: hvorfor evaluere?

    • Avgjøre hvor brukbar en løsning er for ulike brukere og brukergrupper

    • Identifisere gode og dårlige egenskaper for å drive videre design

    • Sammenlikne designalternativer og hjelpe oss med å ta beslutninger

    • Observere effekten spesifikke interaksjoner og grensesnitt har på brukeren

    • Husk:

    • Evaluering er en prosess, ikke en hendelse

    • Gode designideer stammer ofte fra evaluering av eksisterende løsninger

    • "Making things better" starter alltid med evaluering

  • 27.10.20 9IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Rask repetisjon: tre tilnærminger

    • Tre tilnærminger for evaluering:

    • Kontrollerte omgivelser

    Bruker involveres i kontrollerte omgivelser: brukbarhetstesting og eksperimenter i laboratorium, living labs etc.

    • Naturlige omgivelser

    Brukere studeres i naturlige omgivelser, f.eks. feltstudier, for å undersøke bruken av et produkt i den virkelige verden.

    • Uten brukere

    All evaluering som gjøres uten brukere, dvs. analytisk evaluering. Eksempler: Heuristisk evaluering, analytics, modellering.

  • 27.10.20 10IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Rask repetisjon: kombinert og opportunistisk eval.

    • Kombinerte tilnærminger

    • Opportunistisk evaluering

    Feltstudie for å evaluere utkast til designideer og få tidlig feedback

    Gjøre designendringer

    Brukbarhetsteste for å sjekke spesifikke designegenskaper

    Feltstudie for å se hvordan designet fungerer i naturlige omgivelser

    Gjøre endelige designjusteringer

  • 27.10.20 11IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Rask repetisjon: evalueringsmetoder og teknikker

    • Eksempler på metoder og teknikker som brukes:

    Metode/teknikk Kontrollerte omgivelser Naturlige omgivelser Uten brukere

    Observasjon Video, living lab, think-aloud, interaksjonsloggEtnografiske teknikker: skygging, flue-på-

    veggen-

    Spørre brukerePre- og posttestingsspørsmål, strukturerte

    intervjuerÅpne intervjuer, workshops og diskusjoner -

    Spørre eksperter - Heuristisk evaluering, intervjuer, diskusjoner Heuristisk evaluering, intervjuer, diskusjoner

    TestingTesting av typiske oppgaver

    (brukbarhetstesting)- Kognitiv gjennomgang

    Modellering - -HTA, GOMS og annen teori

    Modeller og teorier

  • 27.10.20 12IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Terminologi og struktur for evalueringsbegreper

    Tilnærming

    • Beskriver den overordnede ideen man har om hvordan man best for svar på det man lurer på

    • Låser oss ikke til konkrete metoder eller teknikker, men gir oss indikasjoner på passende metoder og teknikker gjennom sin overordnede plan

    Metode

    • Beskriver den konkrete strukturen og omfanget på hvordan man har gått frem med én aktivitet

    • Inkluderer detaljer omkring aktiviteten (f.eks. evaluering) som formål, kontekst, antall deltagere etc.

    • Valg av metode må samsvare med den overordnede tilnærmingen man har argumentert for

    Teknikk

    • Beskriver detaljene i fremgangsmåten valgt som utdyper prosedyren man har fulgt for å gjennomføre aktiviteten

    • Er ikke alltid nødvendig å ha med hvis metodebeskrivelsen er utfyllende

  • 27.10.20 13IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Terminologi og struktur for evalueringsbegreper

    Tilnærming Kontrollerte omgivelser Naturlige omgivelser Evaluering uten brukere

    Metoder Brukbarhetstesting Intervju Observasjon Ekspertevaluering Gjennomgang

    Teknikk Skygging Flue-på-veggen Gruppeintervju Heuristisk analyse Oppgavebasert testing

  • 27.10.20 14IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel: kontrollerte omgivelser

    Tilnærming Kontrollerte omgivelser Naturlige omgivelser Evaluering uten brukere

    Metoder Brukbarhetstesting Intervju Observasjon Ekspertevaluering Gjennomgang

    Teknikk Skygging Flue-på-veggen Gruppeintervju Heuristisk analyse Oppgavebasert testing

  • 27.10.20 15IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel: naturlige omgivelser

    Tilnærming Kontrollerte omgivelser Naturlige omgivelser Evaluering uten brukere

    Metoder Brukbarhetstesting Intervju Observasjon Ekspertevaluering Gjennomgang

    Teknikk Skygging Flue-på-veggen Gruppeintervju Heuristisk analyse Oppgavebasert testing

  • 27.10.20 16IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel: evaluering uten brukere

    Tilnærming Kontrollerte omgivelser Naturlige omgivelser Evaluering uten brukere

    Metoder Brukbarhetstesting Intervju Observasjon Ekspertevaluering Gjennomgang

    Teknikk Skygging Flue-på-veggen Gruppeintervju Heuristisk analyse Oppgavebasert testing

  • 27.10.20 17IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel 1

    Utgangspunkt

    Jeg har valgt musikk som tema og har laget to prototyper som skal hjelpe turister med å enkelt finne frem til tradisjonell lokalmusikk når de er ute på reise. Behovene jeg kom

    frem til i intervjuene omhandlet informasjonsbehov tilknyttet lokal kultur- og underholdningstilbud. Jeg har laget to prototyper som begge er ment som digital

    reisekompanjonger – den første er en mobilapp og den andre er en liten fysisk musikkspiller. Kravene jeg har fokusert på har vært portabilitet (vekt), enkelhet

    (grensesnitt/interaksjonstype) og delbarhet (deling).

    Tilnærming

    Metode

    Teknikk

  • 27.10.20 18IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel 1

    Utgangspunkt

    Jeg har valgt musikk som tema og har laget to prototyper som skal hjelpe turister med å enkelt finne frem til tradisjonell lokalmusikk når de er ute på reise. Behovene jeg kom

    frem til i intervjuene omhandlet informasjonsbehov tilknyttet lokal kultur- og underholdningstilbud. Jeg har laget to prototyper som begge er ment som digital

    reisekompanjonger – den første er en mobilapp og den andre er en liten fysisk musikkspiller. Kravene jeg har fokusert på har vært portabilitet (vekt), enkelhet

    (grensesnitt/interaksjonstype) og delbarhet (deling).

    Tilnærming

    Jeg planlegger å evaluere i kontrollerte omgivelser av både faglige og praktiske hensyn. Jeg tror den mest verdifulle tilbakemeldingen på et tidlig stadie vil være tilknyttet

    grensesnittet og dets forståelighet, og det mener jeg egner seg for å undersøkes i lab hvor jeg kan la brukerne konsentrere seg om oppgaveløsning. Siden prototypene er laget

    for bruk på reise er det også vanskelig med feltstudier, men det egner seg bedre når prototypene er mer modne og mindre sensitiv for elementære feil og svakheter.

    Metode

    Jeg trenger svar på hvordan brukerne forstår grensesnittet og hvordan det oppleves i bruk. Jeg har sett for meg at interaksjonen bør være mulig å gjennomføre selv om man

    reiser sjeldent og aldri har brukt appen eller musikkspilleren før. Jeg vil derfor bruke brukbarhetstesting til å sammenlikne tiden det tar brukerne å få spilt gjennom et sett med

    lokale sanger og dele minst én av dem med en venn. På den måten kan jeg evaluere memorerbarhet, dvs. hvor lett det å komme i gang med bruken og hvilken som best

    støtter god memorerbarhet. Siden det bør gå ganske raskt å teste ser jeg for meg at jeg ønsker 5-10 deltagere i min evaluering.

    Teknikk

    Jeg ønsker å gjøre en oppgavebasert brukbarhetstesting med tre konkrete oppgaver: (1) starte avspilling av en lokal sang; (2) bla gjennom fem sanger; (3) dele den femte

    sangen med en venn. Jeg kommer til å bruke tid og prestasjon som metrikker, og måler da tiden i sekunder og prestasjon i antall feil.

  • 27.10.20 19IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel 2

    Utgangspunkt

    Temaet mitt er forflytning og det er laget to prototyper som jeg håper kan imøtekomme behov tilknyttet enkel navigasjon for turgåere i skog og mark. Sentrale krav jeg har

    utledet har vært knyttet opp mot batteritid, dekningsproblemer, og værforhold. Den første prototypen har et touchbasert grensesnitt, mens den andre er wearable.

    Tilnærming

    Metode

    Teknikk

  • 27.10.20 20IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel 2

    Utgangspunkt

    Temaet mitt er forflytning og det er laget to prototyper som jeg håper kan imøtekomme behov tilknyttet enkel navigasjon for turgåere i skog og mark. Sentrale krav jeg har

    utledet har vært knyttet opp mot batteritid, dekningsproblemer, og værforhold. Den første prototypen har et touchbasert grensesnitt, mens den andre er wearable.

    Tilnærming

    Jeg mener jeg får best tilbakemelding på om prototypene imøtekommer brukernes behov om jeg gjør min evaluering i naturlige omgivelser. Jeg mener dette blir best fordi

    forhold som vær, dekning og batteritid er av praktisk art som er vanskelig å simulere i kontrollerte omgivelser.

    Metode

    Jeg ønsker kun å teste den ene prototypen da den med touchbasert grensesnitt er ment som en mobilapp og ikke introduserer noen ny interaksjon for mine brukere som er

    godt kjent med apper og interaksjonsmekanismene jeg har prototypet. Prototypen jeg ønsker å evaluere har et wearable grensesnitt som festes utenpå jakkeermet, og jeg

    ønsker å bruke observasjon til å undersøke om dette grensesnittet faktisk passer når folk befinner seg i en reell kontekst, nemlig på tur ute i skogen. Dette gir mest mening for

    meg da forhold som vær kan gjøre det vanskelig å se hva som vises på displayet eller man kan observere hvor ofte de trenger hjelp med navigering og dermed kan forstå mer

    av hvor god batteritid jeg må beregne for å støtte en vanlig tur. Siden jeg ønsker at dette skal bli mest mulig naturlig må jeg slenge meg på en av brukernes faste turer, og da

    tror jeg ikke jeg rekker mer enn 1-2 turer maks selv om det hadde vært praktisk med flere.

    Teknikk

    Jeg ønsker ikke å forstyrre brukerne mens de er ute på tur da jeg tror det vil forstyrre den avslappende atmosfæren de sa i intervjuet at var en viktig del av opplevelsen. Derfor

    velger jeg skygging som observasjonsteknikk og ser for meg at jeg bare skal gå bakerst og notere forsiktig mens brukerne gjennomfører turen sin som vanlig.

  • 27.10.20 21IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel 3

    Utgangspunkt

    Jeg valgte eldre som tema og har designet to prototyper som skal hjelpe eldre mennesker på sykehjem med å holde kontakten med barnebarn og andre familiemedlemmer. Behovene

    jeg har kommet frem til er tilknyttet sosialisering og tilgjengelighet, og jeg har derfor valgt å lage to prototyper som kan være fremme i hjemmet til brukerne uten at de er ment som

    noe som tas frem ved bruk og legges vekk etterpå. Prototype 1 er en digital fotoramme som automatisk henter bilder og videoer fra familiemedlemmers sosiale mediekontoer, og

    brukerne kan trykke på skjermen for å bla gjennom bilder og videoer. Prototype 2 er en lampe som fungerer som en vanlig lampe, men som lyser svakere og svakere jo lenger det er

    siden man hadde kontakt med et familiemedlem. Hver gang man er i kontakt med et familiemedlem vil en app på telefonen gjenkjenne telefonnummeret og automatisk skru lysstyrken

    opp igjen.

    Tilnærming

    Metode

    Teknikk

  • 27.10.20 22IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempel 3

    Utgangspunkt

    Jeg valgte eldre som tema og har designet to prototyper som skal hjelpe eldre mennesker på sykehjem med å holde kontakten med barnebarn og andre familiemedlemmer. Behovene

    jeg har kommet frem til er tilknyttet sosialisering og tilgjengelighet, og jeg har derfor valgt å lage to prototyper som kan være fremme i hjemmet til brukerne uten at de er ment som

    noe som tas frem ved bruk og legges vekk etterpå. Prototype 1 er en digital fotoramme som automatisk henter bilder og videoer fra familiemedlemmers sosiale mediekontoer, og

    brukerne kan trykke på skjermen for å bla gjennom bilder og videoer. Prototype 2 er en lampe som fungerer som en vanlig lampe, men som lyser svakere og svakere jo lenger det er

    siden man hadde kontakt med et familiemedlem. Hver gang man er i kontakt med et familiemedlem vil en app på telefonen gjenkjenne telefonnummeret og automatisk skru lysstyrken

    opp igjen.

    Tilnærming

    Siden denne løsningen er best evaluert med brukere over tid (noe jeg ikke rekker i denne obligen) har jeg valgt å involvere eksperter fremfor brukere. Jeg bruker derfor en evaluering

    uten brukere hvor jeg ønsker å evaluere begge løsningene sammen med sykepleiere som domeneeksperter. Jeg tror opplevelsene og vanene tilknyttet bruk av teknologi og kontakt

    eldre mennesker har med sin familie varierer stort fra person til person og at sykepleiere sitter på en mer generell ekspertise rundt hvordan eldre holder kontakt med familie og hvorfor

    ofte de kommuniserer sammen.

    Metode

    Jeg har valgt en ekspertevaluering som min metode for evaluering da jeg tror sykepleiere som får noen retningslinjer for hva de skal bruke som utgangspunkt for evalueringen av de to

    prototypene kan gi meg god feedback. Det vil også hjelpe meg med å påse at jeg får dekket de viktigste utfordringene og prinsippene tilknyttet interaksjonen mellom de eldre og

    teknologien. Jeg ser for meg at en gruppe på 4-5 eksperter ville vært det optimale, men så lenge jeg får med meg minimum to stykker er jeg fornøyd da jeg ikke vet hvor lett det vil bli

    å rekruttere.

    Teknikk

    Jeg benytter meg av en fokusgruppe hvor jeg bruker heuristisk analyse med Jakob Nielsens heuristikker og fokuserer spesielt på punktene om «error prevention» og «recognition

    rather than recall» siden disse er mest aktuelle for min brukergruppe.

  • 27.10.20 23IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempler på relevante 2018-eksamensspørsmål (1)

  • 27.10.20 24IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Eksempler på relevante 2018-eksamensspørsmål (2)

  • 27.10.20 25IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Enda flere tidligere eksamenseksempler (3):

    1g

    Nevn noen metoder som kan brukes til å gjennomføre evaluering uten brukere.

    (Eksamen 2017)

    2h Evalueringsmetoder

    Beskriv hvilke evalueringsmetoder som kan egne seg til å gjennomføre evaluering av lavoppløselige prototyper på papir.

    (Eksamen 2017)

    4e Evalueringstilnærminger

    Diskuter hvilke tilnærminger vi kan bruke for å gjøre evaluering og hvilke styrker og svakheter som kjennetegner de ulike tilnærmingene.

    (Eksamen 2017)

    2a Evaluering uten brukere

    Forklar hvordan man kan gjøre evaluering uten brukere.

    (Eksamen 2016)

    4a Intervju som metode

    Diskuter hvilke metodiske utfordringer som kan oppstå når man bruker intervju til å samle inn data eller gjennomføre en evaluering.

    (Eksamen 2016)

    4b Evaluering

    Velg en av de tre tilnærmingene til evaluering og diskuter tilnærmingen med tanke på hvem, hva, hvor og hvordan den bør utføres?

    (Eksamen 2015)

    4b Analytisk evaluering

    Hvilke fordeler oppnår man ved analytisk evaluering sammenliknet med andre tilnærminger?

    (Eksamen 2014)

  • 27.10.20 26IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Enda flere tidligere eksamenseksempler (4):

    1b

    Hva er de tre hovedtilnærmingene til evaluering?

    (Prøveeksamen 2014)

    2b Evaluering

    Hvilke fordeler har man ved å gjennomføre en evaluering i kontrollerte omgivelser kontra naturlige omgivelser?

    (Prøveeksamen 2014)

    2b Low-fidelity prototyper

    Hvorfor kan det være utfordrende å gjennomføre evaluering i naturlige omgivelser med low-fidelity prototyper?

    (Eksamen 2013)

    2g Evaluering

    I noen situasjoner er det ikke hensiktsmessig å involvere brukere ved evaluering. Diskuter hva en slik situasjon kan være og gi eksempler på metoder eller teknikker man kan bruke.

    (Eksamen 2013)

    3a Evalueringscase

    Martine har jobbet med en prototype til en billettmaskin for T-baneselskapet IFIOnRails. For å evaluere denne plasserer hun prototypen på en t-banestasjon, og observerer personer som bruker

    den via et videokamera plassert på maskinen. For å kunne si noe om brukbarheten til maskinen, registrerer hun hvor mange ganger hun ser at noen blir irritert når de bruker systemet. Irritasjon

    definerer hun som at brukeren rynker på pannen, ser sint ut, eller andre typiske fysiske uttrykk.

    a) Hva slags metode og tilnærming er brukt i evalueringen?

    b) Hvilke krav stiller evalueringsformen til prototypen?

    c) Er det noen etiske aspekter man her må tenke på?

    d) Hva kan vi si om validiteten og reliabiliteten til evalueringen?

    e) Er det noen andre måter vi kunne undersøkt brukbarheten?

    (Prøveeksamen 2015)

  • 27.10.20 27IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Hvilken tilnærming/metode kan brukes i min oblig?

    • Det kommer an på hva du har prototypet i oblig 3! I obligen skal dere vise at dere klarer å legge frem en god og fornuftig forklaring på valg

    • Prøv å se etter sammenhengen mellom hva du prototypet i oblig 3 og hva du ønsker tilbakemelding på nå i oblig 4

    • Det kan høres ut på obligteksten som at dere MÅ gjøre brukbarhetstesting, men dere kan velge andre tilnærminger og metoder også

    • Spør deg selv: hvilke prototypingsteknikker og dimensjoner har jeg prototypet i oblig 3 og hvordan påvirker de mulighetene mine til å gjennomføre evaluering?

    • Her er noen konkrete eksempler:

    • Prototyper av skisser, lysark, oppgavesekvens, interaktive wireframes (f.eks. Figma): evaluering uten brukere → kognitiv gjennomgang

    • Prototyper som er konseptuelle eller mangler gode interaksjonsmuligheter: kontrollerte omgivelser → intervju (demonstrasjon/think-aloud)

    • Prototyper med fokus på kontekst, omgivelser, samhandling med systemer etc.: i naturlige omgivelser → feltstudier, observasjon med eksperter

    • Prototyper hvor konkrete grensesnitt- eller interaksjonsmekanismer ønskes evaluert: evaluering uten brukere → heuristisk evaluering

  • 27.10.20 28IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    DECIDE

  • 27.10.20 29IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Å velge tilnærming, metode og teknikk

    • Det er ikke slik at dersom jeg designer X så er Y eneste korrekte måte å evaluere på…

    • …og det er både faglige og praktiske betraktninger som må inkluderes når vi skal velge hvordan evalueringen skal gjennomføres

    • Så det er viktig å ikke lete etter fasitsvar eller «eneste riktige svar» når dere skal vurdere hvordan dere vil evaluere i oblig 4

    • Men dere bør bruke egen prosess og egne prototyper til å hjelpe med å finne mest nærliggende tilnærminger, metoder og teknikker

    • Eksempler på ting å tenke gjennom som påvirker valg av tilnærming, metode og teknikk:

    • Hva er formålet med evalueringen? Hva skal vi frem til egentlig?

    • Hvilket artefakt eller resultat har jeg som jeg ønsker å evaluere?

    • Hvilke type deltagere mener vi vil kunne hjelpe oss med evalueringen?

    • Hvor og hvordan ser vi for oss at evalueringen skal foregå?

    • Hva er det vi skal fokusere på når vi evaluerer?

  • 27.10.20 30IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    DECIDE-rammeverket

    • Tatt bort fra 4. og 5. utgaven av boka – kapittelutdrag fra tidligere utgave er pensum (3. utgaven)

    • Det må tas høyde for flere faktorer før man kan påbegynne en evaluering

    • DECIDE er et sekspunkters rammeverk for å planlegge evaluering

    → Gir en overordnet veiledning på hva vi bør være opptatt av når vi planlegger en evaluering

    • Tar for seg konseptuelle, praktiske og etiske forhold knyttet til evaluering

    • Sentral i obligatorisk oppgave 4

    Definisjoner:- DECIDE

  • 27.10.20 31IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Når og hvordan skal man bruke DECIDE?

    • Etter hvert som dere blir mer erfarne med evaluering vil dere ikke trenge DECIDE til å hjelpe dere…

    • …men nå i starten er det viktig å være klar over alt man bør ha tenkt på mens man planlegger evalueringen

    • DECIDE er IKKE en tilnærming eller metode, det er kun et rammeverk som sier hva vi bør være opptatt av under planlegging…

    • …og rammeverket gir oss ingen svar – det stiller kun relevante spørsmål som du selv må tenke gjennom og adressere

    • Tilnærmingene, metodene og teknikkene dere velger mellom påvirkes ikke av at dere går gjennom alle punktene i DECIDE

    • Oppsummering: DECIDE hjelper oss med å stille viktige spørsmål rundt sentrale betraktninger når man planlegger en evaluering

  • 27.10.20 32IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    DECIDE-rammeverket

    • Determine the goals- Bestemme mål

    • Explore the questions

    - Utforske spørsmålene

    • Choose the evaluation methods

    - Velge tilnærming og metode for evaluering

    • Identify the practical issues

    - Identifisere praktiske forhold

    • Decide how to deal with the ethical issues

    - Beslutte hvordan etiske forhold skal håndteres

    • Evaluate, analyze, interpret and present the data

    - Evaluere, analysere, tolke og presentere data

  • 27.10.20 33IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    D

    EC

    I

    D

    E

  • 27.10.20 34IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Bestemme mål

    • Hva er de overordnede målene for evaluering?

    • Hvem vil ha resultatene og hvorfor?

    • Målene påvirker metoder og evaluering

    • Mål varierer fra produkt til produkt, men kan for eksempel være:

    • Identifisere den beste metaforen for et gitt design

    • Kontrollere at brukerens behov og kravene til systemet er imøtekommet

    • Sjekke at grensesnittet er konsekvent

    • Undersøke hvordan teknologi påvirker og endrer arbeidspraksis

    • Forbedre brukbarheten til eksisterende produkter

    DECIDE

  • 27.10.20 35IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Utforske spørsmålene

    • Spørsmål bidrar til å lede evalueringen

    • Eksempel fra 3. utgaven av boka (s. 457): Målet er å finnet ut hvorfor reisende foretrekker papirbilletter fremfor elektroniske

    billetter når de skal ut å fly. Dette spørsmålet kan deles opp:

    • Hva er brukernes holdning til elektroniske billetter?

    • Er brukerne bekymret eller opptatt av sikkerhet?

    • Hvordan oppfattes brukergrensesnittet?

    • Spørsmål kan også videre deles opp for å ytterligere spesifisere:

    • Er det vanskelig å navigere i systemet?

    • Er terminologien som brukes i systemet forvirrende?

    DECIDE

  • 27.10.20 36IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Velge tilnærming og metode for evaluering

    • Valg av tilnærming og valg av metode påvirker hvordan data innsamles, analyseres og presenteres

    • Men valget avhenger samtidig av:• Hvilken type data som er nødvendig for å besvare spørsmålene

    • Hvilke teorier eller rammeverk som er passende for konteksten

    • Et feltstudie vil for eksempel typisk:• Involvere observasjoner og intervjuer

    • Involvere brukere i naturlige omgivelser

    • Ikke involvere kontrollerte tester

    • Produsere hovedsakelig kvalitativ data

    • Husk at flere tilnærminger og metoder kan kombineres

    DECIDE

  • 27.10.20 37IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Identifisere praktiske forhold

    • Velge deltakere

    Antall, bakgrunn, utvalg (kjønn, alder, kultur, holdning, utdanning), signifikans

    • Finne de som skal evaluere

    HCI-eksperter eller fag- og domeneeksperter, medhjelpere

    • Velge utstyr

    Type opptaksutstyr, antall, plassering, ansvarlig

    • Forholde seg til budsjett og kostnadsrammer

    Betaling til deltakere, tilgang på utstyr/lokaler

    • Forholde seg til tidsrammer

    Tidsbegrenset tilgang på utstyr/deltakere, frister, timeboxing

    DECIDE

  • 27.10.20 38IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Beslutte hvordan etiske forhold skal håndteres

    • Utvikle en samtykkeerklæring, dvs. et skjema eller presentasjon som legges frem for deltaker i forkant av evaluering

    • Deltakere har rett til:

    • Informasjon om formålet og målsetninger for studien

    • Informasjon om hva som skal gjøres med funnene og hvordan dataen skal behandles

    • Vern av personlige opplysninger som blir gitt

    • Frihet til å trekke seg når som helst

    • Høflig behandling

    DECIDE

  • 27.10.20 39IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Evaluere, analysere, tolke og presentere data

    • Tilnærming og metode påvirker hvordan data evalueres, tolkes og presenteres

    • Følgende forhold må vurderes:

    • Pålitelighet (reliability)

    Kan studiet gjentas/reproduseres?

    • Gyldighet (validity):

    Måles det man forventet å måle?

    • Bias

    Medfører prosessen noen form for bias? (Halo-effekt)

    • Omfang (scope)

    Kan funnene generaliseres?

    • Økologisk gyldighet

    Påvirker miljøet og omgivelsene funnene? (Hawthorne-effekt)

    DECIDE

    Bias:

    Systematisk avvik fra

    sannheten. Kan skyldes ulike

    forhold, f.eks. feil i utvalg, feil i

    måling eller feil i analyse. Kan

    gjelde prosesser, metodikker, perspektiver og tolkninger.

    Definisjoner:- Bias

  • 27.10.20 40IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Obligatorisk oppgave 4

  • 27.10.20 41IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Prototypen vår…

    • Vet vi om konseptet vi introduserer med prototypen vår er ønskelig?

    • Vet vi om de opplevelsene vi skaper med prototypen vår er de ønskelige?

    • Vet vi om prototypen vår egentlig hjelper brukeren med sine behov?

    • Vet vi om antagelsene vi har gjort om brukeren også gjelder for testerne?

  • 27.10.20 42IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Prototypen vår…

    • På grunn av praktiske hensyn prototypet vi utvalgte dimensjoner og egenskaper

    • …og nå må vi kanskje evaluere utvalgte aspekter ved bruken av systemet

    • Eksempler på hva som kan evalueres:

    • Faktisk bruk (oppgaveløsning, forståelse, tydelighet, etc.)

    • Brukssituasjonen (kontekst, omgivelser, relasjonelle forhold etc.)

    • Systemisk og organisatorisk bruk (kompatibilitet, portabilitet etc.)

    • Konsekvenser av bruk (miljøhensyn, trygghet, kosthold, sikkerhet etc.)

  • 27.10.20 43IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 44IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 45IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 46IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 47IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 48IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 49IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

  • 27.10.20 50IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Tenk nøye gjennom valg av tilnærming

    • Finn ut av hvilken tilnærming som passer best for dine prototyper og ditt design

    • Det kan fort bli utfordrende å få til feltstudier, men det er fullt mulig for dem som ønsker det

    • Mest nærliggende å velge enten brukbarhetstesting eller analytisk evaluering

    • Husk at alle prototyper kan evalueres på en eller annen måte!

    • Men tenk nøye gjennom:

    • Hvem bør jeg bruke som evaluatorer? Hvorfor dem?

    • Kan jeg få tak i disse personene eller må jeg finne et alternativ?

    • Hvor mange evaluatorer bør jeg ha med?

    • Hvordan kan de best gi deg tilbakemelding på om prototypen imøtekommer deres behov?

  • 27.10.20 51IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Hvor mange deltakere?

    • Antallet er et praktisk forhold – jo flere jo bedre, men vi må alltid tilpasse oss begrensninger

    • Avhenger av:

    • Plan for evalueringen

    • Tilgang på deltakere

    • Kostnader tilknyttet evalueringen

    • Typisk 5-10 deltakere, men det holder om dere kun rekrutterer et par stykk til obligen

    • Noen eksperter argumenterer for at man bør fortsette så lenge tester gir ny innsikt…

    • …mens andre mener at 5 brukere kan oppdage mot 85 % av alle feil

  • 27.10.20 52IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Hva skal testes?

    • Dere har laget to prototyper, og ideelt (og metodisk) sett bør begge testes

    • …men om dere i oppgaven argumenterer (godt) for at det holder med én, så er det greit

    • Har man laget en videoprototype/visuell prototype må det kanskje gjøre noen små endringer

    • Dere må sørge for at prototypen er tilrettelagt for å kunne evalueres

    • Men sørg for at oppgavene eller egenskapene ved prototypen er:

    • Representative

    • Gjennomførbare

    • Forståelige

  • 27.10.20 53IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Del 1: Plan for evaluering

    • Følg punktene vi har gjennomgått – det er en sjekkliste

    • Svar på alt selv om det kan virke innlysende eller unødvendig

    • Husk at DECIDE er et rammeverk, ikke en konkret tilnærming eller metode

    • Du må derfor være presis i beskrivelsen av hvordan du har tenkt å gjennomføre evalueringen

    • I tillegg til de konkrete punktene må du også tenke på:

    • Hvilke oppgaver vil du be deltagerne om å utføre?

    • Hvilke metrikker (for eksempel tid, hastighet, antall) du vil bruke under evalueringen?

    • Hvordan du har tenkt å måle brukernes prestasjoner når de utfører oppgaver?

    • Skal prototypene evalueres opp mot hverandre eller evalueres isolert?

    • Hvilke egenskaper innehar deltagere du inkluderer i evalueringen?

  • 27.10.20 54IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Del 2: Praktisk gjennomføring

    • Selv om du kanskje evaluerer med få deltakere er det viktig å gjøre det så realistisk som mulig

    • Tenk gjennom hvordan evalueringen skal foregå (hvor, når, hvor lenge etc.) og tenk på organisering

    • Informer deltager om eksperimentet på en ordentlig måte – ikke bare i forbifarta

    • Husk at evalueringsplanen din gjerne kan være større, selv om du ikke rekker å gjennomføre alt

    • Husk å dokumentere datainnsamlingen:

    • For eksempel lydopptak, videoopptak, avkrysningsskjemaer, tilbakemeldingskort, egne notater etc.

    • Denne deloppgaven skal ikke besvares som en selvstendig oppgave…

    • …men du skal levere dokumentasjon i del 3 – ikke alt du har, men noe som gir leser et inntrykk av evalueringen

  • 27.10.20 55IN1050 – Introduksjon til design, bruk og interaksjon Forelesning 11: Gjennomføring av evaluering

    Del 3: Rapport

    • En rapport behøver ikke å være lang

    • Dette handler ikke om å beskrive eller rapportere evalueringen, men om å reflektere rundt prosessen (utfordringer, alternative strategier etc.)

    • Vis evne til å reflektere rundt evaluering ved å si noe om:

    • Forventninger – hva hadde du regnet med og hva gikk/gikk ikke som forventet?

    • Opplevelser – hvordan opplevde du prosessen, og var det noen spesielt merkbare hendelser?

    • Gjennomføring – hva gikk ikke som planlagt? Hvorfor ikke?

    • Lærdom – hva har du lært av evalueringen?

    • Du behøver ikke levere all innsamlet data, men du skal velge deg ut noen nøkkeldata fra din evaluering (bilder, sitater, eksempler etc.)

    • Forslag til lengde på del 3: 500 til 800 ord