13
XM @ DTU License to Thrill Den bedste rette linje S. Markvorsen & P. G. Hjorth Institut for Matematik, Bygning 303S, DTU DK-2800 Kgs. Lyngby 1

XM @ DTU License to Thrilluvmat.dk/XM/04_BedsteLinje.pdfXM @ DTU License to Thrill Den bedste rette linje S. Markvorsen & P. G. Hjorth Institut for Matematik, Bygning 303S, DTU DK-2800

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • XM @ DTU

    License to Thrill

    Den bedste rette linje

    S. Markvorsen & P. G. HjorthInstitut for Matematik, Bygning 303S, DTU

    DK-2800 Kgs. Lyngby

    1

  • Den bedste rette linje

    Hvordan findes den "bedste"rette linje igennem en given mængde af punkter i planen? Hvad be-tyder "bedst"og er der altid præcis én ret linje, der så er den bedste? Eksperimenterne i denneøvelse går ud på at besvare disse spørgsmål.

    x

    y

    Figur 1: En linje ser ud til at approksimere den givne punktmængde. Er det den bedstetilnærmelse?

    Niveau: C, B, og A.

    Tidsforbrug: Fra 2 til 5 lektioner.

    Faglige mål: Rette linjer i planen, akkumulerede cirkelskivearealer, bestemmelse af minima forfunktioner af én og to variable.

    Beskrivelse (detaljeret): Vi ser på n punkter i planen:

    { p1, p2, p3, ..., pn } ,

    og ønsker at approksimere dem med en ret linje L med ligningen

    L : ax+by+ c = 0 ,

    hvor a, b, og c er konstanter (dog sådan at a og b ikke samtidig er 0).

    2

  • Opgave 1) Hvad er a, b, og c for hver af de linjer, der har ligningerne henholdsvis

    y = 3y = −7x+4x = 6y−3x = 7

    x+8y = 1 .

    Opgave 2) Hvorfor må a og b ikke samtidig være 0?

    Da a og b ikke samtidig er 0 kan vi antage, at a = cos(v) og b = sin(v) hvor v er en vinkel iintervallet ]0,π]; linjen L har derefter ligningen:

    L : x cos(v)+ y sin(v)+ c = 0 . (0.1)

    Opgave 3) Hvorfor kan vi uden videre antage at L nu kan skrives på den form?

    Opgave 4) Hvad er værdien af v for hver af de linjer, der er angivet i opgave 1) ?

    Opgave 5) Tegn linjerne fra opgave 1) og angiv for hver af dem, hvor på tegningen vinklen v optræder.

    Fordelen ved at indføre vinklen v er rimelig klar: Nu kan linjen beskrives ved brug af kun 2konstanter nemlig v og c, hvor vi før brugte 3: a, b, og c.

    Opgave 6) Men linjer, der har ligning på den mere velkendte form: L : y = αx + β kan jo ogsåbeskrives med kun to konstanter! Hvorfor gør vi så ikke det i stedet?

    Vi indfører et mål for, hvor tæt punkterne ligger ved linjen L, eller med andre ord et mål for hvorgodt linjen repræsenterer punkterne.

    Ofte er det jo sådan, at punkterne er fremkommet ved et laboratorieforsøg hvor man for eksempelhar aflæst et antal sammenhørende værdier for strøm igennem en modstand og den tilhørendespænding over modstanden. Så skal der helst være (ifølge Ohm’s lov) en nogenlunde lineærsammenhæng mellem strøm og spænding, dvs. målepunkterne skal ligge tæt ved en ret linje i etstrøm-spændings-koordinatsystem, og hældningskoefficienten af den rette linje er netop værdienaf den Ohm’ske modstand.

    Men målepunkter vil sædvanligvis ikke ligge eksakt på en ret linje, så vi har brug for at kunnefinde den linje, der passer bedst.

    Til den ende gør vi følgende: Vælg (for eksemplets skyld) 7 tilfældige punkter { p1, p2, p3, ..., p7 }i planen. Vi antager, at planen er udstyret med et sædvanligt retvinklet koordinatsystem, så de 7

    3

  • punkter har koordinaterne:p1 = (x1,y1)p2 = (x2,y2)

    .

    .

    .

    p7 = (x7,y7) .

    Vælg dernæst en ret linje L i planen som et gæt på den bedste rette linje, der tilnærmer de valgtepunkter. Find dernæst ligningen for linjen på formen 0.1. Se for eksempel figur 2.

    Eksempelvis er der i den figur vist 7 punkter der har følgende koordinater med hensyn til detviste koordinatsystem:

    [−.278, .178], [.308,1.04], [.696,1.25], [−1.25, .169], [−.775,−.113], [1.11, .811], [1.01,1.70] ,og den viste linje har ligningen:

    L : −12

    x+√

    32

    y− 12

    = 0 ,

    dvs. linjen er karakteriseret ved, at v = 2π/3 og c =−1/2.Men det gæt er ikke den bedste rette linje, det er ikke den linje, der bedst approksimerer de syvpunkter. Den bedste linje er vist i figur 6; det er den vi er på jagt efter.

    y

    x

    Figur 2: Syv tilfældige punkter i planen og en ret linje.

    Hvert punkt pi i mængden af punkter, { p1, p2, p3, ..., p7 } , bidrager selvstændigt med et bidragtil målet for hvor langt punktmængden er fra at ligge på den givne rette linje L. Lad os førstbetragte det valgte punkt p1. Det punkt har en afstand fra L; lad os kalde den afstand for r1. Tegnnu den cirkel, der har radius r1 og centrum i p1 - det er den cirkel, der lige præcis tangerer L, sefigur 3.

    4

  • x

    y

    Figur 3: Et af de 7 punkter med linje-tangerende cirkel med radius r1.

    Den cirkel omkredser et areal, som er givet ved

    A1 = πr21 . (0.2)

    Dette areal udregnes nu for alle punkterne og arealerne lægges sammen - bemærk, at overlaptælles med, se figur 4:

    A = πi=7

    ∑i=1

    Ai

    =i=7

    ∑i=1

    πr2i

    = π(r21 + r

    22 + ...+ r

    27)

    = Sπ ,

    (0.3)

    hvor vi har indført betegnelsen S for

    S = r21 + r22 + ...+ r

    27 .

    Kunsten er nu at finde den linje, der giver den mindst mulige totale sum af cirkelskivearealerne,dvs. den mindst mulige værdi af S. Det er den linje, vi vil kalde den "bedste" approksimation tilden givne punktmængde.

    Opgave 7) Vis, at med den valgte ligning (0.1) for L kan r1, og generelt ri, udtrykkes ved v og c påfølgende måde:

    ri = |xi cos(v)+ yi sin(v)+ c | . (0.4)

    Så har vi

    S = S(v,c) =i=7

    ∑i=1

    (xi cos(v)+ yi sin(v)+ c)2 , (0.5)

    5

  • y

    x

    y

    x

    Figur 4: Det totale cirkelskive-areal er mål for hvor meget punkterne afviger fra at ligge på denvalgte rette linje.

    og den resterende opgave er altså at finde v og c sådan at dette udtryk for S (med de givnepunkt-koordinater) er mindst mulig.

    Den linje, vi har valgt at gætte på i første omgang kan roteres og parallelforskydes med henblikpå at gøre S−værdierne mindre, men omkring hvilket punkt skal vi rotere og i hvilken retningskal vi parallelforskyde? Se animationerne.

    Som et eksperiment kan vi først prøve at finde den bedste linje blandt alle de linjer, der er par-allelle med x−aksen. Vi har så konstant v = π/2 for alle de linjer, vi nu kigger på, og derforer

    L : y = −c ,

    og dermed

    S = S(π/2, c) =i=7

    ∑i=1

    (yi + c)2

    =i=7

    ∑i=1

    (y2i +2cyi + c

    2)

    = 7c2 +2c

    (i=7

    ∑i=1

    yi

    )+

    (i=7

    ∑i=1

    y2i

    ),

    Funktionen S er så en funktion af den ene variable c og vi kan derfor finde den mindste værdisom S antager ved at finde den værdi af c for hvilken funktionen S(c) har vandret tangent, altsåhvor S′(c) = 0:

    S′(c) = 14c +2

    (i=7

    ∑i=1

    yi

    ),

    6

  • så den søgte c−værdi er derforc = −1

    7

    (i=7

    ∑i=1

    yi

    ),

    og den søgte linje parallel med x−aksen er derfor:

    y =17

    (i=7

    ∑i=1

    yi

    ).

    Vi kan naturligvis som et næste eksperiment også finde den linje parallel med y-aksen, som givermindst S blandt alle linjer af formen x = −c, hvor c igen opfattes som den ene variable. Dettesvarer til at vælge fast vinkel v = 0 i det generelle udtryk (0.5).

    Opgave 8) Tegn grafen for S(c) i hvert af de to betragtede tilfælde for de konkrete punkter i figur 2 ogaflæs de c−værdier der giver mindste S(c) for de vandrette henholdsvis lodrette linjer.

    De to akseparallelle linjer, vi dermed har fundet, har et skæringspunkt; det er massemidtpunktetfor de 7 punkter:

    P = (Px , Py ) =17

    (i=7

    ∑i=1

    xi ,i=7

    ∑i=1

    yi

    ).

    Opgave 9) Find massemidtpunktets koordinater for de konkret givne 7 punkter i figur 2 og sammen-lign med resultatet i opgave 8).

    Ovenstående eksperimenter peger således på et ganske bestemt punkt, massemidtpunktet, omkringhvilket det dernæst er oplagt at rotere en linje for at finde den linje, der giver mindst værdi for Sblandt alle de linjer, der går igennem massemidtpunktet.

    Lad os dog først få den gode idé, at vi måske kan benytte ovenstående fremgangsmåde til heltgenerelt at bevise, at følgende faktisk er et korrekt udsagn:

    Sætning 0.1. Den mindste værdi for S findes for en linje, som går igennem massemidtpunktet forde givne punkter.

    Bevis. Ideen er selvfølgelig at vælge v til en fast værdi (ikke nødvendigvis hverken π/2 eller 0).Så er

    S(c) =i=7

    ∑i=1

    (xi cos(v)+ yi sin(v)+ c)2

    =i=7

    ∑i=1

    (c2 +2c (xi cos(v)+ yi sin(v))+(xi cos(v)+ yi sin(v))

    2)

    = 7c2 +2 ci=7

    ∑i=1

    (xi cos(v)+ yi sin(v))+i=7

    ∑i=1

    (xi cos(v)+ yi sin(v))2 ,

    7

  • hvor v og x1, ....,x7, og y1, ...,y7 jo er konstanter. Vi differentierer S som funktion af c og sætterdet resulterende udtryk lig med 0:

    S′(c) = 14c+2i=7

    ∑i=1

    (xi cos(v)+ yi sin(v))

    = 14c+2 cos(v)i=7

    ∑i=1

    xi +2 sin(v)i=7

    ∑i=1

    yi ,

    som er 0 hvis og kun hvis

    c = −cos(v)17

    i=7

    ∑i=1

    xi− sin(v)17i=7

    ∑i=1

    yi

    = −Px cos(v)−Py sin(v) .

    Vi indsætter nu denne c−værdi i ligningen for L og får dermed den bedste retlinjede approksi-mation til de 7 punkter blandt alle de linjer der har den konstante givne v værdi:

    Lv : (x−Px)cos(v)+(y−Py)sin(v) = 0 . (0.6)

    Alle disse linjer - dvs. for et vilkårligt valg af vinklen v - går tydeligvis igennem massemidtpunk-tet P = (Px , Py ) for de 7 punkter! Og det var det, vi skulle bevise.

    Det er nu klart, at for at finde den bedste rette linje skal vi blot betragte alle linjerne Lv, som gårigennem massemidtpunktet, og så blandt dem finde den eller de linje(r) der har v-værdi(er) forhvilke(n) S(v) er mindst mulig.

    Overraskende nok er der enten lige præcis én sådan linje eller også er alle linjerne igennemmassemidtpunktet løsninger til problemet!

    Det kan vi se på følgende måde:

    Da vi kun kigger på linjerne givet ved udtrykket (0.6) får vi følgende relativt simple udtryk forS(v):

    S(v) =i=7

    ∑i=1

    ((xi−Px)cos(v)+(yi−Py)sin(v))2

    = cos2(v)i=7

    ∑i=1

    (xi−Px)2 + sin2(v)i=7

    ∑i=1

    (yi−Py)2 +2 cos(v)sin(v)i=7

    ∑i=1

    (xi−Px)(yi−Py)

    = Acos2(v)+Bsin2(v)+2C cos(v)sin(v) ,

    8

  • hvor vi har indført følgende betegnelser for de tre konstanter:

    A =i=7

    ∑i=1

    (xi−Px)2

    B =i=7

    ∑i=1

    (yi−Py)2

    C =i=7

    ∑i=1

    (xi−Px)(yi−Py) .

    Opgave 10) Bestem konstanterne A, B, og C for de konkret givne punkter i figur 2.

    Vi må nu eksperimentere lidt med funktionen S(v) for at se, hvordan dens minimumspunkterafhænger af konstanterne A, B, og C:

    Hvis f.eks. C = 0 og A = B, så er S(v) konstant, S(v) = A for alle v. Alle linjer igennemmassemidtpunktet giver i så fald den sammme mindste S-værdi og er derfor lige gode - ogbedst!

    Vi vil nu indse, at hvis det ikke gælder, at C = 0 og A = B, så er der netop én ret linje, derapproksimerer de givne punkter bedst muligt.

    Lad os først se på differentialkvotienten:

    S′(v) = −2Acos(v)sin(v)+2Bcos(v)sin(v)+2C(cos2(v)− sin2(v))

    = −Asin(2v)+Bsin(2v)+2C cos(2v) .Heraf fås, at S′(v) = 0 for

    tan(2v) =2C

    A−B , (0.7)således at netop når der ikke samtidig gælder, at C = 0 og A = B, så er der præcis to vinklerv ∈ [0,π[, som opfylder ligningen ovenfor, nemlig

    v =12

    arctan(

    2CA−B

    )(0.8)

    og

    v =π2

    +12

    arctan(

    2CA−B

    ). (0.9)

    Hvis v tilhører intervallet fra 0 til π, så ligger 2v selvfølgelig i intervallet fra 0 til 2π så vi måafgøre hvilke værdier funktionen tan(2v) antager:

    Præcis én af v−værdierne i (0.8) og (0.9) svarer til den linje gennem massemidtpunktet som giverminimal S; den anden vinkel svarer til den linje som giver maksimal S−værdi blandt alle linjernegennem massemidtpunktet. Bemærk, at de to linjer står vinkelret på hinanden.

    9

  • v

    10

    2

    0

    3

    4

    −42

    y

    −2

    tan(2v)

    Figur 5: Funktionen f (v) = tan(2v) i intervallet v ∈ [0,π[. Bemærk, at for enhver værdi y = q ∈[−∞, ∞] er der netop to værdier af v, således at tan(2v) = q.

    x

    y

    x

    y

    Figur 6: Den bedste retlinjede approksimation (og den i en vis forstand dårligste) til de 7 givnepunkter findes ved rotation omkring massemidtpunktet. Sammenlign med gættet i figur 4.

    Opgave 11) Find de to linjer for de konkrete syv punkter i figur 2 og sammenlign med figur 6.

    Dermed har vi løst opgaven. Løsningsproceduren er altså først at bestemme massemidtpunktetP = (Px,Py) og dernæst at finde de to løsninger til vinkel-problemet omkring massemidtpunktetog endelig vælge den vinkel v0, der giver mindst S−værdi. Så er løsningen, dvs. den bedste rettelinje, simpelthen givet ved ligningen (0.6) med dette v0 indsat:

    L : (x−Px)cos(v0)+(y−Py)sin(v0) = 0 . (0.10)Opgave 12) Benyt fremgangsmåden til at finde den bedste rette linje for 20 punkter, som alle ligger tæt

    på y−aksen, men som samtidig er rimeligt fordelt langs med y−aksen.

    Hvornår er C = 0 og A = B ?

    Hvis punkterne alle ligger i en hob, måske endda symmetrisk omkring massemidtpunktet, må viforvente, at den bedste rette linje ikke er så veldefineret, altså at vi netop er i en situation hvor

    10

  • der næsten gælder: C = 0 og A = B , således at den brøk, der optræder på venstre side i (0.7) erret usikker.

    Lad os derfor for eksperimentets skyld undersøge, hvad der sker ved symmetriske konfigurationermed f.eks. 3, 4, eller 8 punkter symmetrisk fordelt på en cirkel omkring (0,0)? Så er S(v) konstantfor alle linjer, der roteres om massemidtpunktet, se figur 7 og de tilhørende animationer.

    x

    y

    x

    y

    x

    y

    y

    x

    y

    x

    y

    x

    y

    x

    y

    x

    y

    x

    Figur 7: Rotation om (0, 0) med symmetrisk 3-, 4-, og 8-punktkonfiguration. Det totale cirkel-skiveareal er i alle 3 tilfælde konstant! Enhver ret linje igennem massemidtpunktet er bedstmulig!

    Opgave13) Mon det forholder sig sådan, at C = 0 og A = B kun kan opnås med en symmetriskplacering af punkterne omkring massemidtpunktet, som antydet i figur 7?

    Grafisk inspektion af S(v,c)

    Et alternativ til den skridtvise fremgangsmåde ovenfor er at benytte en direkte inspektion af graf-fladen for funktionen S(v,c). I figur 8 er vist den graf-flade, der hører til de 7 konkret givnepunkter i figur 2. Det ses, at fladen, landskabet, netop har to minimums-punkter, og ved at sepå det tilsvarende højdekurve-plot i figur 9 fremgår det tydeligt, at de to minimumspunkter erhenholdsvis ca. (v,c) = (2.17 , −0.51) og ca. (v,c) = (−0.94 , 0.51).

    11

  • v c

    S

    Figur 8: Grafen for funktionen S(v,c) for de 7 valgte punkter i figur 2.

    Opgave 14) Det ser ud som om der er to minimumspunkter for S(v,c) i figurerne 8 og 9. Betyder det,at der skulle være to linjer, der er bedste approksimation til de konkrete givne punkter?Hvilke to i så fald? Vink: Se næste spørgsmål.

    Opgave 15) Hvorfor er forskellen mellem de to v− værdier for de to minimumspunkter ca. π? Hvorforer de to tilsvarende c−værdier ca. hinandens modsatte?

    Materialer:

    • Animationer: Se i mappen:http://www2.mat.dtu.dk/people/S.Markvorsen/DISPLAY/- i undermapperne: XMatDTU/XMwriteF07/REGRESSION/AnimRegres/ og REGRESSION/AnimSymRot/Animationerne hedder henholdsvis:RegresExperim.htmlAnimRot3.htmlAnimRot4.htmlAnimRot8.html

    12

  • 1

    −1

    −1

    2

    0−2

    3

    v

    0

    −2−3

    c

    1

    2

    v

    2

    −1 3−3−2

    −1

    0−2

    1

    2

    0c

    1

    Figur 9: Højdekurve-plot for funktionen S(v,c). Det ses, at S har (samme) minimum for ca.(v,c) = (2.17 , −0.51) og for ca. (v,c) = (−0.94 , 0.51).

    Litteratur

    [1] M. P. Bendsøe, A. Bertelsen, P. G. Hjorth, og S. Markvorsen: Optimale Konstruktioner.Perspektiv (3), Fysikforlaget, (2003) 1 - 8.

    [2] Se, fx: http://www2.mat.dtu.dk/info/mathematics/EmMa/

    [3] H.H. Finkelstein: Why Experimental Mathematics Is The Key To Good Math Instruction,Cambridge Texts in Applied Mathematics (2008).

    [4] S. Toft Jensen og J. Matthiasen (red.) Matematiske Ideer, Matematikforeningen, 1993.

    [5] S. Markvorsen, Integration i flere Variable, Noter, Institut for Matematik, DTU, 2007.http://www2.mat.dtu.dk/education/01005/MWS/INTEGRATOR5/Int5Tekst.pdf

    [6] S. Markvorsen, Math Education at a Crossroads, MAT-Report No. 2006-19, Institut forMatematik, 2006. http://www.learninglab.dtu.dk/frikoebsprojekter/MAT1.aspx

    [7] Yu. A. Shashkin, Fixed Points, American Mathematical Society, MAA, 1991.

    [8] V. M. Tikhomirov, Stories about maxima and minima, American Mathematical Society,MAA, 1990.

    INSTITUT FOR MATEMATIK, MATEMATIKTORVET, DTUBYGNING 303 SYD, 2800 KGS. LYNGBY.

    13