Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
2005-10-13 Gk/ÖK:ITO, gj 1
Informationsarkivering för operativ
och strategisk verksamhet
F5
2005-10-13 Gk/ÖK:ITO, gj 2
Arkiveringsperspektiv
• Operativa databaser– Används för att arkivera information som
används för att utföra dagligt arbete och att fatta beslut som har med det dagliga arbetet att göra
• Strategiska databaser– Används för att arkivera information som
behövs för att kunna fatta strategiska beslut dvs. beslut på längre sikt
2005-10-13 Gk/ÖK:ITO, gj 3
Dagens föreläsning• Arkivering av information för strategiska
ändamål– Beslutsfattande, Data Warehousing, Data
Warehouse, Datamining• Kunskapshantering• Arkivering av information för operativa ändamål
– Informationsbehov, databas(er), DatabaseManagement System, datamodellering, E-R diagram
• SQL– Insert, update, delete, select
2005-10-13 Gk/ÖK:ITO, gj 4
Strategisk informationsarkivering
2005-10-13 Gk/ÖK:ITO, gj 5
Beslutsprocessen
Intelligence
- Samla och analysera data om problemet
Problemlösning
Design
- Skapa alternativ, skapa kriterier för utvärdering, utvärdera resultat av alternativ
Choice
- Välj prioriterat/optimalt alternativ
Implementation
-Informera om beslut, genomför valt alternativ
Hitta problemet
Resultat
Precisera problemet
2005-10-13 Gk/ÖK:ITO, gj 6
Beslutsteorier – om hur beslut gårtill/bör gå till
• Satisfactory – tillräckligt bra alternativ väljs i stället för ett optimalt alternativ (rationality)
• (Carbage can – lösning kan söka problem i stället för tvärtom)
• (Political model – beslut som fattas beror påkompromisser mellan grupper)
2005-10-13 Gk/ÖK:ITO, gj 7
Alters definition av beslutsstödssystem
• ”Beslutsstödssystem är ett interaktivt informationssystem som tillhandahåller information, modeller, datamanipuleringsverktyg för att stödja beslutsfattande i semistrukturerade och ostrukturerade situationer när ingen vet exakt hur beslut ska tas”
2005-10-13 Gk/ÖK:ITO, gj 8
Data warehousing arkitektur
Query/Reporting
ExtractConsolidationFilteringCleansingTransformationAggregationUpdating
Serve
Data warehouse
External källor
Data marts
Analysis/OLAP
Falö aöldfflaöd aklödfalö alksdf
Data mining
Productt Time1 Value1 Value11
Product2 Time2 Value2 Value21
Product3 Time3 Value3 Value31
Product4 Time4 Value4 Value41
Operational DBs/TPS/OLTP
SlutanvändarverktygBusiness Intelligence tools
Data staging areaETL process (Extract, Transform, Load)
”The data warehouse”OLAP servers
Transaktionssystem (TPS) som sköter den dagliga verksamheten + externa källor
OLAP servers
OLAP servers
2005-10-13 Gk/ÖK:ITO, gj 9
Mer om DW
• Data som lagras i ett data warehouse laddas nedperiodiskt från transaktionsdatabaser, och laddas i en separat databas som ofta finns på en separat dator ochsom använder en speciell OLAP-server
• Genom att ha ett DW undviker man att störatranskationssystemens dagliga verksamhet
• Möjliggör strukturering av data så att användare kanfå snabba svar (stjärnstrukturer och kuber)
2005-10-13 Gk/ÖK:ITO, gj 10
Varför behövs ett DW?
DBMSDB
DBMSDB
DBMSDB
DBMSDB
End userapplication A
End userapplication B
End userapplication C
Det finns behov av att samla data som finns utspridd på flera databaser/IT-system – som underlag för strategiska och taktiska beslut
2005-10-13 Gk/ÖK:ITO, gj 11
Alters definition av DW
“Ett data warehouse (datalager) är en kombination av en databas och en mjukvara som är utformad för att stödjaverksamhetsanalys och beslutsfattande påledningsnivå snarare än att stödja minut till minut-processande avverksamhetstransaktioner”
2005-10-13 Gk/ÖK:ITO, gj 12
Vad är OLAP?Akronym för “On-line Analytical Processing”
OLAP-system fanns redan på 1970-talet, innan det talades om data warehousing. Idag är OLAP nära knutet till data warehousing.Kända OLAP-system idag är Hyperions “Essbase”, Cognos“PowerPlay”, IBMs “DB2 OLAP Server”, Microsofts “Analysisservice”.
OLAP är ett beslutsstödssystem som stödjer ad-hoc frågor (frågorsom formuleras beroende av aktuell kontext), vilket möjliggör för organisationsledning och analytiker att interaktivt manipulera data
Idén är att låta användare enkelt och snabbt manipulera och visualisera data genom multidimensionella vyer, det vill säga ur olika dimensioner eller perspektiv
2005-10-13 Gk/ÖK:ITO, gj 13
Spreadsheet (kalkylblad) output från OLAP-verktyg
mounthquarter
productproduct group
officeregion Dimensioner/Vyer
Product Group Region First Quarter - 1997Group A ABC 1245Group A XYZ 34534Group B ABC 45543Group B XYZ 34533
Column headers(join constraints)
Column header(application constraint) Answer set representing
focal event
Row headers
Fakta
Dimensioner/Vyer
2005-10-13 Gk/ÖK:ITO, gj 14
Kuben: “multidimensionell” vy av data
En populär konceptuell modell som influerat utformning av:
• slutanvändarverktyg (OLAP-klienter)
• modellering av databasschema (dimensionell modellering)
2 300
200
130
The data cube:
5 024
2005-10-13 Gk/ÖK:ITO, gj 15
Spreadsheets:
quar
ter
office
service
2 300
200
130
The data cube:
5 024
office
130
service
quar
ter
5 024
2 300
200
Kuben: “multidimensionell” vy av data
- Numeriska fakta (e.g. antal, summa) beror på en mängd dimensioner/vyer/perspektiv
2005-10-13 Gk/ÖK:ITO, gj 16
Dimensional modelling - Star-join schema
Service used
Telephone calls
Time
Office DimensionCustomer
- service name- service group
- date- month- quarter- year
- customer name- address- region- income group
- seller name- office
- sum ($)- number of calls
2005-10-13 Gk/ÖK:ITO, gj 17
Dimensional modelling - Star-join schema
Date/Key Month Quarter Year991011 9910 4 - 99 99991012 9910 4 - 99 99
Key Customer Address RegionIncomegroup
C210 Anna N Stockholm Stockholm BC211 Lars S Malmö Skåne BC212 Erik P Rättvik Dalarna CC213 Danny B Stockholm Stockholm AC214 Åsa S Stockholm Stockholm A
Key ServiceServicegroup
S1 Local call Group AS2 Intern. call Group AS3 SMS Group BS4 WAP Group C
Key Seller OfficeF11 Anders C SundsvallF12 Lisa B SundsvallF13 Janis B Kista
Service Dimension Time Dimension
Office DimensionCustomer Dimension
Fact table - Transactions
SumNumberof calls
C210 S1 F11 991011 25:00 3C210 S3 F11 991011 05:00 1C212 S2 F13 991011 89:00 1C213 S1 F13 991011 12:00 1C214 S4 F13 991012 08:00 1
2005-10-13 Gk/ÖK:ITO, gj 18
Två star-join scheman
Service
Calls
Office
Quarter
Service
Subscription
ordersOffice
Quarter
Customer
Customer
Data Mart A
Data Mart B
Data Warehouse = Data Mart A + Data Mart B
2005-10-13 Gk/ÖK:ITO, gj 19
Alters definition av data mining
• ”Data mining är användning av dataanalysverktyg för att finna mönster i stora transaktionsdatabaser”
• Särskilda algoritimer används för att hitta dessa mönster
2005-10-13 Gk/ÖK:ITO, gj 20
Regression
• Vid regression försöker hitta en linje eller kurva genom en mängd data, se figur
Ålder
X X XX XXX
XX X X
XX XX XXX
X X X
Lönsamma kunder
2005-10-13 Gk/ÖK:ITO, gj 21
”Klustring”
• ”Klustring” identifierar grupperingar
• Ett kluster är en grupp av objekt som grupperas tillsammans på grund av likheter, till exempel likartat beteende
Skulder
X X
XXX X
X X
XX
X X X
X X X
XLönsammakunder!
Inkomster
2005-10-13 Gk/ÖK:ITO, gj 22
Kunskapshantering
2005-10-13 Gk/ÖK:ITO, gj 23
Tyst och explicit kunskap
Tyst och explicit kunskap kräver olika former av kunskapshantering och kunskapshanteringssystem
• Tyst kunskap – är kunskap förstådd och tillämpad omedvetet. Erhålls och delas genom erfarenhet och social interaktion
• Explicit kunskap – är kunskap precist och formellt artikulerad. Ofta kodifierad som går att spara i dokument och databaser. Mera oberoende av individen
2005-10-13 Gk/ÖK:ITO, gj 24
Principer att hålla i minnet
• Den viktigaste kunskapen är tyst kunskap• Tyst kunskap utbyts bäst genom
personlig interaktion• Allt arbete är ”kunskapsarbete" i dagens
ekonomi• Organisationer förlorar kunskap när de
människor slutar
2005-10-13 Gk/ÖK:ITO, gj 25
Mål med kunskaps-hanteringssystem
Kunskapshanteringssystem är kommunikationssystem som ska underlätta delande av kunskap, snarare än information
2005-10-13 Gk/ÖK:ITO, gj 26
Operativ informationsarkivering
2005-10-13 Gk/ÖK:ITO, gj 27
Mina vänners intressen
2005-10-13 Gk/ÖK:ITO, gj 28
Informationsbehov?
• Jag vill gå på aktivitet X, vem av mina vänner skall jag be om att följa med?– Informationsbehov;
• det som jag behöver känna till om mina vänner för att kunna välja ut rätt vän att kontakta för att gå påaktivitet X.
• Var hittar jag den informationen?
2005-10-13 Gk/ÖK:ITO, gj 29
Entitet (företeelse)• Entitet; något som jag behöver information
om
AktiviteterVänner
2005-10-13 Gk/ÖK:ITO, gj 30
Vad behöver jag veta om en entitet?
AktivitetVän
NamnGatuadressPostnrPostorttelnr
namnExKalle
ExTennis
samband
2005-10-13 Gk/ÖK:ITO, gj 31
Var hittar jag informationen ?
Böcker(tabeller i en databas)
Bibliotek (databas)
Bibliotekarie (DBMS)(DataBase Management System)
Bok (fil) Bokhyllan(filhanteringssystem)Bok
Ej dator
Bokhylla
Dator
Dator
2005-10-13 Gk/ÖK:ITO, gj 32
Databas
• En samling strukturerad data som har samlats och som kontrolleras av en dator och det innebär att en dator även måste användas för att fååtkomst till data
2005-10-13 Gk/ÖK:ITO, gj 33
DataBase Management System (DBMS)
• Det är ett antal integrerade program som används för att definiera, uppdatera och kontrollera databaser.;
• lägga in ny data• ändra i data• radera data• hämta data
2005-10-13 Gk/ÖK:ITO, gj 34
Bibliotek kontra databas• Bibliotek
– Kategoriserad• Ämnesområden t.ex.
biologi
– Sorterad• Författarenamn t.ex. Karin
Wahlberg
• Databas– Kategoriserad
• Företeelser som man behöver samla in information om t.ex. människor
– Sorterad• Primär nyckel t.ex.
personnummer
2005-10-13 Gk/ÖK:ITO, gj 35
Definiera och organisera data i en databas
• Teknik; – Datamodellering(variant av konceptuell modellering)
• Resultat;– Entity-Relationship (E-R) Diagrams,
datamodeller(exempel på ett konceptuellt schema eller en konceptuell modell)
2005-10-13 Gk/ÖK:ITO, gj 36
Data modellering
1. Vilka företeelser (entiteter) behöver man information om?
2. Vilken information måste databasen innehålla för varje företeelse (entitetstyp)?
3. Vilka relationer finns det mellan de olika företeelserna (entiteterna)
2005-10-13 Gk/ÖK:ITO, gj 37
Vändatabas• E-R modell (diagram) som innehåller den
information som du behöver för att hitta rätt vän för att besöka aktivitet X.
• E-R diagrammet behöver innehålla information om– Vänner– Aktiviteter– Vilka aktiviteter som mina vänner deltar i
2005-10-13 Gk/ÖK:ITO, gj 38
EntitesbeskrivningEntitetsnamn
Attribut 1 Attribut 2Attribut 3etc
Databas deklaration behöver dessutomför varje attribut:typ av tecken t.ex. bokstäver, talAntal tecken per typ, tex. 30
Medlem
medlemsnr num 6fnamn anum 20enamn anum 30gadr anum 40postnr num 5postadr anum 10
Primär nyckel
2005-10-13 Gk/ÖK:ITO, gj 39
E-R diagram
Kardinalitet
Entitetsnamn
Attribut 1 Attribut 2Attribut 3etc
Entitetsnamn
Attribut 1 Attribut 2Attribut 3etc
Entitet
namn
Elev:
Tex Kalle, LisaRelation Elev:
KalleLärareTex Gudrun
2005-10-13 Gk/ÖK:ITO, gj 40
RelationstyperM:1-relation
Medlem Avgift
Sport
betalar
tränarM:M-relation
1:1-relationer
Kontaktperson
har
2005-10-13 Gk/ÖK:ITO, gj 41
Upplösning av M:M-relation
Medlem Avgift
Sport
betalar
medlemsnr avgiftsnr
sportdeltagare
PrimärNyckel
Medlemsnrsportnrsportnr
2005-10-13 Gk/ÖK:ITO, gj 42
Realisering av relation i tabellerna
medlem
medlemsnr
Avgift
avgiftsnrModell:
Avgift
avgiftsnr
medlem
medlemsnrtabeller:
avgiftsnr
Främmande nyckel:realiserar relationen mellan två olika entiter
2005-10-13 Gk/ÖK:ITO, gj 43
Vad behöver jag veta om en entitet?
AktivitetVan
vannrfnamnenamngadrpostnrmtelnr
aktnraktnamn
2005-10-13 Gk/ÖK:ITO, gj 44
Databas Vänner(E-R diagaram/Databasmodell)
Vanvannrvnamnvnamnvadrpostnrmtelnr
Aktivitet
aktnraktnamn
Van/akt
Vannraktnr
2005-10-13 Gk/ÖK:ITO, gj 45
Tabellbeskrivning av en entitet
Medlem
Medlemsnr fnamn eman gdr postnr postadr
10001 Eva Åström Storg 1 91436 Åby10002 Per Älvström Byg 1 72048 Åre10003 Lotta Byström Gåg 10 34091 Hjo
PostInstansobjekt
Entitetstypattribut
2005-10-13 Gk/ÖK:ITO, gj 46
Olika typer av databaser
• Lagringen av data– Hierarkiska
databaser– Nätverksdatabaser– Relationsdatabaser– Objektorienterade
databaser– Multidimensionella
databaser
• Typ av data – Geografiska databaser– Textdatabaser– Bilddatabaser– Hypertextdatabaser