INGRES Dashboard
Persönlicher Hintergrund
• Consultant bei Ingres und anschließend ASK/Ingres
• Seit 1992 freiberuflicher Berater im Umfeld Ingres– Performanceanalyse und Tuning– Remote DBA, DBA auf Zeit– Inhousetraining– Analyse/Begleitung/Durchführung von Projekten
• Seit 2008 service-on-demand• Kontakt: [email protected]
Begrifflichkeit
Ein Kennzahlen-Cockpit (auch IT-Dashboard, Management Cockpit, Scorecard oder Cockpit-Chart) ist eine Visualisierungsform großer Mengen von meist verteilten Informationen in verdichteter Form, z. B. als Kennzahlen, Messpunkte oder Key Performance Indikatoren (KPI). Der Grad sowie die Visualisierungsform der Verdichtung ist ziel- und adressatenabhängig. Die Verdichtung beinhaltet eine Quantifizierung und darauf aufbauend eine Qualifizierung von Informationen, um den Adressaten große Mengen von Informationen übersichtlicher darzustellen. Häufig zu finden ist die Darstellung von Kennzahlen als Ampel-, Tachometer- oder Thermometer-Darstellung.
http://de.wikipedia.org/wiki/Kennzahlen-Cockpit
VorgehensweiseAlle im Folgenden beschriebenen Messzahlen beschicken eine Schnittstelle, die von einem Tool
ausgelesen wird. Dieses Tool stellt diese Zahlen dar.
Es handelt sich dabei stets um einen momentanen Zustand (Snapshot) der einzelnen Module, welcher 3 Ausprägungen besitzen kann:
Das Modul läuft ohne Fehler Keine Aktion notwendig
Es existieren Unregelmäßigkeiten. Das Modul muss beobachtet werden und Aktion gegebenenfalls starten
Das Modul arbeitet nicht. Sofortige Aktion ist notwendig
Alle Daten werden zentral gespeichert (zB in einer Datenbank), um bei Bedarf später ausgewertet werden zu können
Messintervalle sind nicht zwingend Darstellungs- oder Betrachtungsintervalle
Sind Abhängigkeiten vorhanden, so wird stets nur die erste Unterbrechung dargestellt (zB Server1 – Netzwerk – Server2)
INGRES Dashboard
Betrachtet werden Messzahlen der Bereiche
– Applikation– Betriebssystem (UNIX) – Datenbank
INGRES DashboardApplikation – Übersicht
Module,die über das Monitoring überwacht werden• Server Applikationen• Frontend Applikationen• Antwortzeiten Unix Applikation• Antwortzeiten PC Applikation
Periphere Applikationen / Schnittstellen
INGRES DashboardApplikation: Bedeutung und Schwellwerte
• Unix ApplikationenIn mehreren Modulen werden notwendigen Aktionen des Systems ausgeführt. Der
Großteil erfolgt im Hintergrund im BatchmodusSchwellwerte: Applikation verfügbar und läuft
Teile der Applikation fehlen (nicht betreibsnotwendige Teile) ges. Applikation oder betriebsnotwendige Teile nicht verfügbar
Messintervalle: 5 MinutenEntwicklungsaufwand: gering
• Frontend ApplikationenFrontend Applikationen sind die Online Schnittstelle für den Benutzer zur Datenbank. Hier
werden die meisten notwendigen Ein- und Ausgaben des Systems abgedecktSchwellwerte: Applikation verfügbar und kann gestartet werden
Applikation nicht verfügbarMessintervalle: 5 MinutenEntwicklungsaufwand: mittel
INGRES DashboardApplikation: Bedeutung und Schwellwerte
• Performance Unix ApplikationExistiert ein SLA, welches für die Module eine Antwortzeit von weniger als ?? Sekunden für ??% von
definierten Transaktionen zusagt.
Schwellwerte: Antwortzeiten innerhalb SLA Antwortzeiten kurzfristig über SLA (Zeit < tbd) Antwortzeiten über SLA ( Zeit: >= tbd)
Messintervalle: 30 MinutenEntwicklungsaufwand: mittel/hoch
• Performance Frontend ApplikationExistiert ein SLA, welches für die Module eine Antwortzeit von weniger als ?? Sekunden für ??% von
definierten Transaktionen zusagt. Schwellwerte: Antwortzeiten innerhalb SLA
Antwortzeiten kurzfristig über SLA (Zeit < tbd) Antwortzeiten über SLA ( Zeit: >= tbd)
Messintervalle: ?? MinutenEntwicklungsaufwand: mittelhoch
INGRES DashboardApplikation: Bedeutung und Schwellwerte
• Periphere ApplikationenApplikationen, die zum Betrieb der Gesamtumgebung notwendig sind. Bei allen
Systemen kann die Verfügbarkeit und evtl. die Auslastung gemessen werden, zB über Empfangs- bzw. Ausführungsquittungen.
Schwellwerte: Verfügbar Antwortzeit der Telegramme < tbd Minuten belastet Antwortzeiten der Telegr. zwischen tbd Min und tbd
MIn nicht verfügbar Antwortzeiten der Telegramme > tbd Minuten
INGRES DashboardUnix - Übersicht
Module, die über das Monitoring überwacht werden• Server • Plattenplatz• CPU Auslastung gesamt• CPU Auslastung DBServer• Backup Sicherung
INGRES DashboardUnix: Bedeutung und Schwellwerte
• Produktive ServerHier befindet sich das gesamte System für den produktiven Ablauf (Applikation,
Datenbanksystem)Schwellwerte: läuft und kann genutzt werden
steht nicht zur VerfügungMessintervalle: minütlichEntwicklungsaufwand: gering
• Zusätzliche ServerHier befinden sich Applikationen, die nicht notwendig für ein problemlosen Betrieb verfügbar
sein müssenSchwellwerte: läuft und kann genutzt werden
steht kurzfristig nicht zur Verfügung (Zeit tbd)steht länger nicht zur Verfügung (Zeit tbd)
Messintervalle: 10 MinutenEntwicklungsaufwand: gering
INGRES DashboardUnix: Bedeutung und Schwellwerte
• Plattenplatz (Produktion und zusätzliche Server)Es werden alle notwendigen Informationen auf den entsprechenden Platten gespeichert. Hierbei
sind nicht nur die Datenbankbereiche interessant, sondern ebenso die restlichen Verzeichnisse (zB Benutzer, Tracefiles …)
Schwellwerte: genügend Platz vorhanden Platz auf einigen Verzeichnissen knapp (Prozentsatz tbd) Plattenplatz voll (Prozentsatz 100 %)
Messintervalle: 5 MinutenEntwicklungsaufwand: gering
• CPU Auslastung gesamtDie Leistungsfähigkeit eines Servers wird unter anderem von der Auslastung des Hauptprozessors
bestimmtSchwellwerte: genügend Reserven vorhanden
kurzfristige Volllast(Zeit < 5 Minuten) Volllast über einen längeren Zeitraum (Zeit >= 5 Minuten)
Messintervalle: minütlichEntwicklungsaufwand: gering
INGRES DashboardUnix: Bedeutung und Schwellwerte
• CPU Auslastung DatenbankserverAlle Datenbankserver nutzen und brauchen wie alle Prozesse Rechenleistung des
HauptprozessorsSchwellwerte: genügend Reserven vorhanden
einzelne DBServer nutzen die CPU zu 100 % (Zeit < 5 Minuten)
einzelne DBserver nutzen die CPU zu 100% (Zeit >= 5 Minuten)
Messintervalle: minütlichEntwicklungsaufwand: gering
INGRES DashboardUnix: Bedeutung und Schwellwerte
• Backup SicherungDie Daten der Server werden regelmässig gesichert. Diese Sicherungen dienen zur
Wiederherstellung der Daten im FehlerfallSchwellwerte: Sicherung erfolgreich beendet
einmaliger Ausfall der Sicherung Sicherung mehr als einmal nicht erfolgreich
Messintervalle: halbtäglichEntwicklungsaufwand: gering
INGRES DashboardDatenbank - Übersicht
Module, die über das Monitoring überwacht werden• Datenbanksystem Produktivsystem • Datenbanksystem weitere Server• Teile des Datenbanksystems (Archiver, Name- und Netserver)• Anzahl Fehler im Datenbanksystem• Anzahl Deadlocks im Datenbanksystem• Anzahl Timeouts im Datenbanksystem• Verhältnis erfolgreiche Locks/Lockwaits• Zustand Logfile • Plattenplatz Datenbank • Datenbanksicherung (Checkpoint)• Produktiv Datenbank ok/erreichbar• Weitere Datenbanken ok/erreichbar • Unix Resourcennutzung des Datenbanksystems
Datenbank I/O NutzungDatenbank Memory Nutzung Datenbank CPU Nutzung
INGRES DashboardDatenbank: Bedeutung und Schwellwerte
• Datenbanksystem ProduktivsystemDas Datenbansystem bildet die Schnittstelle zwischen der Applikation und der
Datenbank. Schwellwerte: alle Datenbankprozesse vorhanden und nutzbar
Archiver/Nameserver nicht vorhanden Prozesse, außer Archiver/Nameserver, nicht vorhanden
Messintervalle: minütlichEntwicklungsaufwand: gering
• Datenbanksystem weitere ServerSchwellwerte: alle Datenbankprozesse vorhanden und nutzbar
Datenbankprozeße vorübergehend nicht vorhanden ( < tbd Std.)
Datenbankprozeße länger nicht vorhanden ( > tbd Std.)Messintervalle: minütlichEntwicklungsaufwand: gering
INGRES DashboardDatenbank: Bedeutung und Schwellwerte
• Anzahl Fehler im Datenbanksystem Alle Unregelmäßigkeiten des Datenbanksystems werden zentral in einem Logfile
abgelegt. Schwellwerte: Anzahl der Meldungen < tbd
Anzahl der meldungen >= tbdMessintervalle: minütlichEntwicklungsaufwand: gering ( ~ 1 PT )
• Anzahl Deadlocks Alle Locks die vom System gelöst werden müssen führen zu einer wiederholten
Tätigkeit oder deren AbbruchSchwellwerte: Anzahl Deadlocks < tbd
Anzahl Deadlocks zwischen tbd und tbd Anzahl Deadlocks > tbd
Messintervalle: minütlichEntwicklungsaufwand: gering ( ~ ½ PT )
INGRES DashboardDatenbank: Bedeutung und Schwellwerte
• Verhältnis erfolgreiche Locks/Lockwaits Kann ein Lock nicht vom DBSystem erhalten werden, so wird gewartet, bis dieser zur Verfügung
steht, bzw eine Zeitspanne verstrichen ist (siehe unten). Schwellwerte: Verhältnis< tbd %
Verhältnis zwischen tbd % und tbd % Verhältnis> tbd %
Messintervalle: minütlichEntwicklungsaufwand: gering
• Anzahl Timeouts Kann in einer definierten Zeit eine Sperre nicht erhalten werden, so wird der Wartezustand
aufgegeben und die Transaktion von vorne begonnen, um andere Prozesse nicht zu behindern.
Schwellwerte: Anzahl Timeouts < tbd Anzahl Timeouts zwischen tbd und tbd Anzahl Timeouts> tbd
Messintervalle: minütlichEntwicklungsaufwand: gering
INGRES DashboardDatenbank: Bedeutung und Schwellwerte
• Zustand Logfile Alle Veränderungen innerhalb der Datenbank werden in ein zentrales File geschrieben, welches in
Zeitintervallen gesichert und reorganisiert wird. Findet diese Reorganisation nicht statt, lässt das Datenbanksystem keine weiteren Veränderungen zu.
Schwellwerte: Füllgrad < 20 % Füllgrad zwischen 20 % und 70 % Füllgrad > 70 %
Messintervalle: minütlichEntwicklungsaufwand: gering
• Plattenplatz Datenbankbereiche Zusätzlich zu der allgemeinen Beobachtung des Plattenplatzes (siehe Unix) sollte der Platz der
Datenbankbereiche gemonitored werden. Ist für gewisse Bereiche kein Platz mehr vorhanden, so findet keine Sicherung mehr statt oder die Datenbank lässt keine weitere Verarbeitung zu.
Schwellwerte: Füllgrad < 75 % (bei sehr großen Filesystem angepasst) Füllgrad zwischen 75 % und 90 % Füllgrad > 90 %
Messintervalle: minütlichEntwicklungsaufwand: gering
INGRES DashboardDatenbank: Bedeutung und Schwellwerte
• DatenbanksicherungUm die Verfügbarkeit der Datenbank so hoch wie möglich zu gewährleisten, wird zur
Sicherung ein Online Backup der Datenbank (Checkpoint) durchgeführt. Diese ist notwendig um im Fehler/Katastrophenfall die Datenbank wiederherstellen zu können.
Schwellwerte: letzte DB Sicherung OK letzte DB Sicherung nicht OK vorhergehende Sicherungen nicht OK
Messintervalle: viertelstündlichEntwicklungsaufwand: gering
• Zustand ProduktivdatenbankHier wird der physische (nicht logische!) Zustand der Datenbank kontrolliert.Schwellwerte: Datenbank erreichbar und ohne Fehler abfragbar
Datenbank nicht erreichbar, bzw nicht konsistentMessintervalle: minütlichEntwicklungsaufwand: gering
INGRES DashboardDatenbank: Bedeutung und Schwellwerte
• Unix Resourcennutzung des DatenbanksystemsWie alle Prozesse nutzt auch die Datenbank die Resoucen PlattenI/O, Memory
und CPU. Diese können direkt im Datenbanksystem abgefragt werdenSchwellwerte: Werte liegen unter einer Grenze ( tbd )
Werte liegen über einem Wert (tbd )
Messintervalle: halbstündlichEntwicklungsaufwand: gering