5
To już dwudziesta wersja programu IBM SPSS Stascs (niegdyś SPSS). W ponad czterdziesto- letniej historii tego produktu, każda kolejna wersja przynosi nowe funkcjonalności ułatwiające pracę analityków i zwiększające ich arsenał narzędziowy. Nie inaczej jest w przypadku naj- nowszej wersji. Nowości, choć nie tak spektakularne i nie od razu widoczne jak w niektórych poprzednich wersjach, doceni każdy użytkownik pracujący z systemem IBM SPSS Stascs. Firma IBM, właściciel i twórca oprogramowania SPSS Stascs zdecydowała się przede wszystkim na poprawienie wydajności działania systemu. W IBM SPSS Stascs 20 doko- nano optymalizacji niektórych procedur, a w innych przypadkach także pewnych uproszczeń, po to by wykonywały się szybciej. Na przykład, przyrost prędkości generowania tabel w oknie raportu jest bardzo odczuwalny, co z pewnością zostanie zauważone i docenione przez wielu analityków, zwłaszcza tych generujących setki tabel w swoich raportach. Ale poprawienie wydajności to nie jedyne usprawnienie. Inne nowości, które pojawiły się w najnowszej wersji programu, są skierowane zarówno do zaawansowanych, jak i początkujących analityków, a nawet do tych, którzy na co dzień rzadko sięgają po narzędzia statystyczne. Zapraszamy do zapoznania się z wybranymi nowościami jakie kryje w sobie IBM SPSS Stascs 20. Nowa jakość analiz przy użyciu map To jedna z najważniejszych nowości, choć przygodę z prezentacją informacji analitycznych na mapach, program SPSS miał już w swojej historii. Później ta funkcjonalność nie była przez kilka wersji dostępna ze względu na zmianę technologiiz jakiej korzystał program IBM SPSS Stascs. W najnowszej wersji programu zaproponowano nowe podejście do tego tematu i mapy pojawiły się wśród różnych rodzajów wizualizacji tworzonych przez program. Ta jedna z najbardziej oczekiwanych nowości jest dostępna w taki sam sposób, jak pozostałe wykresy — poprzez funkcję [SzaBlony wIzualIzacjI danych]. Oznacza to, że aby prowadzić analizy terytorialne wystarczy moduł bazowy IBM SPSS Stascs, bez konieczności zakupu dodatkowego modułu czy licencji. Co nowego w IBM SPSS Stascs? Nowe rozwiązania i funkcjonalności usprawniające i przyspieszające prowadzenie analiz Rysunek 1. Mapy i nałożone na nie wykresy tematyczne ułatwiają zapoznanie się z wynikami analiz i pozwalają dostrzec ukryte zależności

Co nowego w IBM SPSS Statistics? - predictivesolutions.pl · analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, ... zadania produkcyjne (Production Facility) SPSS Polska

Embed Size (px)

Citation preview

Page 1: Co nowego w IBM SPSS Statistics? - predictivesolutions.pl · analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, ... zadania produkcyjne (Production Facility) SPSS Polska

To już dwudziesta wersja programu IBM SPSS Statistics (niegdyś SPSS). W ponad czterdziesto-letniej historii tego produktu, każda kolejna wersja przynosi nowe funkcjonalności ułatwiające pracę analityków i zwiększające ich arsenał narzędziowy. Nie inaczej jest w przypadku naj-nowszej wersji. Nowości, choć nie tak spektakularne i nie od razu widoczne jak w niektórych poprzednich wersjach, doceni każdy użytkownik pracujący z systemem IBM SPSS Statistics. Firma IBM, właściciel i twórca oprogramowania SPSS Statistics zdecydowała się przede wszystkim na poprawienie wydajności działania systemu. W IBM SPSS Statistics 20 doko-nano optymalizacji niektórych procedur, a w innych przypadkach także pewnych uproszczeń, po to by wykonywały się szybciej. Na przykład, przyrost prędkości generowania tabel w oknie raportu jest bardzo odczuwalny, co z pewnością zostanie zauważone i docenione przez wielu analityków, zwłaszcza tych generujących setki tabel w swoich raportach. Ale poprawienie wydajności to nie jedyne usprawnienie. Inne nowości, które pojawiły się w najnowszej wersji programu, są skierowane zarówno do zaawansowanych, jak i początkujących analityków, a nawet do tych, którzy na co dzień rzadko sięgają po narzędzia statystyczne. Zapraszamy do zapoznania się z wybranymi nowościami jakie kryje w sobie IBM SPSS Statistics 20.

Nowa jakość analiz przy użyciu map

To jedna z najważniejszych nowości, choć przygodę z prezentacją informacji analitycznych na mapach, program SPSS miał już w swojej historii. Później ta funkcjonalność nie była przez kilka wersji dostępna ze względu na zmianę technologiiz jakiej korzystał program IBM SPSS Statistics. W najnowszej wersji programu zaproponowano nowe podejście do tego tematu i mapy pojawiły się wśród różnych rodzajów wizualizacji tworzonych przez program. Ta jedna z najbardziej oczekiwanych nowości jest dostępna w taki sam sposób, jak pozostałe wykresy — poprzez funkcję [SzaBlony wIzualIzacjI danych]. Oznacza to, że aby prowadzić analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, bez konieczności zakupu dodatkowego modułu czy licencji.

Co nowego w IBM SPSS Statistics?Nowe rozwiązania i funkcjonalności usprawniające i przyspieszające prowadzenie analiz

Rysunek 1.

Mapy i nałożone na nie wykresy tematyczne

ułatwiają zapoznanie się z wynikami analiz

i pozwalają dostrzec ukryte zależności

Page 2: Co nowego w IBM SPSS Statistics? - predictivesolutions.pl · analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, ... zadania produkcyjne (Production Facility) SPSS Polska

2

Dodatkowa wartość analityczna i biznesowa, uzyskana dzięki analizom osadzonym także w wymiarze geograficznym, daje nie tylko możliwość łatwiejszej interpretacji wyników, ale również uwidacznia ukryte czasami zależności pomiędzy danymi. Różne typy wizualizacji na mapach, takie jak kartogramy (kolorowane obszary map) lub mapy z nałożonymi tradycyj-nymi wykresami (słupkowe, kołowe, liniowe itp.) pomagają w efektywniejszym planowaniu działalności biznesowej związanej z lokalizacją geograficzną.

Wraz z programem IBM SPSS Statistics, dystrybuowanych jest kilka przykładowych map i zbiorów danych. Dzięki nim można samodzielnie rozpocząć naukę wizualizacji wyników analiz na mapach. W miarę rozwoju umiejętności, poza wykresami na mapach można także samodzielnie tworzyć same mapy (np. mapę kraju w podziale terytorialnym odpowiednim do struktury przedsiębiorstwa), bo w programie dostępne jest także narzędzie do edycji map oraz konwersji map dostępnych w formacie ESRI.

Wizualizacje na mapach mogą być użyteczną formą analizy w wielu różnych sektorach takich jak na przykład: marketing (np. terytorialny pomiar efektywności kampanii), sprzedaż (np. pla-nowanie lokalizacji sklepów, raportowanie sprzedaży w regionach), wymiar sprawiedliwości (np. oznaczanie ognisk przestępczości), czy też w zastosowaniach naukowych i akademickich (np. badanie efektów nauczania w regionalnych ośrodkach szkoleniowych i w skali globalnej). Wizualizacja na mapach dostępna w IBM SPSS Statistics, choć swoimi możliwościami nie dorównuje specjalizowanym narzędziom GIS, zaspakaja jednak podstawowe wymagania funkcjonalne zgodne z oczekiwaniami większości analityków.

Uogólnione liniowe modele mieszane (GlMM) dla wartości porządkowych

Uogólnione liniowe modele mieszane to stosunkowo nowa procedura dostępna w module IBM SPSS Statistics Advanced Models. W najnowszej swojej postaci rozszerza właściwości modeli liniowych, w których zmienna przewidywana jest liniowo powiązana z predyktorami i współzmiennymi poprzez specjalną skumulowaną funkcję łączenia. Zmienna przewidywana może nie mieć rozkładu normalnego, a obserwacje mogą być skorelowane. Generowane przez procedurę modele mogą więc obejmować bardzo szerokie spektrum, począwszy od prostej regresji liniowej aż po złożone modele wielopoziomowe. Uruchomienie procedury GlMM jest teraz możliwe także przy uwzględnieniu informacji o uporządkowaniu kategorii zmiennej prze-widywanej z porządkowym poziomem pomiaru. Pozwala to na budowanie dokładniejszych modeli w przypadku przewidywania nieliniowych wartości wynikowych (takich jak poziom satysfakcji klienta przyporządkowany do kategorii: niski, średni i wysoki poziom zadowolenia).

W procedurze można odpowiednio zdefiniować strukturę danych, np. poprzez określenie hie-rarchii występujących w danych, a w przypadku danych skorelowanych dołączyć efekty losowe, aby wyjaśnić przyczynę zmienności w zmiennej zależnej. Procedura automatycznie tworzy bloki efektów losowych wyjaśniające korelacje na różnych poziomach kombinacji obiektów.

W oknie przeglądu modelu prezentowane są różne informacje na temat wygenerowanego modelu, jego dopasowania do danych itp. Znajdziemy tam między innymi:

z ogólne podsumowanie i kryterium informacyjne; z opis struktury danych; z wykres wartości przewidywanych przez obserwowane, wskazujący na dopasowanie

modelu; z wizualizację i tabelę testów efektów stałych (statystyka F, stopnie swobody, istotność); z wizualizację i tabelę oszacowań parametrów (dla wyrazu wolnego i poszczególnych

współczynników – błąd standardowy, statystyka t, istotność i przedział ufności); z tabelę parametrów kowariancji i oszacowanie wariancji dla reszt; z i wiele innych informacji ułatwiających właściwy dobór modelu.

Szybsze generowanie tabel w raportach wynikowych

Dla analityków, dla których podstawową formą przedstawiania wyników analiz jest ich prezen-towanie w postaci tabelarycznej, to bardzo dobra wiadomość. Najnowsza wersja programu IBM SPSS Statistics oferuje też nowy mechanizm generowania tabel, który w znaczący sposób skraca czas potrzebny na ich przygotowanie. Nowe tabele to jedna z bardziej znaczących

Page 3: Co nowego w IBM SPSS Statistics? - predictivesolutions.pl · analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, ... zadania produkcyjne (Production Facility) SPSS Polska

3

zmian w programie, istotna szczególnie dla tych, którzy przygotowują raporty zawierające dużą liczbę tabel. Dzięki kolejnej zmianie w podejściu do generowania tabel wynikowych uzyskano olbrzymi wzrost szybkości działania aplikacji klienckiej IBM SPSS Statistics. Gene-rowane tabele pojawiają się w raporcie jako tabele przestawne, z pełną funkcjonalnością ich przestawiania i formatowania wyglądu. Jednak ich tworzenie w porównaniu do tabel tradycyjnych, dostępnych niegdyś w starszych wersjach programu, jest wielokrotnie szybsze. Jest to walor nie do przecenienia przy tworzeniu i przeglądaniu dużych raportów w oknie IBM SPSS Statistics Viewer.

Po wykonaniu procedur umieszczających wyniki analiz w tabelach, pojawiają się one natych-miast w oknie wynikowym. Można również szybko przejść do dowolnej tabeli w oknie raportu i aktywować ją do edycji, w celu jej dostosowania do specyficznych potrzeb raportowania i pełnego wykorzystania zawartej w niej informacji.

Tak znaczące usprawnienia powodują jednak, że nowe tabele w raporcie są interpreto-wane poprawnie tylko przez IBM SPSS Statistics 20. Aby dostęp do takiego raportu miały także osoby pracujące ze starszymi wersjami programu, należy skorzystać z opcji genero-wania tabel starego typu (tradycyjnych). Opcja generowania tabel tradycyjnych dostępna jest w opcjach systemu ([Edycja] u [oPcjE] u [TaBElE PRzESTawnE] u [PREzEnTowanIE][TaBEl w RaPoRTach]). Po aktywowaniu opcji [GEnERuj jako TaBElE TRadycyjnE] program co prawda nieco wolniej tworzy tabele, ale mogą być one później poprawnie wyświetlane przez starsze wersje programu.

Wykorzystanie IBM SPSS Statistics Server do zadań produkcyjnych

Znaczący wzrost wydajności obliczeń uzyskać można dzięki systemowi IBM SPSS Statistics 20 Server. Skrócony czas obliczeń uzyskuje się nie tylko dzięki przewadze sprzętowej (serwery to zazwyczaj wieloprocesorowe maszyny z dużą ilością pamięci), ale także dzięki różnicom w kodzie aplikacji. Kod aplikacji serwerowej jest inaczej optymalizowany. Niektóre z algo-rytmów analitycznych są przepisane i uwzględniają zalety architektury sprzętowej opartej o wieloprocesorowość z wykorzystaniem wielowątkowości. Aplikacja serwerowa IBM SPSS Statistics Server nie ma też żadnych ograniczeń co do pamięci, liczby procesorów i rdzeni obecnych w systemie. Jest to więc idealne środowisko do realizacji analitycznych procesów produkcyjnych, które na ogół nie wymagają interakcji z użytkownikiem końcowym, a mogą być wymagające obliczeniowo. Nowy mechanizm tworzenia procesów produkcyjnych (Production

Rysunek 2.

Nowe tabele przestawne pozwalają

na szybkie tworzenie obszernych raportów

tabelarycznych

Page 4: Co nowego w IBM SPSS Statistics? - predictivesolutions.pl · analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, ... zadania produkcyjne (Production Facility) SPSS Polska

4

Facility) oferuje w tym celu wykorzystanie zdalnego serwera obliczeniowego z zainstalowa-nym IBM SPSS Statistics 20 Server. Nowością jest możliwość zlecania zadań produkcyjnych (przesłania zestawu poleceń syntax) do ich wykonania w tle, tzn. bez ciągłego połączenia klienta z serwerem. Status zadań można monitorować i po zakończeniu obliczeń „ściągnąć” na klienta raport wynikowy będący rezultatem analiz sterowanych poleceniami syntaxu.

Rozbudowa funkcjonalności raportowej i analitycznej na Statistics Portal

Statistics Portal to możliwość wykorzystania mocy obliczeniowej IBM SPSS Statistics Server poprzez cienkiego klienta (przeglądarkę internetową). Funkcjonalność tę udostępnia system IBM SPSS Collaboration and Deployment Services wraz z systemem IBM SPSS Statistics. W najnowszej wersji programu IBM SPSS Statistics rozbudowano możliwości integracyjne obu systemów. Raporty z tabelami przestawnymi wprost z klienta IBM SPSS Statistics mogą być również publikowane na portalu udostępnianym przez IBM SPSS Collaboration and Deploy-ment Services i dostępnym przez przeglądarkę internetową. W ten sposób większa liczba odbiorców treści analitycznych (użytkowników biznesowych, czy osób decyzyjnych) może mieć na bieżąco dostęp do wyników analiz, bez konieczności posiadania narzędzi analitycznych.

Wymagania sprzętowe i programowe dla IBM SPSS Statistics

IBM sPss Statistics 20 for Windows

z system operacyjny: Microsoft Windows XP (Professional, 32-bit) lub Vista (Home, Business, 32- lub 64-bit), Windows 7 (32- lub 64-bit)

z sprzęt: z cPu Intel lub aMd x86 z pamięć RaM: 1 GB lub więcej rekomendowane z wolna przestrzeń na dysku: 800 MB na instalację z napęd dVd z grafika XGa (1024 × 768) lub wyższa rozdzielczość

z przeglądarka internetowa

Rysunek 3.

Automatyzacja analiz dzięki

narzędziu pozwalającemu tworzyć

zadania produkcyjne (Production

Facility)

Page 5: Co nowego w IBM SPSS Statistics? - predictivesolutions.pl · analizy terytorialne wystarczy moduł bazowy IBM SPSS Statistics, ... zadania produkcyjne (Production Facility) SPSS Polska

SPSS Polskaul. Racławicka 58 · 30-017 KrakówTEl. 12 636 96 80 · FakS wew. 102E-MaIl [[email protected][[www.predictivesolutions.pl[

5

IBM sPss Statistics 20 for Mac

z system operacyjny: Apple Mac 10.6x (Snow Leopard), 10.7x (Lion) 32- i 64-bit z sprzęt:

z cPu Intel (32- i 64-bit) z pamięć RaM: 1 GB lub więcej rekomendowane z wolna przestrzeń na dysku hdd: 800 MB na instalację z napęd dVd z grafika SVGa (800 × 600) zalecana wyższa rozdzielczość

z przeglądarka internetowa

IBM sPss Statistics 20 for Linux

z system operacyjny: Linux oS (32 bit) spełniający wymagania odpowiednie dla systemów Red Hat Enterprise Linux 5 i 6 oraz Debian 6 (inne dystrybucje nie były testowane i nie są wspierane)

z sprzęt: z processor: cPu Intel lub aMd x86 z pamięć RaM: 1 GB lub więcej rekomendowane z wolna przestrzeń na dysku hdd: 800 MB na instalację z napęd dVd z grafika XGa (1024 × 768) lub wyższa rozdzielczość

z przeglądarka internetowa

IBM sPss Statistics Server 20

z systemy operacyjne: z Microsoft Windows 2008 i 2003 (32- i 64-bit) z Sun Solaris 64-bit (SPaRc 64-bit machine) na Solaris 9 i 10 z IBM aIX 5.3 i 6.1, 7. 64-bit (PowerPc) z hP/uX 11i v3 64-bit z Red Hat Enterprise Linux 4x i 5.3 (32- i 64-bit), Advanced Platform 5.0 i 5.3 (32- i 64-bit)

oraz Advanced Server 4x (64-bit) z SuSE Linux for System z – zoS 1.11, zVM 5.4, SlES 10

z sprzęt: z cPu dla systemu Windows i Red Hat Linux: 32-bit x86, 64-bit – EM64T i aMd64 z cPu dla Solaris – UltraSPaRc 2 for Solaris z cPu dla aIX – IBM RS/6000 for aIX, PowerPC 233 Mhz lub lepszy z cPu dla hP/uk – Itanium processor z cPu dla SuSE Linux for System z – IBM System z10, IBM System z10 Enterprise Class,

IBM System z10 Business Class z pamięć RaM: rekomendowane 4 GB lub więcej; minimum 8 GB wymagane jest dla

systemu SuSE Linux for System z z wolna przestrzeń na dysku hdd: 500 MB na instalację; dodatkowo konieczna jest

wolna przestrzeń na realizację obliczeń (np. pliki tymczasowe); na systemie System z wymagane 20 GB

z do połączeń klienta z serwerem IBM SPSS Statistics Server wymagany jest interfejs sieciowy i protokół TcP/IP.