35
Załącznik 1 do modyfikacji treści SIWZ stanowiący Załącznik nr 9 do SIWZ, PN-106/20/MS - „Formularz równoważności – dot. Hurtowni Danych” Wykaz oprogramowania równoważnego do rozwiązania Hurtowni Danych narzędzie w zakresie Hurtowni Danych nazwa producenta nazwa oprogramowania i wersja rodzaj dostarczanej licencji (liczba użytkowników, liczba core, czas trwania) Narzędzia do integracji danych Narzędzia do podniesienia jakości danych ang. Data Quality (DQ) System tworzenia analiz statystycznych w tym DataMining System udostępniania raportów przez WWW dla 10000 użytkowników

przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

Załącznik 1 do modyfikacji treści SIWZ stanowiący Załącznik nr 9 do SIWZ, PN-106/20/MS -

„Formularz równoważności – dot. Hurtowni Danych”

Wykaz oprogramowania równoważnego do rozwiązania Hurtowni Danych

narzędzie w zakresieHurtowni Danych

nazwa producenta

nazwa oprogramowaniai wersja

rodzaj dostarczanej licencji (liczba użytkowników,

liczba core, czas trwania)

Narzędzia do integracji danych

Narzędzia do podniesienia jakości danych ang. Data Quality (DQ)

System tworzenia analiz statystycznych w tym DataMining

System udostępniania raportów przez WWW dla 10000 użytkowników

Wykaz wymaganych funkcjonalności

* dla pola Opis w dokumentacji należy uzupełnić nazwę dokumentu oraz nr strony/stron, na których opisana jest wymagana funkcjonalność lub link do strony internetowej na której funkcjonalność jest opisana w dokumentacji producenta. Jeżeli będzie to nr stron dokumentację należy dołączyć do oferty na płycie CD lub innym nośniku.

Wymagania dla narzędzia integracji danych (ETL)

Kod wymagania

Opis wymagania Deklaracja spełnianiaTAK / NIE

Opis w dokumentacji

WYM.ETL.1 Niezależność od środowiska, możliwość uruchomienia na następujących systemach operacyjnych:- dla serwera: AIX, Windows, Linux - dla stacji roboczej: Windows.

Page 2: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.ETL.2 System musi zapewniać możliwość budowania połączeń do danych, procesów przetwarzania danych (transformacji danych) oraz ich zapisu w systemach docelowych. Operacje te powinny być możliwe do wykonania wykorzystując interfejs graficzny.

WYM.ETL.3 Możliwość ładowania danych do hurtowni z wykorzystaniem zdefiniowanych procesów ETL. System powinien umożliwiać wycofanie procesu ładowania w przypadku błędu oraz jego powtórzenie.

WYM.ETL.4 Możliwość kolejkowania procesów przetwarzania i ładowania danych, uruchamiania ich w trybie wsadowym lub w trybie interaktywnym (on-line)

WYM.ETL.5 Wkomponowane w rozwiązanie predefiniowane reguły transformacji danych, które można wykorzystać do definiowania procesu przetwarzania danych.

WYM.ETL.6 Dostęp do danych za pomocą zdefiniowanych metadanych umożliwiający pracę użytkownikom nie posiadającym wiedzy na temat struktur źródłowych baz danych.

WYM.ETL.7 System powinien posiadać jedno centralne repozytorium metadanych tak aby dostęp do danych był administrowany z jednego miejsca niezależnie od narzędzia raportującego, którego używa użytkownik końcowy. Repozytorium powinno zawierać: - Opis danych źródłowych. - Opis transformacji danych tj mapowanie danych źródłowych z systemów transakcyjnych do hurtowni danych. - Algorytmy konwersji danych. - Opis obiektów hurtowni i struktur danych.

WYM.ETL.8 Użytkownicy powinni mieć możliwość tworzenia własnych procedur (reguł) transformacji danych za pomocą kreatora oraz pisania własnych programów, które powinny być możliwe do użycia przez pozostałych użytkowników tak jak reguły systemowe.

WYM.ETL.9 Wsparcie obsługi wymiarów wolnozmiennych typu 2.

WYM.ETL.10 Możliwość pracy grupowej. Jednoczesna praca na tym samym projekcie wielu

Page 3: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

użytkowników.

WYM.ETL.11 Możliwość pobierania danych min. z następujących źródeł: - Systemy bazodanowe: Oracle, Microsoft SQL Server, MySQL, PostgreSQL, Access, Microsoft Excel, Pliki w formacie DBF. - Pliki tekstowe płaskie, pliki XML możliwość czytania i przesyłania w różnych reprezentacjach: ASCII, Binary. - Pobieranie danych za pomocą Web Services w archiekturze SOA .

WYM.ETL.12 Dla pobierania danych z systemu Sybase wymagany jest natywny dostęp do danych.

WYM.ETL.13 Zintegrowane środowisko zarządzania metadanymi, w którym zmiana definicji metadanych powoduje jej implementacje we wszystkich procesach w których występowała.

WYM.ETL.14 W zakresie opisu struktury tabel system powinien być zgodny ze standardem Common Warehouse Metamodel.

WYM.ETL.15 System powinien umożliwiać porównanie definicji źródła danych w hurtowni z definicją w systemie źródłowym i wykazać różnice.

WYM.ETL.16 Możliwość wyszukiwania tabel i kolumn na które obiekt metadanych lub reguła przetwarzania miała wpływ w celu analizy skutków i wielkości zmiany.

WYM.ETL.17 Możliwość wykonywania sortowania danych.

WYM.ETL.18 Możliwość agregacji danych min.: sum, count, avg, min, max, count distinct.

WYM.ETL.19 Możliwość łączenia tabel (join, union).

WYM.ETL.20 Możliwość filtrowania danych.

WYM.ETL.21 Możliwość transpozycji zbiorów.

WYM.ETL.22 Możliwość tworzenia wyrażeń i stosowania ich w zapytaniach np. łączenie wielu kolumn, wyliczanie wielkości z kolumny np. płeć z nr PESEL

WYM.ETL.23 Metadane powinny być udokumentowane i zbierane na każdym kroku budowy procesów transformacji danych.

Page 4: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.ETL.24 System powinien umożliwiać identyfikację zmian w systemach z których czerpie dane źródłowe po polach-kluczach oraz pozwalać na ich synchronizację i replikację.

WYM.ETL.25 Narzędzie powinno mieć graficzny interfejs umożliwiający w łatwy sposób przeglądać strukturę metadanych.

WYM.ETL.26 System powinien gromadzić metadane dotyczące wszystkich obiektów w systemie.

WYM.ETL.27 Repozytorium metadanych powinno zawierać: - Opis danych źródłowych. - Opis transformacji danych tj mapowanie danych źródłowych z systemów transakcyjnych do hurtowni danych.

WYM.ETL.28 Moduł metadanych powinien umożliwiać opis obiektów systemu i struktur danych.

WYM.ETL.29 System powinien umożliwiać nadanie uprawnień do danych oraz przechowywać informacje o uprawnieniach w swojej strukturze.

WYM.ETL.30 System powinien udostępniać Web Services lub interfejs API dla innych systemów umożliwiających nadawanie uprawnień.

WYM.ETL.31 System powinien umożliwiać tworzenie referencji dostępu do danych przechowywanych w różnych systemach min. relacyjne bazy danych: Sybase, Oracle, Ms SQL, DB2, pliki Ms Excel, DBF, MDB.

WYM.ETL.32 Procesy przy dostępie do danych powinny odwoływać się do struktury metadanych.

WYM.ETL.33 System powinien wykrywać zmiany struktury danych w systemach źródłowych i informować o tym w postaci raportu.

WYM.ETL.34 System powinien umożliwiać analizę pozwalającą wykryć na jekie procesy ma wpływ określona dana tak by w przypadku jej zmiany łatwo można było wykryć jakie elementy systemu należy zmodyfikować.

WYM.ETL.35 System powinien umożliwiać analizę, z jakich procesów wywodzi się dana umieszczona w raporcie tak, by możliwe było łatwe określenie na podstawie jakich danych źródłowych została wyliczona.

WYM.ETL.36 System posiada narzędzie wspierające proces tworzenia tabel analitycznych, które

Page 5: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

służą do kompleksowego opisania analizowanego obiektu. Narzędzie powinno posiadać gotowy zestaw funkcji, który umożliwia analitykowi definiowanie jakie statystyki chce dodać do tabeli analitycznej. Na podstawie definicji automatycznie generuje algorytmy do wyliczenie zdefiniowanych statystyk.Narzędzie posiada minimum następujące gotowe funkcje:- statystyki podstawowe: średnia, minimum, maksimum w zadanym okresie (np. średnia z ostatnich n-miesięcy)- statystyki zaawansowane: skośność, kurtoza, odchylenie standardowe, mediana w zadanym okresie np. skośność danych w ostatnich n-miesiącach- wyliczenia: czy zdarzenie wystąpiło w zadanym okresie, ile razy wystąpiło w zadanym okresie, aproksymacja dynamiki np. liczba okresów w których z okresu na okres wartość zmiennej analizowanej rosła.

WYM.ETL.37 Narzędzie umożliwia użytkownikom przy tworzeniu tabel wykorzystanie dostępnych w systemie funkcji statystycznych.

WYM.ETL.38 Narzędzie umożliwia użytkownikom przy tworzeniu tabel analitycznych tworzenie własnych funkcji na podstawie języka programowania.

WYM.ETL.39 Narzędzie umożliwia tworzenie nowych tabel i zarządzanie istniejącymi.

WYM.ETL.40 Narzędzie posiada możliwość weryfikacji poprawności transformacji na fragmentach danych.

WYM.ETL.41 Narzędzie pozwala na wyliczanie wielkości w zależności do parametrów czasowych np. ostatni miesiąc, rok.

Wymagania dla narzędzia Data Quality

Kod wymagania Opis wymagania

Deklaracja spełniania

(TAK / NIE )Opis w

dokumentacji

WYM.DQ.1 Narzędzie powinno mieć graficzny interfejs umożliwiający w łatwy sposób projektować procesy czyszczenia danych.

Page 6: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.DQ.2 Narzędzie powinno pozwalać na profilowanie danych w tabeli/zbiorze tabel: określenie wielkości zbioru, typów kolumn, schematu zapisu danych w poszczególnych kolumnach wraz z określeniem % występowania formatu w całości danych, częstość występowania danej wielkości w tabeli, wartości odstających dla kolumn numerycznych.

WYM.DQ.3 Narzędzie powinno umożliwiać budowanie reguł poprawności danych w oparciu o: wartości ze słownika, zakresy poprawnych danych, wyrażenia regularne obrazujące poprawny format zapisu, zależności referencyjne.

WYM.DQ.4 Narzędzie powinno posiadać mechanizmy deduplikacji danych. Powinno umożliwiać tworzenie tak zwanego golden rekord.

WYM.DQ.5 Narzędzie powinno posiadać predefiniowane reguły standaryzacyjne dla danych adresowych

WYM.DQ.6 Narzędzie powinno umożliwić budowanie procesów automatycznego podnoszenia jakości danych. Powinna istnieć możliwość wykorzytsywania tych procesów jako element procesów integracji danych.

WYM.DQ.7 Narzędzie powinno umożliwiać weryfikację nazw miejscowości w oparciu o bazę TERYT.

WYM.DQ.8 Narzędzie powinno mieć zaimplementowaną referencyjną bazę danych miejscowości, ulic i kodów pocztowych na terenie Polski.

WYM.DQ.9 Narzędzie powinno umożliwiać porównanie wartości danej ze słownikiem poprzez określenie odległości edycyjnej.

WYM.DQ.10 Narzędzie powinno umożliwiać parsowanie danych czyli podział tekstu na elementy o stałej strukturze. Np. dla danych adresowych gdzie ulica, nr domu i nr lokalu są zapisane łącznie powinno umożliwiać wydzielenie do odrębnych kolumne ulicy, nr domu, nr lokalu

WYM.DQ.11 Narzędzie powinno umożliwiać tworzenie Web Services w procesie czyszczenia danych to jest dana reguła czyszczenia może być udostępniona dla innych aplikacji w postaci Web Service.

Page 7: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.DQ.12 Narzędzie powinno umożliwiać tworzenie raportów dotyczących procesów podnoszenia jakości danych.

WYM.DQ.13 Narzędzie powinno umożliwiać tworzenie oraz import własnych słowników służących do sprawdzania jakości i spójności danych.

WYM.DQ.14 Narzędzie powinno umożliwiać poprawę jakości danych poprzez uruchamianie procesów czyszczenia danych zarówno w tzw. trybie rzeczywistym jak i wsadowym (batch mode).

WYM.DQ.15 Narzędzie powinno posiadać własną bazę danych do podnoszenia jakości danych, tak zwane Centralne Repozytorium Reguł Czyszcząco-Integrujących.

Wymagania dla narzędzia analiz statystycznych

Kod wymagania Opis

Deklaracja spełniania

(TAK / NIE )Opis w

dokumentacji

WYM.STS.1 Narzędzie powinno być niezależne od środowiska – powinna istnieć możliwość uruchomienia na następujących systemach operacyjnych:dla serwera: Windows 32 i 64 bit, Linux, AIX:- dla stacji roboczej: Windows 8, Windows 10 32 i 64 bit

WYM.STS.2 Narzędzie powinno posiadać graficzny interfejs użytkownika, pozwalający na budowanie poprzez wbudowane kreatory: podłączeń do danych, procesów podstawowego przygotowania danych do analiz (w tym łączenie zbiorów, filtrowanie, agregacja danych, wybór próbki, transpozycja, wyliczanie dodatkowych zmiennych), procesów analitycznych.

WYM.STS.3 Narzędzie powinno posiadać możliwość zapamiętywania sekwencji czynności w formie procesu, który będzie mógł być wykonywany wielokrotnie.

WYM.STS.4 Narzędzie powinno posiadać możliwość kolejkowania procesów i uruchamiania ich w trybie wsadowym lub w trybie interaktywnym (on-line), na żądanie użytkownika.

WYM.STS.5 Narzędzie powinno posiadać możliwość bezpośredniego skorzystania w procesie

Page 8: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

analitycznym z dowolnych danych przechowywanych w hurowni danych CRN bez konieczności ich eksportu ani przetworzenia w innym narzędziu.

WYM.STS.6 Narzędzie powinno posiadać możliwość pobierania danych min. z następujących źródeł: - pliki tekstowe z separatorem oraz o stałej szerokości wiersza, - pliki XML, DBF, MDB- XLS, XLSX (arkusze Excel)

WYM.STS.7 Narzędzie powinno posiadać możliwość sortowania danych z wykorzystaniem polskiej pisowni.

WYM.STS.8 Narzędzie powinno posiadać możliwość agregacji danych funkcjami sum, count, avg, min, max, count distinct.

WYM.STS.9 Narzędzie powinno posiadać możliwość łączenia tabel (typu left, right, inner, outer join, union).

WYM.STS.10 Narzędzie powinno posiadać możliwość filtrowania danych z możliwością wykorzystania złożonych warunków.

WYM.STS.11 Narzędzie powinno posiadać możliwość transpozycji zbiorów.

WYM.STS.12 System powinien umożliwiać budowę i przetwarzanie szerokich tabel (nie widoków) analitycznych (kilka tysięcy kolumn), które będą mogły służyć do przeprowadzania analiz Data Mining.

WYM.STS.13 Narzędzie powinno posiadać możliwość parametryzacji procesu analitycznego. Definicja parametrów (np. zbiór wejściowy, zakres czasowy) powinna być możliwa do wykonania przez użytkownika z poziomu samego narzędzia bez konieczności ingerencji administratorów.

WYM.STS.14 Możliwość tworzenie i udostępnianie raportów w formacie HTML w formie tabelarycznej i wykresów

WYM.STS.15 System powinien posiadać możliwość drukowania wyników analiz oraz eksportu ich do zewnętrznych plików min. PDF, XLS, XLSX, DOC, DOCX,

WYM.STS.16 Narzędzie powinno udostępniać wyniki

Page 9: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

procedur analitycznych w postaci zbiorów danych umożliwiając ich dalsze przetwarzanie w Systemie w tym innych narzędziach .

WYM.STS.17 System powinien udostępniać narzędzia do budowy zaawansowanych analiz w szczególności analiz statystycznych, prognozowania i analiz szeregów czasowych. Narzędzia te muszą posiadać graficzny interfejs użytkownika.

WYM.STS.18 System powinien udostępniać jedno narzędzie (pojedyncza aplikacja) oferujące pełną funkcjonalność w zakresie analiz statystycznych, prognozowania i szeregów czasowych.

WYM.STS.19 Narzędzie analityczne powinno umożliwiać wstępne przetworzenie danych w celu dostosowania struktur do wymagań procesu analitycznego (Łączenie tabel, grupowanie, filtrowanie, wybór próbki, transpozycja zbiorów).

WYM.STS.20 Narzędzie analityczne powinno umożliwiać analizę wariancji, analizę regresji, analizę danych jakościowych, wielowymiarowa analiza danych, analizę skupień.

WYM.STS.21 Możliwość wyboru próby losowej oraz analiza minimalnej wielkości próby.

WYM.STS.22 Możliwość analizy szeregów czasowych w tym modeli regresji, modeli z czynnikami nieobserwowalnymi, ekstrapolacji trendów, wygładzania wykładniczego, ARIMA, regresji dynamicznej.

WYM.STS.23 Możliwość prognozowania wielowymiarowych szeregów czasowych w szczególności metodą wektorowej autoregresji.

WYM.STS.24 Możliwość zmiany częstości szeregu

WYM.STS.25 Możliwość interpolacji brakujących obserwacji.

WYM.STS.26 Możliwość dekompozycji szeregów czasowych z uwzględnieniem sezonowości.

WYM.STS.27 Możliwość automatycznej detekcji wartości odstających.

WYM.STS.28 Możliwość porównania szeregów czasowych.

Page 10: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.STS.29 Możliwość porównania modeli prognostycznych.

WYM.STS.30 Możliwość automatycznego wykrywania zmian obserwacji odstających dla szeregów czasowych.

WYM.STS.31 Możliwość analiz Regresji logistycznej i modeli log-liniowych, uogólnionych modeli liniowych.

WYM.STS.32 Wielowymiarowa analiza danych. Analiza czynnikowa, metoda głównych składowych, korelacja kanoniczna oraz analiza dyskryminacji.

WYM.STS.33 Możliwość estymacji funkcji przeżycia poprzez metody nieparametryczne oraz parametryczne.

WYM.STS.34 Możliwość nieparametrycznej analizy wariancji z metodami estymacji prawdopodobieństw krytycznych dla wielu statystyk nieparametrycznych. Testy Kruskal-Wallisa, Wilcoxona-Manna-Whitney'a oraz Friedmana.

WYM.STS.35 W ramach metod próbkowania możliwość dobierania próby, statystyki opisowe testy t, regresja liniowa i logistyczna, tablice liczebności. Imputacja wielokrotna. Regresja i ocena skłonności do monotonicznych wzorców brakujących wartości. Dostępność co najmniej następujących metod imputacji: - regresji liniowej, - dopasowania średniej, - regresji logistycznej, - losowanie przy założeniu, że dane mają łączny wielowymiarowy rozkład normalny.

WYM.STS.36 Możliwość liczenia wielkości próby i określanie mocy dla: testów t, przedziałów ufności, modeli liniowych, testów proporcji oraz testów rangowych w analizie przeżycia.

WYM.STS.37 Narzędzie powinno umożliwiać analizę rozkładu, w tym przynajmniej na podstawie następujących cech:- statystyki zbiorcze, - histogramy, - wykresy kontrolne średniej, rozstępu, odchylenia standardowego.

Page 11: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.STS.38 Narzędzie powinno posiadać możliwość wyliczania miary zależności dwóch cech na podstawie następujących współczynników: - Współczynnik zbieżności V-Cramera - Współczynnik korelacji Pearsona - Współczynnik korelacji Kendalla (tau-B, tau-C) - Współczynnik korelacji rang Spearmana - Współczynnik Chi-kwadrat - Współczynnik Phi - Współczynnik Gamma - Współczynnik Lambda.

WYM.STS.39 Narzędzie powinno umożliwiać wykonywanie następujących nieparametrycznych testów istotności: - Test niezależności Chi-kwadrat - Test zgodności Kolmogorova-Smirnova - Test zgodności Chi-kwadrat Pearsona - Wilcoxon - Kruskal-Walis - Siegel-Tukey - Cramer-von-Misses - Kuiper.

WYM.STS.40 Narzędzie powinno umożliwiać analizę wariancji i kowariancji w tym: - Testy Studenta - Jednoczynnikowa ANOVA - Wieloczynnikowa ANOVA - Interakcje między czynnikami - Analiza kowariancji.

WYM.STS.41 Narzędzie w ramach przeprowadzania regresji liniowej powinno udostępniać następujące funkcjonalności: - Metody doboru zmiennych do modelu (stepwise, forward, backward, R-square, Adjusted R-Square, Cp-Mallow, Minimum/Maximum R-square improvement) - Testy istotności modelu i poszczególnych zmiennych (test F, test T) - Wykrywanie obserwacji nietypowych (R-student residuals, Leverage, Cook’s D,

Page 12: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

DFFITS, DFBETA, COVRATIO) - Testy założeń modelu (test Kolmogorova-Smirnova, Jarque-Bera, test Durbina-Watsona, test Breuscha-Pagana, test White’a, test Breuscha-Godfreya) - Testowanie hipotez złożonych - Testy stabilności parametrów (test Chowa) - Testy współliniowości zmiennych (Variance Inflation Factor, Condition Index, Proportion of Variance) - Testy poprawności formy funkcyjnej modelu (test RESET Ramsey’a, test Boxa-Coxa).

WYM.STS.42 Narzędzie powinno umożliwiać przeprowadzanie innych metod regresji, w tym: - Potęgowa - Wielomianowa - Lokalna - Nieliniowa.

WYM.STS.43 Narzędzie powinno umożliwiać przeprowadzanie analizy za pomocą: - uogólnionych modeli liniowych - uogólnionych modeli nieliniowych - uogólnionych modeli addytywnych - modeli mieszanych liniowych.

WYM.STS.44 Narzędzie w ramach przeprowadzania analizy dyskryminacji powinno udostępniać następujące funkcjonalności i metody: - Liniowe i kwadratowe funkcje dyskryminacji - Metody kanoniczne - Metody krokowe.

WYM.STS.45 Narzędzie w ramach przeprowadzania analizy historii zdarzeń powinno udostępniać następujące metody: - Metoda Kaplana-Meiera - Metoda tablic przeżycia - Model Coxa (proportional hazard) - Metody parametryczne.

WYM.STS.46 Narzędzie powinno umożliwiać przeprowadzanie następujących metod

Page 13: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

symulacyjnych: - Metoda Monte Carlo - Bootstrapping.

WYM.STS.47 Narzędzie powinno umożliwiać analizę i prognozowanie szeregów czasowych za pomocą następujących modeli: - Modele ARIMA - Modele wygładzania wykładniczego - Modele Holta-Wintersa - Krokowa metoda autoregresyjna - Modele VARMA/VECM - Modele ARCH/GARCH.

WYM.STS.48 Narzędzie powinno umożliwiać zagnieżdżanie procedur statystycznych w ramach programów w języku 4-tej generacji.

WYM.STS.49 Narzędzie powinno umożliwiać losowe próbkowanie danych następującymi metodami: - proste losowe, - warstwowe, - ważone, - segmentowe, - systematyczne.

WYM.STS.50 Narzędzie powinno umożliwiać podział (losowy) zbioru na treningowy, walidacyjny i testowy.

WYM.STS.51 Narzędzie powinno umożliwiać nadawanie ról zmiennym tj. zmienna wejściowa, zmienna ignorowana, zmienna celu (target).

WYM.STS.52 Narzędzie powinno umożliwiać nadawanie zmiennym następujących typów: binarny, interwałowy, nominalny, porządkowy.

WYM.STS.53 Narzędzie powinno umożliwiać definiowanie macierzy zysków i strat.

WYM.STS.54 Narzędzie powinno umożliwiać analizę rozkładów zmiennych. Poprzez analizę rozkładów rozumie się sporządzanie histogramów i obliczanie parametrów rozkładów, sporządzanie wykresów dla rozkładów warunkowych. Dodatkowo wykresy sporządzane przez narzędzie

Page 14: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

powinny być interaktywne.

WYM.STS.55 Narzędzie powinno umożliwiać selekcję zmiennych istotnych poprzez eliminację zmiennych ze zbyt dużą ilością braków danych oraz zmiennych ze zbyt dużą liczbą poziomów.

WYM.STS.56 Narzędzie powinno umożliwiać analizę asocjacji.

WYM.STS.57 Narzędzie powinno umożliwiać analizę sekwencji.

WYM.STS.58 Narzędzie powinno umożliwiać analizę skupień metodami hierarchicznymi i optymalizacyjnymi (k-średnich). Narzędzie powinno również umożliwiać automatyczny dobór optymalnej liczby klastrów.

WYM.STS.59 Narzędzie powinno umożliwiać budowę modeli z wykorzystaniem sieci Kohonena.

WYM.STS.60 Narzędzie powinno umożliwiać filtrowanie wartości nietypowych i odstających na podstawie odchyleń standardowych od średniej oraz filtrowanie wartości rzadkich dla zmiennych jakościowych. Filtry powinny być modyfikowalne przez użytkownika.

WYM.STS.61 Narzędzie powinno mieć możliwość uzupełniania braków danych zgodnie z rozkładem zmiennej oraz przy pomocy drzewa decyzyjnego.

WYM.STS.62 Narzędzie powinno umożliwiać analizę składowych głównych.

WYM.STS.63 Narzędzie powinno umożliwiać budowę modeli z użyciem drzew decyzyjnych. W ramach budowy drzew decyzyjnych powinien być możliwy wybór kryterium podziału: - entropia, - współczynnik przyrostu informacji (gain ratio), - redukcja wariancji, - współczynnik Gini’ego.

WYM.STS.64 Narzędzie powinno umożliwiać budowę drzew decyzyjnych metodami: - CHAID, - CART, - C4.5.

WYM.STS.65 Narzędzie powinno poza automatyczną budową drzewa umożliwiać również trening

Page 15: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

interaktywny drzewa decyzyjnego.

WYM.STS.66 Narzędzie powinno mieć funkcję ograniczania wielkości drzewa decyzyjnego.

WYM.STS.67 Narzędzie powinno umożliwiać budowę modeli z wykorzystaniem sieci neuronowych z automatyczną standaryzacją danych wejściowych i automatycznym doborem punktów startowych.

WYM.STS.68 Sieci neuronowe powinny być konfigurowalne przez użytkownika, który będzie mógł dokonywać wyboru spośród różnych technik trenowania i optymalizacji sieci.

WYM.STS.69 Architektura sieci neuronowej powinna być elastyczna, tj. powinien być możliwy dobór ilości perceptronów i warstw ukrytych.

WYM.STS.70 Narzędzie powinno posiadać automatyczne metody poszukiwania najlepszej architektury sieci.

WYM.STS.71 Narzędzie powinno umożliwiać budowę modeli z wykorzystaniem metody k-najbliższych sąsiadów.

WYM.STS.72 Narzędzie powinno umożliwiać tworzenie modeli dwu- i wielostopniowych wraz z sekwencyjnym lub równoległym modelowaniem zarówno zmiennych jakościowych jak i ilościowych.

WYM.STS.73 Narzędzie powinno umożliwiać budowanie modeli łączonych z wykorzystaniem technik: - średnia, - proste głosowanie, - maksimum, - bagging, - boosting.

WYM.STS.74 Narzędzie powinno umożliwiać tworzenie następujących wykresów oraz statystyk do porównania i oceny modeli: - Lift (cumulative, non-cumulative), - Response (cumulative, non-cumulative), - Captured Response (cumulative, non-cumulative), - ROC, - Gini / Accuracy Ratio,

Page 16: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

- Kolmogorov-Smirnov, - Average squared error, - Akaike’s Information Criterion, - Schwarz’s Bayesian Criterion, - Validation Error, - Validation Misclassification, - Profit/Loss, - Confusion matrix.

WYM.STS.75 Narzędzie powinno umożliwiać profilowanie segmentów za pomocą następujących charakterystyk: - wykresy rozproszenia, - histogramy, - wykresy wielowymiarowe, - wykresy kołowe, - interaktywny interfejs.

WYM.STS.76 Narzędzie powinno posiadać możliwość pobierania danych min. z następujących źródeł: - Systemy bazodanowe: Sybase, DB2, Oracle, Microsoft SQL Server, MySQL,Sybase - Microsoft Access, Excel, - Pliki w formacie DBF, - Pliki tekstowe, o stałej szerokości lub o wartościach rozdzielonych separatorem.

Wymagania dla systemu raportowego WWW

Kod wymagania Opis wymagania

Deklaracja Spełniania (TAK / NIE )

Opis w dokumenatacji

WYM.RAP.1 Możliwość tworzenia i udostępniania raportów wykorzystując interfejs WWW (przeglądarka WWW).

WYM.RAP.2 Możliwość przesyłania danych interfejsami http i Https. Dla protokołu https musi umożliwiać wykorzystanie SSL.

Page 17: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

WYM.RAP.3 System musi integrować się ze środowiskiem Active Directory LDAP w celu zapewniania logowania się użytkowników za pomocą identyfikatora i hasła z domeny, w której pracują.

WYM.RAP.4 System musi umożliwiać definiowanie raportów na podstawie struktur relacyjnych baz danych.

WYM.RAP.5 System musi umożliwiać definiowanie raportów ze struktur relacyjnych jak i kostek wielowymiarowych OLAP.

WYM.RAP.6 System musi umożliwiać definiowanie raportów z wykorzystaniem zapytań w języku SQL dla struktur relacyjnych oraz specjalnego języka (np. MDX) dla struktur wielowymiarowych OLAP.

WYM.RAP.7 System musi umożliwiać tworzenie biznesowej warstwy prezentacji danych to jest: uprawniony użytkownik musi mieć możliwość opisania struktury fizycznej danych w sposób zrozumiały dla właściciela biznesowego tj. nazwania kolumny w tabeli lub wielkości wyliczanej w sposób zrozumiały np. kolumnę wart nazywa „wartość świadczenia” wyliczenie ilość * cena może nazwać wartość brutto.

WYM.RAP.8 System musi umożliwiać pracę osób tworzących raporty na warstwie biznesowej tj. użytkownik tworzy raport na podstawie zdefiniowanej przez administratora biznesowej warstwy prezentacji.

WYM.RAP.9 Możliwość tworzenia raportów statycznych i dynamicznych. Jako raporty statyczne rozumiane są raporty, które tworzone są przez uprawnionego użytkownika i udostępniane innym do wglądu. System umożliwiać okresowe odświeżanie takiego raportu oraz przechowywanie i udostępnianie poprzednich wersji. Jako raporty dynamiczne zamawiający rozumie raporty, które tworzą się w momencie uruchomienia przez użytkownika na podstawie aktualnych danych.

WYM.RAP.10 W ramach udostępnianych raportów użytkownik powinien mieć możliwość filtrowania danych i drążenia danych oraz zmiany wyglądu np. przeniesienie informacji prezentowanych w wierszach do kolumn. Dodać własne wielkości wyliczane na

Page 18: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

podstawie prezentowanych danych oraz budować na podstawie prezentowanych danych wykresy.

WYM.RAP.11 System musi udostępniać elastyczny mechanizm nadawania uprawnień dla użytkowników i grup użytkowników z dokładnością do danych, raportów, kostek.

WYM.RAP.12 System powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane w codziennej pracy przez zamawiającego) w taki sposób aby elementy analiz mogły być wykorzystane do dalszej obróbki w tych programach. Niewystarczająca jest funkcja eksportu danych do Excel. System powinien umożliwiać wstawienie analizy np. tabeli jako komponentu systemu do analiz i umożliwić odświeżenie danych za pomocą mechanizmów zdefiniowanych w narzędziu analitycznym.

WYM.RAP.13 Możliwość udostępniania w ramach systemu raportów innym użytkownikom za pomocą repozytoriów ogólnodostępnych. Funkcja ma być zintegrowana z warstwą prezentacji systemu ZI-CRN

WYM.RAP.14 Możliwość zapisania raportu „dla siebie” w obszarze prywatnego repozytorium raportów.

WYM.RAP.15 Wyszukiwanie raportów po nazwie, dacie utworzenia, słowach kluczowych itp.

WYM.RAP.16 Możliwość wykonywania operacji edycji, kopiowania i przenoszenie zdefiniowanych raportów.

WYM.RAP.17 Możliwość sparametryzowania raportu w taki sposób aby dane odświeżały się automatycznie przy otwarciu bądź na żądanie użytkownika.

WYM.RAP.18 Możliwość tworzenia raportów sparametryzowanych tzn. użytkownik przy otwarciu raportu musi zdefiniować wartości parametrów i dopiero wówczas raport jest prezentowany.

WYM.RAP.19 Przegląd wcześniej zapisanych raportów zapisanych w repozytorium raportów.

WYM.RAP.20 Możliwość drukowania raportów, eksportu do zewnętrznych plików min. PDF, XLS, XLSX,

Page 19: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

DOC, DOCX

WYM.RAP.21 Możliwość filtrowania danych w raportach wg metod dopowiadających typowi danych po których nastąpi filtrowanie.

WYM.RAP.22 Możliwość drążenia i rozwijania tabel i wykresów w strukturach OLAP

WYM.RAP.23 Możliwość sortowania danych w raporcie wg. ustalanej na bieżąco kolejności sortowania, w tym po włączeniu filtra.

WYM.RAP.24 Dodawanie i usuwanie podsumowań na raportach oraz innych funkcji wykonujących operacje na danych prezentowanych w raporcie np. średnia, odchylenie standardowe itp.

WYM.RAP.25 Możliwość tworzenia raportów za pomocą kreatora, który prowadzi użytkownika przez proces tworzenia raportu.

WYM.RAP.26 Możliwość korzystania z predefiniowanych wzorców (szablonów) podczas tworzenia raportu.

WYM.RAP.27 Możliwość tworzenia zapytań do bazy danych za pomocą kreatora, który pozwala przetwarzać dane bez znajomości języka SQL pozwalający na tworzenie kolumn wyliczanych, filtrowanie oraz sortowanie danych z możliwością przeglądania wygenerowanego kodu SQL.

WYM.RAP.28 Możliwość eksploracji danych zgromadzonych w strukturach OLAP m.in. poprzez wykorzystanie mechanizmów drążenia, rozwijania i obracania.

WYM.RAP.29 Możliwość przesyłania zapytań do struktur wielowymiarowych OLAP np. w języku MDX.

WYM.RAP.30 Możliwość przesyłania informacji o raporcie na konto poczty elektronicznej i portalu intranetowego wiadomość powinna zawierać link odsyłający bezpośrednio do raportu.

WYM.RAP.31 Możliwość sortowania z wykorzystaniem polskiej pisowni.

WYM.RAP.32 Narzędzie umożliwi publikację wyników systemu raportowego - przez publikację rozumie się utworzenie wyniku/raportu, automatyczne umieszczenie go w odpowiednich strukturach Portlau Wiedzy.

Page 20: przetargi.pib-nio.pl  · Web viewSystem powinien zapewniać integrację z pakietem MS Office w szczególności z programem MS Excel, Power Point i MS Word (Programy wykorzystywane

…………………………………………………….

data i podpis przedstawiciela Wykonawcy