BIG DATA Proiect (1)

Embed Size (px)

Citation preview

  • 7/25/2019 BIG DATA Proiect (1)

    1/3

    BIG DATABIG DATA permite organizatiilor un amestec de date structurate, semi-structuratesi nestructurate n cutare de informa ii i perspective de afaceri valoros.

    BIG DATA sunt folosite pentru a descoperi modele ascunse, corela ii necunoscute,tendin ele pie ei, preferin ele clien ilor i alte informa ii utile afaceri. Constatarile analitice pot duce la comercializare mai eficiente, noi oportunit i de venituri,servicii mai une clien ilor, eficien opera ional munt it, avanta!e competitive peste organiza ii rivale i alte eneficii de afaceri.

    "copul principal al analizei BIG DATA este de a a!uta companiile s ia decizii deusiness mai informate, permi #nd oamenilor de stiinta de date, i al i profesioni ti

    de analiz de a analiza volume mari de date de tranzac ie, precum i alte forme de date care pot fi nee$ploatate de usiness intelligence %BI&. Asta ar putea include

    !urnale de server 'e i date clic(stream Internet, con inut social media i rapoarte de activitate, re ele sociale, te$tul de la e-mailuri de la clien i i rspunsuri sonda!, de telefonie moil nregistrri ale detaliilor apelurilor i a datelor de ma ini capturate de senzori conecta i la internetul oiectelor. )nii oameni asociaza BIGDATA cu date semi-structurate i nestructurate de acest gen, dar firme deconsultan , precum Gartner Inc. i *orrester +esearc Inc. lua n considerare, de

    asemenea, tranzac iile i alte date structurate a fi componente valide in aplicatiile BIG DATA.

    BIG DATA pot fi analizate cu instrumente softare utilizate n mod oi nuit, caparte a analizei a unei discipline avansate, cum ar fi analiza predictiva, datamining, analiz de te$t i analiza statistic. ainstream BI instrumente de softarei date de vizualizare poate !uca, de asemenea, un rol n procesul de analiz. Dar

    datele semi-structurate i nestructurate ar putea s nu se potriveasc ine ndepozitele de date tradi ionale, azate pe aze de date rela ionale. ai mult dec#t

    at#t, depozite de date nu pot fi n msur s se ocupe de cererile de prelucraregenerate de seturi de date mari care treuie actualizate frecvent sau ciar continuu -de e$emplu, date n timp real cu privire la performan a de aplica ii moile sau de conducte de petrol i gaze.

  • 7/25/2019 BIG DATA Proiect (1)

    2/3

    Ca urmare, multe organiza ii care doresc s colecteze, prelucreaze i sa analizeaze BIG DATA au apelat la o clas nou de tenologii care include /adoop i alteinstrumente , cum ar fi, ap+educe, "par(, /ive, precum i aze de date 0o"12.Aceste tenologii formeaza nucleul unui cadru softare open source, care sus ine

    prelucrarea de seturi mari si diverse date peste sisteme cluster.

    3n unele cazuri, grupurile /adoop i sisteme de 0o"12 sunt utilizate ca tampoanede aterizare i zone de a teptare pentru date nainte de a se ncarc ntr-un depozit de date pentru analiza, de multe ori ntr-o form cuprinsa c este mai favorail

    pentru structurile rela ionale. 3n astfel de aritecturi, suseturi de date pot fi apoifiltrate de analiza n depozitele de date i aze de date analitice, sau poate fianalizat direct n /adoop folosind instrumente de interogare lot, softare de

    procesare flu$ i "12 pe tenologii /adoop care se e$ecut interactiv, interogrile

    ad-oc scris n "12.

    Capcanele poten iale care pot impiedica unele organiza ii pe marile ini iative de analiz de date includ lipsa de competen e de analiz interne i costul ridicat al ncirierii de profesioni ti cu e$perien de analiz. Cantitatea de informa ii care este implicata n mod oi nuit, iar varietatea ei, poate provoca, de asemenea dureride cap de gestionare a datelor, inclusiv calitatea datelor i proleme de consisten . 3n plus, integrarea sistemelor /adoop i depozite de date poate fi o provocare, de i

    diferiti v#nztori ofer acum conectori softare ntre /adoop i aze de daterelationale, precum i alte date instrumente de integrare cu capacit i mari de date.

    Big Data are 4 caracteristici principale.

    5. 6rima caracteristic este 782))2

    Da, volumul de date este in crestere. 9$pertii prezic ca volumul de date din lume,

    va creste la :; de :>. Acelasi fenomen afecteaza fiecare companie

    - datele sunt in cre tere la aceeasi rata e$ponen iala. Dar nu este numai volumul de

    date care este in crestere, numrul de surse de date este de asemenea in crestere.:. A doua caracteristica este 7IT9

  • 7/25/2019 BIG DATA Proiect (1)

    3/3

    sau la secund. i lumea este, de asemenea, din ce n ce mai instrumentat i

    interconectat. 7olumul de date de streaming de pe aceste instrumente este

    e$ponen ial mai mare dec#t a fost ciar cu : ani n urm.

    @. A treia caracteristica este 7A+I9TAT9A datelor.7arietatea datelor prezint o provocare la fel de dificil. Cre terea surselor de date

    a alimentat i cre terea tipurilor de date. De fapt, > din datele generate n lume

    sunt date nestructurate. Cu toate acestea, metodele tradi ionale de analiz se aplic

    numai la informa ii structurate.

    4. A patra caracteristica este 79+IDICITAT9A datelor

    Cum se poate actiona pe aza acestor informatii, dac nu sunt de incredere.

    "tailirea increderii in datele pe care le folose te orice companie reprezint oprovocare uria odat cu cresterea surselor i tipurilor de date.

    )n alt motiv pentru care Big Data este un suiect fierinte astazi este noua

    tenologie care permite unei organiza ii s eneficieze de resursele interne de date.

    Ceea ce este nou, este tenologia pentru a procesa si analiza aceste date la volumul

    si viteza dorita. "copul tenologiei Big Data este sa analizeze toate datele

    disponiile, eficient din punct de vedere costuri.

    Datele pot veni de la sistemele noastre tradi ionale - sisteme de facturare, sisteme9+6 si sisteme C+. De asemenea pot veni de la ma ini - de la eticetele +*ID,

    senzori si comutatoare de re ea. i datele vin de la oameni - site-ul e, social

    media, etc. Acest lucru face foarte dificil analiza datelor sociale - e$tragerea

    ideilor de con inut n mare parte su form de te$t ntr-un timp foarte scurt.