Primjeri skladišta podataka i njegove računalne definicije

Šta ako organizacije obrade sve svoje podatke za podršku odlučivanju? Što bi se dogodilo da koriste specijalizirani softver koji služi za prezentaciju informacija i njihovu analizu? Mi ćemo dati neke Primjeri skladišta podataka da odgovorim na ova pitanja.

PRIMJERI-SKLADIŠTE PODATAKA

Primjeri skladišta podataka

Prije svega, važno je razlikovati dva pojma koja nas zbog svoje kratice mogu lako zbuniti, a od početka je namjera da korisnik zna što može očekivati ​​i da zna neke osnovne koncepte koje koristi suočiti se. Ovdje ćemo pokazati beskonačne primjere koji služe tako da pojedinac ima alate za razlikovanje ovih elemenata.

Definicija

S obzirom na razliku između dva pojma, nastavit ćemo ih formalno definirati, budući da je to proces koji izdvaja, transformira, konsolidira i integrira podatke organizacije, interne i eksterne, kako bi bili dostupni i korisni pri donošenju odluka -izrada.

Na isti način, skladište podataka može se definirati i kao baza s informacijama o elektroničkom datotečnom sistemu, koja pohranjuje podatke potrebne za analizu informacija i donošenje odluka. Njegova razlika je u tome što je poslovno orijentiran, integriran, mijenja se u vremenu i nije promjenjiv.

U osnovi, skladištenje podataka (DWH) je proces, a skladište podataka (DW) je baza podataka.

Karakteristike

Skladište podataka karakterizira nekoliko aspekata koji pružaju potrebne alate za njegovu optimalnu upotrebu, usklađujući se s programiranim smjernicama koje generiraju alate za njegovu upotrebu na najbolji mogući način. Detaljno ćemo opisati skladište podataka:

Poslovno orijentisan

Samo relevantni podaci unose se u skladište podataka za analizu i donošenje odluka. Odnosno, ne uzimaju se u obzir podaci koji nemaju analitičku vrijednost, poput adresa sobe, poštanskih brojeva, adresa e -pošte, između ostalog. Ali oni su od promjenjivog interesa kao što su tip klijenta, geografska lokacija, starost itd.

Upravlja se entitetima na visokom nivou, poput klijenata, proizvoda, artikala, područja i drugih. Podaci se pohranjuju na višedimenzionalan način, odnosno u tablicama s dimenzijama.

Integrirano

Svi podaci iz heterogenih izvora objedinjeni su kako bi se zajamčila njihova kvaliteta i čistoća. Glavni izvori podataka su:

Ovisno o vrsti korisnika.

    • Operativno: Svakodnevno proizvodi veliku količinu podataka, ali samo po sebi nije od velike važnosti za potrebnu analizu. Na primjer, prodaja proizvoda.
    • Srednje: Generira podatke sa implikacijama u kratkom i srednjoročnom periodu, na osnovu operativnih podataka. Dobar primjer ovog koncepta je stvaranje zaliha.
    • Upravljački: Koristi podatke koji su rezultat procesa integracije i transformacije. Zauzvrat, generira nove informacije. U osnovi se odnosi na korisnika skladišta podataka.

Prema području ili odjelu organizacije

    • Područja: Svako od njih ima jasno definirane odgovornosti. Oni proizvode vlastite podatke koji se dijele s drugim područjima.
    • Pododjeljci: Obično su geografske. Oni pružaju podatke o lokaciji koji se moraju uključiti zajedno s ostalim.

Prema izvoru

    • Interno: Oni stvaraju vlastite podatke koji dolaze iz svakodnevnih aktivnosti kompanije.
    • Vanjski: Dopunjuju interne podatke, na primjer popise i statistiku.

Varijanta u vremenu

Omogućava pristup različitim verzijama iste situacije, budući da se trenutni podaci pohranjuju zajedno s povijesnim podacima, u primjerima skladišta podataka.

skladište podataka

Nije isparljivo

Jamči stabilnost informacija, budući da se jednom uneseni podaci ne mijenjaju. Odnosno, podacima se manipulira samo kada se unesu i kada se s njima konsultuje.

Ukratko, glavne kvalitete skladišta podataka su:

Kvalitete

Rukuje podacima u količini, posljedica akumulacije povijesnih, trenutnih i zbirnih podataka, iz različitih izvora.

Postavlja čitavu količinu podataka u jednu centraliziranu bazu podataka. Strukturirajte podatke na višedimenzionalan način.

Prednosti

Zbog svojih karakteristika i kvaliteta, skladište podataka predstavlja sljedeće prednosti:

  • Smanjuje minimalno vrijeme potrebno za prikupljanje svih relevantnih podataka o određenoj temi.
  • Pruža alate za analizu.
  • Mnogi izvještaji i analize su korisnički definirani.
  • Omogućava vam direktan pristup, analizu i praćenje pokazatelja organizacije.
  • Pomaže u identifikaciji faktora koji utiču na poslovanje kompanije.
  • Omogućava napredovanje i određivanje budućeg ponašanja institucije.
  • Korisnici mogu brzo i jednostavno tražiti podatke.

Ukratko, skladište podataka pomaže organizaciji da odgovori na bitna pitanja za donošenje odluka. Time se postižu konkurentske prednosti koje optimiziraju njihov položaj na tržištu na kojem posluju. Neka od ovih pitanja su:

  • Kakav je profil klijenata?
  • Kakvo je njihovo ponašanje?
  • Kolika je isplativost poslovanja?
  • Koji je rizik za organizaciju?
  • Koje usluge i proizvode koristite i kako ih možete povećati?

PRIMJERI-SKLADIŠTE PODATAKA

Područje primjene

Skladište podataka može se prilagoditi bilo kojoj organizaciji, bez obzira na veličinu i složenost. To je posljedica agende bilo koje institucije, kompanije ili organizacije pri donošenju odgovarajućih odluka u vezi s podacima koje proizvodi.

Rizici primjene

To zahtijeva velika ulaganja od strane organizacije. Prednosti njegove implementacije ne vide se kratkoročno, već srednjoročno i dugoročno.

Manipulacija podacima prijeti manipulacijom osjetljivim podacima.

Aspekti koje treba uzeti u obzir

Kao što je spomenuto na početku, postoji nekoliko aspekata koje morate uzeti u obzir pri primjeni ovih elemenata za korištenje poslužitelja. Među njima možemo spomenuti sljedeće:

Troškovi prijave

Skladište podataka snosi troškove izgradnje, rada i podrške. Troškovi izgradnje podrazumijevaju troškove ljudskih resursa, vremena i tehnologije, dok troškovi rada i održavanja uključuju troškove evolucije, rasta i one nastale promjenama u podrijetlu podataka.

Uticaj na ljude

Primjena skladišta podataka uvijek generira očekivanja kod korisnika koji će nužno morati steći nove vještine. Uspjeh ove vrste podataka ovisi o aktivnoj upotrebi i povratnim informacijama korisnika.

Uticaj na poslovanje i procese donošenja odluka

Primjenom skladišta podataka mogu se otkriti određeni nedostaci u poslovnim procesima, ali se istovremeno povećava povjerenje u odluke donesene na osnovu rezultata do kojih se došlo.

Arhitektura

PRIMJERI-SKLADIŠTE PODATAKA

Opća arhitektura primjera skladišta podataka prikazana je na gornjoj slici. Kao što se može vidjeti, ovaj sistem uključuje niz interakcija između njegovih komponenti. U tom smislu i kao sažetak, njegovo se djelovanje može opisati na sljedeći način:

  • Podaci se uzimaju iz različitih izvora, poput internetskih usluga, datoteka i drugih baza podataka, unutrašnjih i vanjskih.
  • Kada se podaci izdvoje, oni se integriraju, transformiraju i čiste, da bi se kasnije učitali u skladište podataka.
  • Kako bi se generirale taktičke i strateške informacije, izvještaji i analize prikupljaju se učitavanjem podataka.
  • Konačno, korisnici se mogu konsultirati i istražiti generirane izvještaje i analize.

elementos

Sada ćemo opisati neke od elemenata koje je moguće ocijeniti u skladištu podataka koje treba uzeti u obzir.

Izvori skladišta podataka

Općenito, oni su rezultat svakodnevnih aktivnosti kompanije, u tom slučaju se nazivaju interni izvori. Kada se podaci preuzimaju, na primjer, s web servera, oni se smatraju vanjskim izvorima. Oni se međusobno razlikuju jer ovise o podrijetlu, formatu, funkciji itd.

Ekstrakcija, transformacija i utovar

PRIMJERI-SKLADIŠTE PODATAKA

Poznat kao ETL, to je proces koji uključuje sve zadatke koji se izvršavaju od trenutka dobijanja podataka do njihovog učitavanja u skladište podataka. To su: ekstrakcija, manipulacija, kontrola, integracija, čišćenje podataka, učitavanje i ažuriranje.

Vađenje

Uključuje tehnike usmjerene na prikupljanje, iz različitih izvora, samo relevantnih podataka i njihovo čuvanje u internoj pohrani. Ova vrsta pohrane omogućuje manipulaciju podacima bez uplitanja ili mijenjanja izvora ili skladišta podataka s više podataka, stvarajući sloj ekstrakcije između čitanja i učitavanja, pohranjivanje i upravljanje metapodacima generiranim u procesu te olakšavanje integracije.

Ekstrakcija se zasniva na potrebama korisnika i zahtjevima definiranim za rješenje.

Transformacija

Ovo su tehnike zadužene za usklađivanje različitih formata, kao i za filtriranje i klasifikaciju podataka i povezanih izvora.

Ova funkcija je odgovorna za primjenu svih odgovarajućih naredbi u odnosu na podatke kako bi ih promovirala na snažan i razuman način koji je kompatibilan i konzistentan sa skladištem podataka. Osim toga, odgovoran je za čistoću i kvalitetu podataka.

transformacija vlakana

Carga

Što se tiče tehnika početnog učitavanja podataka i periodičnog ažuriranja skladišta podataka.

  • Početno učitavanje odnosi se na prvo učitavanje podataka koje skladište podataka prima. Općenito, oduzima mnogo vremena zbog velikog broja zapisa koji pripadaju dugim vremenskim periodima.
  • Periodično ažuriranje odnosi se na umetanje malih količina podataka. Vaš cilj je dodati uzorcima skladišta podataka samo one podatke koji su generirani od posljednjeg ažuriranja. Ovisi o potrebama i zahtjevima korisnika.

Ukratko, kroz proces učitavanja podataka, jamči se održavanje skladišta podataka.

Ukratko, može se reći da se proces ETL -a odvija na sljedeći način:

  • Podaci, nakon što se izdvoje iz relevantnih izvora, pohranjuju se u internu pohranu.
  • Dok se podaci čuvaju u internoj memoriji, oni su integrirani i transformirani.
  • Kada se podaci očiste, nakon prethodnog koraka, oni se prosljeđuju u skladište podataka.

Izvještaji

Izvještaji su grafički alati koji omogućuju korisniku da dobije detaljne izvještaje o informacijama o vašoj kompaniji. Način interakcije s ovim izvještajima vrlo je jednostavan za korisnika, budući da su to jednostavna uputstva. U osnovi, morate odabrati opcije iz izbornika, pozivajući se na uslove i specifikacije prikazane teme.

OLAP

To je najmoćnija komponenta skladišta podataka jer sadrži specijalizirani višedimenzionalni mehanizam upita sistema.

Omogućava analizu organizacije iz različitih povijesnih scenarija. Projektira svoje ponašanje i evoluciju iz višedimenzionalne vizije, odnosno kombiniranjem različitih perspektiva, tema od interesa ili dimenzija. To omogućuje zaključivanje trendova otkrivanjem odnosa između perspektiva koje bi na prvi pogled bilo teško pronaći.

Data Mining

PRIMJERI-SKLADIŠTE PODATAKA

To je prvenstveno statističko oruđe pomoću kojeg se mogu napraviti predviđanja. Riječ je o zaključivanju ponašanja, a da ne postoje unaprijed utvrđena pravila. On generira izvještaje u obliku tablica i grafikona, između ostalog, koji promiču donošenje odluka na proaktivan način. Radi na temelju informacija koje su već u potpunosti obrađene.

Razlika između OLAP -a i Data Mining -a

Nakon što se razmotre glavni aspekti OLAP -a i Data Minig -a, može se uspostaviti osnovna razlika između njih.

  • Pomoću OLAP-a tumači se trenutna situacija kompanije, dajući brze odgovore koji olakšavaju donošenje odluka.
  • Data Minig predviđa situacije, zasnovane na proučavanju skrivenog znanja koje izaziva određene vrste ponašanja.

Shodno tome, oba sistema se bave rješavanjem različitih vrsta analitičkih situacija.

Data Minig i njegov odnos sa skladištem podataka

Data Minig sistem je tehnologija podrške za krajnjeg korisnika, čiji je cilj izvući korisne informacije iz podataka sadržanih u bazi podataka kompanija. Drugim riječima, podrijetlo informacija koje koriste algoritmi Data Minig obično su povijesni podaci sadržani u skladištu podataka.

Mora postojati integracija između Data Minig tehnika i procesa uključenih u skladište podataka. Drugim riječima, da bi se izvršila analiza poslovanja, mora postojati dogovor između Data Minig -a, skladišta podataka i OLAP servera.

Svaki put kada Data Warehouse daje nove rezultate, kompanija može ponovo primijeniti Data Minig radi optimizacije donošenja odluka.

Ukratko, Data Minig i skladište podataka potpuno su kompatibilni alati. Skladište podataka pruža memoriju i Data Minig inteligenciju.

Tradicionalne baze podataka protiv skladišta podataka

Analiza do sada izloženih aspekata dovodi nas do razumijevanja da se skladište podataka razlikuje od baza podataka koje podržavaju dnevne transakcije organizacija. Evo osnovnih razlika

  • U tradicionalnim bazama podataka informacije su organizirane tako da se mogu lako dohvatiti i ažurirati. Skladište podataka je organizirano i orijentirano na krajnjeg korisnika, koji se može samo raspitati.
  • Transakcijske baze podataka brinu se o svakodnevnoj obradi podataka. Skladište podataka radi s povijesnim podacima, odnosno odgovara dugim vremenskim razdobljima.
  • Tradicionalnim bazama podataka pristupa se nekoliko puta tokom radnog dana. U skladištu podataka očitavanja i upiti su minimalni, jer mu se pristupa sporadično.
  • Količina podataka kojima skladište podataka upravlja je mnogo veća od one kojom se upravlja u tradicionalnim bazama podataka.
  • Struktura transakcijskih baza je stabilna. Struktura skladišta podataka varira ovisno o vlastitoj evoluciji i upotrebi.

Zatim ćemo ustanoviti neke Primjeri skladišta podataka.

Primjeri skladišta podataka

Kompanija u cijeloj zemlji, posvećena prodaji sredstava za čišćenje na veliko i malo, koja se po obimu prodaje smatra i srednjom, ima za glavni cilj maksimiziranje profita. Slično, da biste dobili više kupaca, želite se proširiti na novi tržišni nivo, a kasnije i proširiti svoju liniju proizvoda. Jedna od njegovih glavnih politika je kontinuirano poboljšavanje radi boljeg položaja u odnosu na konkurente uzoraka skladišta podataka.

PRIMJERI-SKLADIŠTE PODATAKA

Primjena skladišta podataka nudi sljedeće prednosti organizaciji.

  • Omogućava korisnicima pregled poslovanja.
  • Pretvorite operativne podatke u analitičke informacije, fokusirane na donošenje odluka.
  • Generirajte dinamičke izvještaje koji vam olakšavaju analizu.
  • Olakšava formiranje strategija za ispunjenje ciljeva organizacije.
  • Koristi za stabilnost strukture kompanije.

Drugi primjer dnevnog skladišta podataka odnosi se na upravljanje obrazovnom ustanovom koja ima nedostatke u smislu komunikacije sa svojim studentima. Slično tome, nedostaje mu jedinstveni informacijski centar koji ima sve njihove podatke. Cilj institucije je pratiti studente tokom njihove karijere i nakon diplomiranja, ponuditi nove prijedloge koji poboljšavaju performanse organizacije i razvoj učenika.

Primjenom skladišta podataka nastojimo odgovoriti potrebama univerziteta. U principu, eliminiranje dupliciranja informacija i prisutnosti pogrešnih podataka o studentima, kao i svih informacija koje se općenito smatraju nekvalitetnim i koje nisu relevantne. Osim toga, sve su informacije integrirane, tvoreći jedinstvenu evidenciju studenata koja služi kao osnova za pravilan razvoj projekta institucije.

Konačno, promoviraju se marketinške aktivnosti koje univerzitetu daju veću korist i pomažu mu u rastu pravilnim upravljanjem informacijama.

Zaključno, u primjerima skladišta podataka nudi se mogućnost da se zna šta se dešava u organizaciji, šta se dogodilo, šta se može dogoditi i zašto. Možete pogledati članak vrste računarskih virusa.