Domanda |
Risposta |
Big data to duże dane do analizowania, których liczbę należy maksymalizować w celu wydobycia określonych wartości informacyjnych. inizia ad imparare
|
|
|
|
|
Big data to duże dane do analizowania, których liczbę należy minimalizować w celu wydobycia określonych wartości informacyjnych. inizia ad imparare
|
|
|
|
|
Big data bazuje na koncepcji 3 atrybutów (3V) inizia ad imparare
|
|
|
|
|
Big data bazuje na koncepcji 4 atrybutów inizia ad imparare
|
|
|
|
|
inizia ad imparare
|
|
objętość (volume), różnorodność (variety) oraz szybkość przetwarzania (vielocity)
|
|
|
inizia ad imparare
|
|
objętość (volume), różnorodność (variety) oraz szybkość przetwarzania (vielocity), wiarygodność(veracity)
|
|
|
Dane w big data są różnorodne inizia ad imparare
|
|
|
|
|
Dane w big data są z różnych źródeł z dużą prędkością? inizia ad imparare
|
|
|
|
|
Dane w big data są generowane z jednego źródła? inizia ad imparare
|
|
|
|
|
Dane w big data są z różnych źródeł z małą prędkością? inizia ad imparare
|
|
|
|
|
Wymień 6 atrybutów big data inizia ad imparare
|
|
objętość, złożoność, szybkość, wartość, różnorodność, zmienność
|
|
|
W big data dane traktowane są jako strumienie a nie zbiory inizia ad imparare
|
|
|
|
|
W big data dane traktowane są jako zbiory a nie strumienie inizia ad imparare
|
|
|
|
|
Data scientist musi posiadać wiedzę zarówno z zakresu analiz danych jak również z zakresu technologii informatycznych inizia ad imparare
|
|
|
|
|
Data scientist musi posiadać wiedzę dotyczącą technologii informatycznych inizia ad imparare
|
|
|
|
|
Objętość danych to ich pojemność, słuzy do wprowadzania nowych idei i pomysłów, wymaga odpowiedniej infrastruktury programistycznej inizia ad imparare
|
|
|
|
|
Objętość danych to ich pojemność, słuzy do wprowadzania nowych idei i pomysłów, nie posiada dużych wymagań inizia ad imparare
|
|
|
|
|
Różnorodność danych mówi że dane pochodzą z różnorodnych źródeł, często w różnych formatach oraz w różnej formie inizia ad imparare
|
|
|
|
|
Zmienność mówi że dane pochodzą z różnorodnych źródeł, często w różnych formatach oraz w różnej formie inizia ad imparare
|
|
|
|
|
Różnorodność danych to inaczej heterogeniczność inizia ad imparare
|
|
|
|
|
Złożoność danych to inaczej heterogeniczność inizia ad imparare
|
|
|
|
|
Złożoność danych powiązana z hetefogenicznością danych, różnym źródłem ich pochodzenia, różnym sposobem uporządkowania danych inizia ad imparare
|
|
|
|
|
Zmienność danych powiązana z hetefogenicznością danych, różnym źródłem ich pochodzenia, różnym sposobem uporządkowania danych inizia ad imparare
|
|
|
|
|
Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z ogromną prędkością, wymagające często analizy w czasie rzeczywistym inizia ad imparare
|
|
|
|
|
Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z niską prędkością, wymagające często analizy w czasie rzeczywistym inizia ad imparare
|
|
|
|
|
Wartość danych Szybkość napływu danych posiada strumieniowy charakter. Dane przesyłane są z ogromną prędkością, wymagające często analizy w czasie rzeczywistym inizia ad imparare
|
|
|
|
|
Wysoki poziom zmienności danych związana jest z prędkością przepływu danych oraz ich różnorodnym charakterem inizia ad imparare
|
|
|
|
|
Wartość danych jest to cecha wynikająca z pozostałych atrybutów. inizia ad imparare
|
|
|
|
|
Szybkość napływu jest to cecha wynikająca z pozostałych atrybutów. inizia ad imparare
|
|
|
|
|
Wartość danych jest zwiazana bezpośrednio z wartością dodaną, jaką można wygenerować na podstawie danych inizia ad imparare
|
|
|
|
|
Wartość danych jest zwiazana pośrednio z wartością dodaną, jaką można wygenerować na podstawie danych inizia ad imparare
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o określonej strukturze, o mieszanej strukturze oraz o określonej strukturze inizia ad imparare
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o określonej strukturze, o mieszanej strukturze oraz o zgodnej strukturze inizia ad imparare
|
|
|
|
|
Big data - uporządkowanie danych możemy podzielić na: dane o zmiennej strukturze, o mieszanej strukturze oraz o określonej strukturze inizia ad imparare
|
|
|
|
|
Wyzwania badawcze Big Data związane są bezpośrednio z atrybutami big data inizia ad imparare
|
|
|
|
|
Wyzwania badawcze Big Data związane są bezpośrednio z metodami big data inizia ad imparare
|
|
|
|
|
Wyzwania badawcze Big Data można podzielić na dotyczące technologii oraz dotyczące danych. inizia ad imparare
|
|
|
|
|
Wyzwania badawcze Big Data można podzielić na dotyczące technologii oraz dotyczące problemów inizia ad imparare
|
|
|
|
|
Wyzwania technologiczne związane są z opracowanie odpowiedniej architektury informatycznej inizia ad imparare
|
|
|
|
|
Wyzwania technologiczne związane są z ich charakterem i różnorodnością inizia ad imparare
|
|
|
|
|
Wyzwania badawcze Big Data związane są z opracowanie odpowiedniej architektury informatycznej inizia ad imparare
|
|
|
|
|
Wyzwania dotyczące danych Big Data związane są z opracowanie odpowiedniej architektury informatycznej inizia ad imparare
|
|
|
|
|
Wyzwania dotyczące danych Big Data związane sa z ich charakterem i różnorodnością inizia ad imparare
|
|
|
|
|
Wyzwania technologiczne- architektura informatyczna: źródła danych -> pobór danych -> gromadzenie danych -> wstępne przetwarzanie danych -> rozdzielanie danych -> Analiza danych -> modelowanie danych -> wnioskowanie na podstawie wyników analiz inizia ad imparare
|
|
|
|
|
Wyzwania technologiczne- architektura informatyczna: inizia ad imparare
|
|
źródła danych -> pobór danych -> gromadzenie danych -> wstępne przetwarzanie danych -> rozdzielanie danych -> Analiza danych -> modelowanie danych -> wnioskowanie na podstawie wyników analiz
|
|
|
Charakter danych możemy podzielić na: różnorodnosć źródeł, różnorodność formatów, jakość, wielowymiarowość, pojemność informacyjna, wartość biznesowa inizia ad imparare
|
|
|
|
|
Charakter danych możemy podzielić na: jakość źródeł, różnorodność formatów, wartość, wielowymiarowość, pojemność informacyjna, wartość biznesowa inizia ad imparare
|
|
|
|
|
Charakter danych możemy podzielić na: różnorodnosć źródeł, różnorodność formatów, jakość, wielowymiarowość, pojemność informacyjna, wartość wynikowa inizia ad imparare
|
|
|
|
|
Cloud computing to tzw przetwarzanie w chmurze inizia ad imparare
|
|
|
|
|
Cloud computing to tzw przetwarzanie na serwerze inizia ad imparare
|
|
|
|
|
Cloud computing możemy podzielić na Private Cloud, Hybrid Cloud oraz Public Cloud inizia ad imparare
|
|
|
|
|
Cloud computing możemy podzielić na Private Cloud, Hybrid Cloud oraz Protected Cloud inizia ad imparare
|
|
|
|
|
Architektura informatyczna to połaczenie sprzetu i odpowiedniego oprogramowania wspierającego proces przetwarzania danych Big Data inizia ad imparare
|
|
|
|
|
Apache Hadoop jest to projekt którego celem jest rozwój oprogramowania typu "open-source" do przetwarzania rozproszonych dużych zasobów danych w klastrach serwerów przy uzyciu prostych metod programistycznych inizia ad imparare
|
|
|
|
|
Zalety Hadoop: Skalowalność, elastyczność, opłacalność, bezawaryjność inizia ad imparare
|
|
|
|
|
Zalety Hadoop w opszarze Big Data: Skalowalność, elastyczność, niska cena, bezawaryjność inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwirnir dodania nowych węzłów bez konieczności zmiany formatów danych, jakie są ładowane (skalowalność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwirnir dodania nowych węzłów z koniecznością zmiany formatów danych, jakie są ładowane (skalowalność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy dodanie możliwości poboru wszelkich rodzajów danych, o dowolnych formatach, z różnych źródeł (elastyczność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy dodanie możliwości poboru wszelkich rodzajów danych, o określonych formatach, z różnych źródeł (elastyczność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwienie prowadzenie równolegle obliczeń na wielu serwerach (cost-reduced) (opłacalność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy umożliwienie prowadzenie równolegle obliczeń na dwóch serwerach (cost-reduced) (opłacalność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy w razie problemów z jednym węzłem jego zadania zostają przekierowane do innych jednostek (bezawaryjność) inizia ad imparare
|
|
|
|
|
Do Zalet Hadoop w obszarze Big Data należy w razie problemów z jednym węzłem jego zadania zostają przekierowane do innych danych (bezawaryjność) inizia ad imparare
|
|
|
|
|
Cecha NoSQL: jest to system nie posiadajacy relacji oraz zdefiniowanego jezyka inizia ad imparare
|
|
|
|
|
Cecha NoSQL jest to system posiadajacy relacje oraz zdefiniowany język inizia ad imparare
|
|
|
|
|
Cecha NoSQL wykorzystywany dla danych nie posiadających określonej struktury lub semi-strukturalnych inizia ad imparare
|
|
|
|
|
Cecha NoSQL wykorzystywany dla danych posiadających określoną struktury lub semi-strukturalnych inizia ad imparare
|
|
|
|
|
Cecha NoSQL Skalowalność i elastyczność bazy – możliwość zwiększania wydajności systemu wraz z rosnącym zapotrzebowaniem inizia ad imparare
|
|
|
|
|
Cecha NoSQL Skalowalność i elastyczność bazy – możliwość zwiększania wydajności systemu wraz z malejącym zapotrzebowaniem inizia ad imparare
|
|
|
|
|
NoSQL może być stosowany ze zwykłym SQLem inizia ad imparare
|
|
|
|
|
NoSQL nie może być stosowany ze zwykłym SQLem inizia ad imparare
|
|
|
|
|
Klasyczne narzędzia analizy danych Big Data: inizia ad imparare
|
|
Przetwarzanie sieciowe (Grid-computing), przetwarzanie w bazie danych (in-database-processing), analityka w pamięci (in-memory analytics)
|
|
|
Klasyczne narzędzia analizy danych Big Data: Przetwarzanie sieciowe (Grid-computing), przetwarzanie w bazie danych (in-database-processing), analityka w pamięci (in-memory analytics) inizia ad imparare
|
|
|
|
|
NoSQL – (non SQL) nierelacyjna baza danych, umożliwiająca przechowywanie i pobieranie danych w różnych formatach w nieograniczony sposób inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data: użytkownik biznesowy -> Administrator hurtowni danych ->Data scientist->Analityk Business Intelligence->Końcowy uzytkownik biznesowy inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - użytkownik biznesowy jest odpowiedzialny za określenie i analizę wskaźników wydajności KPI oraz za formuowanie wymagań analitycznych odnośnie danych inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - Uzytkownik biznesowy jest to osoba odpowiedzialna za zidentyfikowanie podstawowych procesów biznesowych inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - Administrator hurtowni Danych odpowiedzialny za definiowanie, rozwój oraz obsługę hurtowni danych oraz zarządzanie narzędziami wspomagającymi Big Data inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - Uzytkownik biznesowy odpowiedzialny za definiowanie, rozwój oraz obsługę hurtowni danych oraz zarządzanie narzędziami wspomagającymi Big Data inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - Data Scientist - osoba odpowiedzialna za budowę modeli analitycznych oraz ich implementację w środowisko informatyczne wspomagające Big Data inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - Końcowy użytkownik biznesowy – (final business user, end-user) osoba wykorzystująca w swojej pracy wszelkie informacje wygenerowane przez pozostałych uczestników cyklu analizy Big Data inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - analityk BI - Końcowy użytkownik biznesowy – (final business user, end-user) osoba wykorzystująca w swojej pracy wszelkie informacje wygenerowane przez pozostałych uczestników cyklu analizy Big Data inizia ad imparare
|
|
F (końcowy użytkownik biznesowy)
|
|
|
Cykl analizy Big Data - analityk BI - osoba odpowiedzialna za identyfikację, zarządzanie i publikowanie kluczowych wskaźników wydajności oraz raportów, zazwyczaj w czasie zbliżonym do rzeczywistego inizia ad imparare
|
|
|
|
|
Cykl analizy Big Data - Końcowy użytkownik biznesowy – osoba odpowiedzialna za identyfikację, zarządzanie i publikowanie kluczowych wskaźników wydajności oraz raportów, zazwyczaj w czasie zbliżonym do rzeczywistego inizia ad imparare
|
|
|
|
|
Zarządzanie bazą danych – wszelkie działania mające na celu usprawnienie procesu pracy z danymi, przyczyniające się do obniżenia kosztów obsługi danych, przechowywania danych, administrowania oraz eksploracji inizia ad imparare
|
|
|
|
|
Zarządzanie bazą danych typu Big Data Działania na danych możemy podzielić na: inizia ad imparare
|
|
Gromadzenie danych, próbkowanie, wstępne przetwarzanie
|
|
|