Grzegorz Kurowski

Bazy danych – cyfrowy obraz rzeczywistości

Baza danych to nic innego jak uporządkowany zbiór informacji, który odzwierciedla wybrany fragment rzeczywistości. Wyobraź sobie, że to taki cyfrowy model rzeczywistości, gdzie zamiast przedmiotów i zjawisk mamy wiersze i kolumny z danymi.

Co charakteryzuje bazę danych?

Zgodność z rzeczywistością: Dane w bazie powinny być poprawne i wiarygodne, dokładnie odzwierciedlając stan rzeczy w świecie rzeczywistym.
Organizacja: Dane nie są przypadkowo poukładane, ale podporządkowane określonej strukturze, nazywanej modelem danych. Ten model określa, jak dane są ze sobą powiązane i jak można do nich uzyskać dostęp.
Zarządzanie: Baza danych nie istnieje sama w sobie, ale jest zarządzana przez specjalny program – system zarządzania bazą danych (SZBD). To on odpowiada za przechowywanie, wyszukiwanie, aktualizację i zabezpieczenie danych.
Współpraca z innymi programami: Baza danych nie jest odizolowana, ale współpracuje z różnymi aplikacjami, które wykorzystują dane do wykonywania określonych zadań.

Dlaczego bazy danych są tak ważne?

Efektywne zarządzanie informacją: Pomagają w gromadzeniu, przechowywaniu i organizowaniu dużych ilości danych w sposób uporządkowany i łatwo dostępny.
Szybki dostęp do danych: Dzięki wyspecjalizowanym językom zapytań (np. SQL), możemy szybko znaleźć potrzebne informacje.
Usprawnienie procesów: Bazy danych są wykorzystywane w wielu dziedzinach, od biznesu po naukę, usprawniając różne procesy i podejmowanie decyzji.
Zabezpieczenie danych: Systemy zarządzania bazami danych oferują zaawansowane mechanizmy zabezpieczające, chroniąc dane przed nieautoryzowanym dostępem.

Podstawowe typy baz danych:

Kartotekowe: Najprostszy rodzaj bazy, gdzie dane są przechowywane w postaci płaskich plików. Choć historycznie istotne, obecnie rzadko używane ze względu na ograniczenia w zarządzaniu dużymi zbiorami danych i relacjami między nimi.
Hierarchiczne: Organizują dane w strukturze drzewiastej, z jednym korzeniem i wieloma gałęziami. Były popularne w przeszłości, ale mają ograniczenia w elastyczności i skalowaniu.
Sieciowe: Rozbudowanie modelu hierarchicznego, pozwalające na bardziej złożone relacje między danymi. Jednakże, ich złożoność utrudnia zarządzanie i utrzymanie.
Relacyjne: Najpopularniejszy typ baz danych, oparty na modelu relacyjnym. Dane są przechowywane w tabelach, które są powiązane ze sobą za pomocą kluczy. Charakteryzują się wysoką wydajnością, skalowalnością i zaawansowanymi możliwościami zarządzania. Przykładowe systemy: MySQL, PostgreSQL, SQL Server.
Obiektowe: Przechowują dane w postaci obiektów, podobnie jak w programowaniu obiektowym. Łączą w sobie zalety baz relacyjnych i obiektowego podejścia do programowania. Przykładowe systemy: MongoDB.
Relacyjno-obiektowe: Łączą cechy baz relacyjnych i obiektowych, oferując większą elastyczność w modelowaniu danych.
Strumieniowe: Przetwarzają dane, które napływają w sposób ciągły, np. dane z czujników, logi systemowe. Przykładowe systemy: Kafka.
Temporalne: Specjalizują się w przechowywaniu danych historycznych, pozwalając na śledzenie zmian w czasie.

Który typ wybrać?

Wybór odpowiedniego typu bazy zależy od wielu czynników, takich jak:

Rodzaj danych: Czy dane są strukturalizowane czy nie, czy zawierają hierarchie czy grafy.
Wielkość danych: Jak duża jest baza danych i jak szybko rośnie.
Dostępność: Czy dane mają być dostępne online czy offline.
Wymagania dotyczące wydajności: Jak szybko muszą być wykonywane zapytania.
Złożoność relacji: Jakie są zależności między danymi.

Podstawowe operacje na BD

Wprowadzanie danych
Zapamiętywanie i przechowywanie danych
Wyszukiwanie, analizowanie i prezentowanie danych
Dodawanie i usuwanie danych
Aktualizowanie danych

Podstawowe cechy systemów baz danych:

Zorganizowane dane: Dane są przechowywane w tabelach, które mają ściśle określoną strukturę. Każda tabela składa się z wierszy (rekordów) i kolumn (pól), co ułatwia ich organizację
i wyszukiwanie.
Spójność danych: Systemy baz danych zapewniają spójność danych, co oznacza, że informacje są dokładne, kompletne i wolne od duplikatów.
Bezpieczeństwo danych: Dostęp do danych jest kontrolowany za pomocą mechanizmów autoryzacji i uwierzytelniania. Dzięki temu dane są chronione przed nieautoryzowanym dostępem
i modyfikacjami.
Efektywność: Systemy baz danych są zaprojektowane tak, aby umożliwiały szybkie wyszukiwanie, sortowanie i analizowanie dużych ilości danych.
Integralność: Systemy baz danych zapewniają integralność danych, co oznacza, że dane są spójne i zgodne z określonymi regułami.
Niezależność danych: Dane są przechowywane niezależnie od aplikacji, co oznacza, że różne aplikacje mogą korzystać z tych samych danych.
Współdzielenie danych: Systemy baz danych umożliwiają współdzielenie danych między wieloma użytkownikami jednocześnie.
Skalowalność danych: czyli możliwość rozbudowy systemu bazy danych.

BAZA KARTOTEKOWA

_____________________________

BAZA SIECIOWA

_____________________________

BAZA RELACYJNA

_____________________________

BAZA OBIEKTOWA

Różnice między relacyjnymi i nierelacyjnymi bazami danych.

Relacyjne i nierelacyjne bazy danych różnią się zarówno w sposobie organizacji danych, jak i w podejściu do ich przechowywania i zarządzania. Każdy typ bazy danych ma swoje zalety i jest lepiej dopasowany do różnych rodzajów aplikacji oraz wymagań projektowych. Oto bardziej szczegółowy opis tych różnic, co może pomóc uczniom zrozumieć, kiedy i dlaczego stosuje się jeden typ bazy danych, a nie drugi.

1. Struktura przechowywania danych

Relacyjne bazy danych:

Przechowują dane w formie tabel, gdzie każda tabela reprezentuje konkretną jednostkę (np. klienci, produkty, zamówienia).
Tabele mają z góry zdefiniowane kolumny, które określają typy danych, jakie mogą być przechowywane (np. liczby, tekst, daty).
Dane w tabelach są powiązane przez relacje. Klucze główne i obce (ang. primary and foreign keys) umożliwiają tworzenie zależności między tabelami.
Struktura jest oparta na modelu matematycznym i wymaga przestrzegania zasad integralności danych – np. nie można dodać zamówienia bez przypisanego klienta.

Nierelacyjne bazy danych (NoSQL):

Przechowują dane w różnorodnych formatach, takich jak dokumenty JSON, klucze-wartości, grafy, kolumny.
Nie mają sztywno określonej struktury tabel; każda jednostka danych może mieć różne atrybuty i strukturę.
Często nie wymagają kluczy głównych ani relacji między danymi, co sprawia, że są bardziej elastyczne.
Istnieje większa swoboda w definiowaniu struktury danych, co pozwala na szybkie dostosowanie się do zmian.

2. Relacje i powiązania między danymi

Relacyjne bazy danych:

W naturalny sposób wspierają tworzenie relacji między danymi, dzięki czemu idealnie nadają się do zarządzania skomplikowanymi, połączonymi informacjami.
Relacje są definiowane przez klucze obce, co pozwala na precyzyjne zarządzanie powiązaniami.
Dzięki normalizacji danych (czyli podziałowi na mniejsze, wyspecjalizowane tabele), relacyjne bazy minimalizują redundancję i zapewniają spójność danych.
Typowe relacje obejmują jeden-do-jednego, jeden-do-wielu oraz wiele-do-wielu, co umożliwia modelowanie złożonych struktur biznesowych, takich jak relacje między klientami a zamówieniami, produktami, płatnościami itp.

Nierelacyjne bazy danych:

Mogą obsługiwać relacje między danymi, ale robią to mniej formalnie, bez stosowania kluczy obcych.
Często przechowują dane w sposób zoptymalizowany dla aplikacji, które wymagają dużej wydajności i składowania dużej ilości danych bez skomplikowanych powiązań między jednostkami.
Stosują bardziej elastyczne podejście, pozwalając na duplikację danych (denormalizacja), co może przyspieszać odczyty danych, lecz zwiększa rozmiar bazy i może prowadzić do niespójności.
Świetnie sprawdzają się w przypadku danych hierarchicznych (np. kategorie produktów, wątki w serwisach społecznościowych) lub sieci powiązań (bazy grafowe, jak te używane w mediach społecznościowych).

3. Język zapytań i sposoby dostępu

Relacyjne bazy danych:

Wykorzystują strukturalny język zapytań SQL (Structured Query Language), który jest jednym z najbardziej znanych i standardowych języków do manipulacji danymi.
SQL umożliwia przeprowadzanie złożonych operacji, takich jak JOIN, GROUP BY, agregacje, podzapytania.
Relacyjne bazy danych są dobrze zoptymalizowane do transakcyjnych aplikacji, które wymagają wysokiej spójności danych i kontroli nad operacjami (np. bankowość, systemy księgowe).

Nierelacyjne bazy danych:

Nie mają jednolitego języka zapytań; każda baza może mieć własny sposób dostępu do danych.
Często korzystają z bezpośredniego dostępu do dokumentów, co upraszcza pobieranie danych, zwłaszcza gdy struktura jest nieskomplikowana.
W niektórych systemach, takich jak MongoDB (dokumenty JSON), można przeprowadzać złożone zapytania, ale nie są one tak zaawansowane jak SQL.
Nierelacyjne bazy danych są lepiej dostosowane do dużych, rozproszonych systemów, gdzie wydajność i dostępność są ważniejsze niż całkowita spójność danych.

4. Skalowalność i wydajność

Relacyjne bazy danych:

Tradycyjnie skalują się w pionie, co oznacza, że zwiększają wydajność przez dodawanie zasobów sprzętowych do jednego serwera.
Są zoptymalizowane do transakcji ACID (atomiczność, spójność, izolacja, trwałość), co sprawia, że są stabilne i zapewniają wysoki poziom niezawodności.
Przy dużych ilościach danych oraz dużym obciążeniu mogą wymagać rozbudowanych zasobów sprzętowych, co jest kosztowne i trudne do utrzymania.

Nierelacyjne bazy danych:

Skalują się poziomo, co oznacza, że można dodawać nowe serwery, aby zwiększyć możliwości przechowywania i przetwarzania danych.
Często korzystają z koncepcji spójności ostatecznej (ang. eventual consistency), co oznacza, że dane w różnych kopiach bazy mogą się różnić, ale ostatecznie staną się zgodne.
Doskonale sprawdzają się w aplikacjach o dużym wolumenie danych, takich jak systemy e-commerce, aplikacje mobilne, serwisy społecznościowe, gdzie szybkość i dostępność są kluczowe.

5. Typowe zastosowania

Relacyjne bazy danych:

Stosowane są wszędzie tam, gdzie istotna jest spójność i integralność danych, a dane mają regularną, przewidywalną strukturę.
Są popularne w systemach finansowych, ERP, CRM, systemach księgowych, ewidencjach magazynowych itp.
Świetnie sprawdzają się w przypadkach, gdzie wymagane jest przechowywanie dużej ilości wzajemnie powiązanych danych, których struktura nie zmienia się dynamicznie.

Nierelacyjne bazy danych:

Najlepiej nadają się do aplikacji, gdzie potrzebne jest szybkie przetwarzanie dużej ilości niespójnych lub pół-strukturalnych danych.
Idealne do serwisów społecznościowych, analizy danych w czasie rzeczywistym, aplikacji IoT, a także do obsługi stron i aplikacji mobilnych.
Często wykorzystywane w Big Data oraz w przypadkach, gdzie struktura danych może się dynamicznie zmieniać.