Algebra relacyjna w bazach danych: operacje, przykłady

Spisu treści:

Algebra relacyjna w bazach danych: operacje, przykłady
Algebra relacyjna w bazach danych: operacje, przykłady
Anonim

Ogólnie rzecz biorąc, systemy baz danych są wyposażone w język zapytań, który może pomóc użytkownikom w zapytaniu o instancje. Istnieją dwa takie typy - algebra relacyjna i rachunek relacyjny. Pierwszy to proceduralny język zapytań, który przyjmuje instancje relacji jako dane wejściowe i wyświetla przykładowe relacje jako dane wyjściowe. Używa do tego rachunku jednoargumentowego lub binarnego. Algebra relacyjna jest wykonywana rekurencyjnie, a wyniki pośrednie traktowane są jako relacje.

Algebra relacyjna
Algebra relacyjna

Produkt kartezjański (Χ)

Łączy informacje z dwóch różnych relacji w jedną.

Zapis – r Χ s, gdzie r i s są stosunkami, a ich wynik zostanie zdefiniowany jako

r Χ s={qt | q ∈ r i t ∈ s}.

Wniosek. Ustawia relację, która pokazuje wszystkie książki i artykuły napisane w samouczku.

Zmień nazwę operacji (ρ).

Relacja algebry relacyjnej to wyniki, ale bez nazwy. Operacja zmiany nazwy pozwala zmienić wartość wyjściową, oznaczoną małą grecką literą ρ.

Oznaczenie – ρ x (E), gdzie wynik wyrażenia E jest przechowywany z nazwąx.

Dodatkowe operacje:

  • ustaw przecięcie;
  • przypisanie;
  • naturalne połączenie.

Rachunek relacyjny

Jest to nieproceduralny język zapytań, co oznacza, że mówi Ci, co robić, ale nie wyjaśnia, jak go zaimplementować. Rachunek relacyjny istnieje w dwóch formach:

  • rachunek korelacji krotki;
  • filtrowanie zakresów zmiennych.

Zapis - T/stan: Zwraca wszystkie krotki T, które spełniają warunek. Wynik. Zwraca krotki z nazwą. TRC można określić ilościowo. Możesz użyć kwantyfikatorów egzystencjalnych (∃) i uniwersalnych (∀). Wniosek. Powyższe zapytanie da taki sam wynik jak poprzednie.

Rachunek relacyjny domeny DRC

Zmienna filtrująca używa domeny atrybutu zamiast krotek wartości całkowitych (jak to zrobiono w TRC wspomnianym powyżej).

Zapis – {a 1, a 2, a 3, …, a | P (a 1, a 2, a 3, …, a)}, gdzie a1, a2 to atrybuty, a P oznacza formuły zbudowane z wartości wewnętrznych.

Wniosek. Ustawia artykuł, stronę i temat z relacji TutorialsPoint, gdzie tematem jest baza danych.

Podobnie jak TRC, DRC można również napisać za pomocą egzystencjalnych i uniwersalnych kwantyfikatorów. DRC zawiera również operatory algebry relacyjnej. Siła wyrażenia obliczeń, rachunku różniczkowego i korelacji relacji między punktami jest równoważna.

relacyjnymodel danych algebry relacyjnej
relacyjnymodel danych algebry relacyjnej

Odmiany i schematy rachunku relacyjnego i algebry

Model ER, gdy jest konceptualizowany na diagramach, zapewnia dobry przegląd podstawowych relacji, które są łatwiejsze do zrozumienia. Reprezentacje schematyczne można odwzorować na schemat relacyjny, tj. można je tworzyć razem. Nie jest możliwe zaimportowanie wszystkich ograniczeń ER do modelu relacyjnego, ale można wygenerować przybliżoną strukturę. Dostępnych jest kilka procesów i algorytmów konwersji wykresów do tego systemu. Niektóre z nich są zautomatyzowane, inne tworzone ręcznie. Wykresy ER składają się głównie z następujących kryteriów:

  • podmiot i jego atrybuty;
  • link, który jest powiązaniem między powyższymi wartościami.

Porównanie obiektów i relacji odbywa się na różne sposoby i schematy. Na przykład jednostka jest obiektem świata rzeczywistego z pewnymi atrybutami. Proces dopasowywania, algorytm wygląda następująco:

  • utwórz tabelę dla każdego obiektu;
  • atrybuty powinny stać się polami tabeli z odpowiednimi typami danych;
  • deklaruj klucz podstawowy.

Relacja to powiązanie między podmiotami. Proces kompilacji wygląda następująco:

  • utwórz tabelę dla relacji;
  • dodaj klucze podstawowe wszystkich uczestniczących encji jako pola tabeli z odpowiednimi typami danych;
  • jeśli relacja ma jakiś atrybut, ustaw każdy atrybut jako pole tabeli;
  • połącz klucz podstawowy, który składa się na wszystkoreszta dla uczestniczących obiektów;
  • określ wszystkie ograniczenia klucza obcego.

Wyświetlanie słabych zbiorów i obiektów hierarchicznych odbywa się zgodnie z pewnym systemem. Przede wszystkim konieczne jest zrozumienie podstawowych podstaw i definicji tych wartości. Słaby zestaw funkcji to taki, z którym nie jest powiązany żaden klucz podstawowy. Proces wyświetlania wygląda następująco:

  • utwórz tabelę dla słabego zestawu obiektów;
  • dodaj wszystkie atrybuty do schematu jako pole;
  • określ klucz podstawowy do identyfikacji;
  • ustaw wszystkie ograniczenia klucza obcego.

Wyświetlanie obiektów hierarchicznych w oparciu o specjalizację lub uogólnienie języka algebry relacyjnej odbywa się w formie bytów sekwencyjnych. Algorytm wygląda następująco:

  • tworzenie tabel dla wszystkich obiektów wyższego poziomu;
  • dodaj klucze podstawowe;
  • na niskim poziomie zaimplementuj wszystkie inne atrybuty obiektów niższego poziomu;
  • deklaruj klucze podstawowe tabeli;
  • ustaw ograniczenia klucza obcego.
Operacje algebry relacyjnej
Operacje algebry relacyjnej

Istniejące opcje opisu, przechowywania, zmiany informacji

SQL to język programowania dla relacyjnych baz danych. Jest rozwijany na podstawie algebry i rachunku korelacji krotek. SQL jest dostarczany jako pakiet ze wszystkimi głównymi dystrybucjami DBMS. Zawiera zarówno dane, jak i języki do manipulowania nimi. Korzystając z właściwości definicji danych SQL algebry relacyjnej, można projektować i modyfikować schemat bazy danych,natomiast właściwości zarządzania i regulacji oraz zmiany danych pozwalają na przechowywanie i pobieranie informacji zainstalowanych w systemie. Używa następującego zestawu poleceń do zdefiniowania struktury i systemu:

  • tworzy nowe bazy danych, tabele i widoki z DBMS.
  • wyrzuca polecenia.
  • zmienia schemat bazy danych.
  • to polecenie dodaje atrybut do obiektu ciągu.

SQL jest wyposażony w język manipulacji danymi (DML). Modyfikuje instancję bazy danych poprzez wstawianie, aktualizowanie i usuwanie informacji. DML odpowiada za zmianę wszystkich danych. SQL zawiera następujący zestaw poleceń w sekcji DML:

  1. SELECT to jedno z podstawowych poleceń zapytań. Jest to analogiczne do operacji rzutowania algebry relacyjnej. Wybiera atrybuty na podstawie warunku opisanego w klauzuli WHERE.
  2. FROM - Ta sekcja przyjmuje nazwę jako argument, z którego mają być wybierane/rzutowane atrybuty. W przypadku podania więcej niż jednej nazwy, pozycja ta odpowiada produktowi kartezjańskiemu.
  3. GDZIE - Ta sekcja określa predykat lub warunki, które muszą zostać spełnione, aby zakwalifikować przewidywany atrybut.

Istnieją również polecenia:

  • wstaw;
  • zmiana wartości;
  • usuń.
Algebra relacyjna w bazach danych
Algebra relacyjna w bazach danych

Tworzenie zapytań z algebry relacyjnej

Podczas konstruowania wyszukiwania, zadaniem jest znalezienie struktury operacji, które doprowadzą do prawidłowego wyniku. Podstawowe operacje algebry relacyjnej są prosteoperacje z jedną lub dwiema relacjami jako operandami. Połączone efekty sekwencji decydują o efekcie końcowym. Ponieważ system algebry relacyjnej w bazach danych jest dość prosty, wiele wyników pośrednich można uzyskać przed osiągnięciem ostatecznego wyniku, są one również używane jako operandy, które generują nowe otrzymane dane.

Dla większości operatorów kolejność zapytań i ich wykonanie nie ma znaczenia, co oznacza, że ten sam wynik można uzyskać poprzez kształtowanie i łączenie danych pośrednich na różne sposoby. W praktyce przeszukiwanie baz danych jest dość łatwe. System wykonywania operacji i wyników pośrednich jest określany przez optymalizator zapytań. Tworząc pytania, wymagania, musisz

najpierw wybrać, które relacje są niezbędne do uzyskania odpowiedzi, a następnie określić operacje i wyniki pośrednie. Strukturę zapytania algebry relacyjnej w bazie danych wyników można przedstawić w postaci diagramu. Optymalizatory wymagań starają się jak najefektywniej organizować wykonanie. W praktyce oznacza to zwykle, że starają się jak najszybciej minimalizować wyniki pośrednie. Pomogą w tym typowe przykłady algebry relacyjnej.

Przykład 1.

Potrzeba informacji: Informacje o pojazdach z roku modelowego 1996, w których wykryto usterki podczas inspekcji w 1999 roku.

Najpierw wyświetlane są informacje o samochodach w celu zrozumienia wartości wszystkich atrybutów związku. Informacje o kontrolach są przechowywane w tabeli „Przegląd”, a w przypadku wykryciausterek, są one zapisywane w tabeli „Problem”. Dlatego te trzy tabele są potrzebne, aby uzyskać wymagane informacje.

Tylko samochody z 1996 roku są interesujące. Zakres modelu pojazdu jest reprezentowany jako wartość ustawionego atrybutu w wierszu tabeli informacji o pojeździe. Pierwszy wynik pośredni składa się z krotek reprezentujących warianty z 1996 roku.

Więc potrzebne są tylko wiersze obejmujące ten okres. Aby je wyodrębnić, musisz użyć selekcji. Teraz są wymagane samochody i przeglądy. Łańcuchy są następnie łączone za pomocą operacji łączenia. Muszą one być połączone wspólnym numerem rejestru, ponieważ jest to jedyna wspólna kolumna, stosowane jest sprzężenie naturalne.

Aby dowiedzieć się, czy podczas sprawdzania wystąpiły problemy, musisz powiązać linie problemów z sprawdzaniem. Po połączeniu rzędów kontrolnych z samochodami można ten wynik powiązać z tabelą usterek. Przynależność musi opierać się na wspólnym numerze rejestracyjnym i zweryfikowanej dacie. Są to jedyne wspólne kolumny w tabelach, więc używane jest sprzężenie naturalne.

Algebra relacyjna to język
Algebra relacyjna to język

Opcje obliczeń bez wyników pośrednich

Przykład 2.

Informacje wymagane: Nazwisko kierowcy dla pojazdów z roku modelowego 1995 lub starszych, które nie były testowane w roku 2000. Nazwa znajduje się w tabeli „Kierowca”. Organy ścigania opisane są w tabeli „Kontrola a samochody w wagonie stołówki”. WięcDlatego te trzy tabele są potrzebne. Najpierw musisz dowiedzieć się, które samochody nie były sprawdzane w 2000 roku. Nie da się rozwiązać tego problemu za pomocą wyłącznie kontroli wymienionych w tabeli, ponieważ zawiera ona dane o tych kontrolach, które zostały wykonane, a nie tych, które nie zostały zrealizowane. Ten problem rozwiązuje się, szukając samochodów uzupełniających, które zostały sprawdzone przed 2000 rokiem. W rzeczywistości potrzebne są tylko ich numery rejestracyjne.

Istnieją inne przykłady oprócz powyższych, które pokazują, jak zmienić lub znaleźć informacje. Warianty zapytań można zoptymalizować za pomocą operacji specjalnych. W rzeczywistości, aby wyszukiwanie i znajdowanie danych było tak łatwe i proste, jak to tylko możliwe, istnieje relacyjny model rachunku różniczkowego.

Gdzie informacje są zabezpieczone i chronione

Relacyjny model danych algebry relacyjnej jest przechowywany w formatach plików zawierających rekordy. Na poziomie fizycznym rzeczywiste informacje są utrwalane w formacie elektromagnetycznym na niektórych urządzeniach. Te urządzenia pamięci masowej można podzielić na trzy kategorie:

  1. Podstawowy. Ta kategoria obejmuje pamięć, która jest bezpośrednio dostępna dla procesora. Rejestry, szybka pamięć (cache) i pamięć główna (RAM) są bezpośrednio dostępne dla centrali, ponieważ wszystkie znajdują się na płycie głównej lub chipsecie. Ta pamięć masowa jest zwykle bardzo mała, bardzo szybka i niestabilna. Do utrzymania stanu wymagane jest stałe zasilanie. Jeśli się nie powiedzie, wszystkie dane zostaną utracone.
  2. Dodatkowe. Służy do przechowywania informacji na przyszłośćużyć lub kopii zapasowej. Obejmuje urządzenia pamięci, które nie są częścią chipsetu procesora lub płyty głównej, takie jak dyski magnetyczne, dyski optyczne (DVD, CD itp.), dyski twarde, dyski flash i taśmy magnetyczne.
  3. Usługa trzeciorzędowa. Służy do przechowywania ogromnych ilości danych. Ponieważ takie urządzenia pamięci masowej są zewnętrzne w stosunku do systemu komputerowego, są najwolniejsze pod względem szybkości. Te gadżety do przechowywania są używane głównie do tworzenia kopii zapasowych całego systemu. Dyski optyczne i taśmy magnetyczne są szeroko stosowane jako nośniki trzeciorzędne.

Specjalne operacje algebry relacyjnej są ważne dla wydajności zapytań.

Struktura pamięci

System komputerowy ma dobrze zdefiniowaną hierarchię pamięci. Procesor ma bezpośredni dostęp do systemu głównego oraz wbudowanych rejestrów. Czas dostępu do pamięci głównej jest oczywiście krótszy niż szybkość procesora. Aby zminimalizować tę rozbieżność, wprowadzono pamięć podręczną. Pamięć podręczna zapewnia najszybsze czasy dostępu i zawiera dane, z których procesor korzysta najczęściej.

Pamięć z najszybszym dostępem jest najdroższa. Duże urządzenia pamięci masowej zapewniają niewielką prędkość i są tańsze, ale mogą przechowywać ogromne ilości danych w porównaniu do rejestru procesora lub pamięci podręcznej.

Dyski magnetyczne i twarde to najpopularniejsze wtórne urządzenia pamięci masowej we współczesnych systemach komputerowych. Nazywają się magnetycznymimetalowa podstawa. Te dyski są umieszczane pionowo na wrzecionie. Głowica odczytująco-zapisująca porusza się między nimi i służy do namagnesowania lub usunięcia takiego miejsca pod spodem. Może być rozpoznany jako 0 (zero) lub 1 (jeden).

Dyski twarde są formatowane w ściśle określonej kolejności, co zapewnia wydajne przechowywanie danych. Ma wiele koncentrycznych kręgów zwanych ścieżkami. Każda ścieżka jest dalej podzielona na sektory, zwykle przechowujące 512 bajtów danych.

Algebra relacyjna SQL
Algebra relacyjna SQL

Operacje na plikach

Operacje na systemie języka algebry relacyjnej i jego bazie danych można ogólnie podzielić na dwie kategorie:

  • aktualizacja;
  • szukaj.

Pierwsza kategoria zmienia wartości danych poprzez wstawianie, usuwanie lub aktualizowanie. Z drugiej strony operacje wyszukiwania nie edytują informacji, ale wyodrębniają je po opcjonalnym filtrowaniu warunkowym. W obu rodzajach operacji selekcja odgrywa znaczącą rolę. Oprócz tworzenia i usuwania pliku, można na nich wykonać kilka operacji:

  1. Open - istnieje w jednym z dwóch trybów odczytu lub zapisu. W pierwszym przypadku system operacyjny nie pozwala nikomu zmieniać danych. Innymi słowy, dane są tylko odczytywane. Pliki otwarte w trybie odczytu mogą być udostępniane między wieloma obiektami. Tryb zapisu umożliwia zmianę danych. Pliki można czytać, ale nie można ich udostępniać.
  2. Zamknij to najważniejsza operacja z punktu widzenia systemu operacyjnego, ponieważ usuwa wszystkie blokady(jeśli jest w trybie współdzielonym), zapisuje dane (jeśli zostały zmodyfikowane) na nośnikach pomocniczych i zwalnia wszystkie bufory i programy obsługi powiązane z plikiem.
  3. Indeksowanie to metoda struktury informacji służąca do wydajnego wyodrębniania rekordów z plików systemu na podstawie niektórych atrybutów, w których system został zaimplementowany. Zdefiniowane na podstawie atrybutów.

Indeksowanie może być następującego typu:

  1. Primary jest zdefiniowany w uporządkowanym pliku danych. Plik informacyjny jest zorganizowany w polu klucza.
  2. Indeks dodatkowy wygenerowany z pola, które jest kluczem kandydującym i ma unikalną wartość w każdym rekordzie lub nie jest kluczem ze zduplikowanymi wartościami.
  3. Klastrowanie jest zdefiniowane w uporządkowanym pliku danych, w polu bez klucza.
algebra relacyjna rachunek różniczkowy
algebra relacyjna rachunek różniczkowy

System zarządzania bazą danych lub DBMS odnosi się do technologii przechowywania i pobierania informacji o użytkownikach z maksymalną wydajnością wraz z odpowiednimi środkami bezpieczeństwa. Bliższe przyjrzenie się temu zagadnieniu prowadzi do wniosku, że algebra relacyjna jest językiem operatorów, które przyjmują relacje jako argumenty i zwracają je jako wynik.

Zalecana: