In informatica l'algebra relazionale e il collegato calcolo relazionale fanno parte dell'insieme di linguaggi che permettono di esaminare le query (interrogazioni) da effettuare nell'ambito della gestione/utilizzo di un database.
Si tratta di un linguaggio procedurale, cioè una descrizione della procedura da attuare per ottenere il risultato. Mentre il calcolo relazionale invece è un linguaggio dichiarativo, che permette di descrivere le proprietà del risultato invece che il modo per ottenerlo. Il risultato può essere calcolato sia sulle tuple (i singoli record che compongono la tabella) che sui domini (campo di applicazione della tabella). In matematica è una struttura algebrica, pertinente alla logica e alla teoria degli insiemi, ovvero è un ramo della logica del primo ordine (e degli insiemi) e si occupa di relazioni chiuse e operatori: gli operatori operano su una o più relazioni e danno sempre come risultato un'altra relazione.
Descrizione
Operatori dell'algebra relazionale
L'algebra relazionale ha 6 operatori di base, nessuno dei quali può essere omesso senza perdere in espressività, e diversi operatori derivati, che possono cioè essere definiti come combinazione di operatori primitivi.
Operatori fondamentali (di base):
- Unione (operatore binario)
- Differenza (operatore binario)
- Prodotto cartesiano (operatore binario)
- Selezione (operatore unario)
- Proiezione (operatore unario)
- Ridenominazione (operatore unario)
Operatori derivati (da quelli di base):
- intersezione (operatore binario)
- Join (operatore binario) in varie forme (theta-join, natural-join, ecc.)
- Divisione (operatore binario)
Indichiamo con r(R), la relazione r definita sullo schema R. R è un insieme di attributi.
Unione, intersezione, differenza
Dato che le relazioni sono degli insiemi ha senso definire su di esse gli operatori insiemistici tradizionali come unione, differenza e intersezione. L'unico vincolo è quello di avere delle tuple omogenee cioè definite sugli stessi attributi.
- l'unione di due relazioni r1 e r2 definite sullo stesso insieme di attributi X è indicata con ed è una relazione ancora su X contenente le tuple che appartengono a r1 oppure a r2,senza ripetizioni delle eventuali tuple ripetute.
- la differenza di r1(x) e r2(x) è indicata come ed è una relazione su X contenente le tuple che appartengono a r1 e non appartengono a r2.
- l'intersezione di r1(X) e r2(X) è indicata con ed è una relazione su X contenente le tuple che appartengono sia a r1 che r2.
Ridenominazione
L'operatore di ridenominazione, , modifica lo schema di una relazione,
cambiando i nomi di uno o più attributi. Quest'operazione è molto utile per ottenere delle tuple omogenee quando non lo sono anche se il campo semantico di applicazione della query lo è. Sia una relazione definita sull'insieme di attributi e sia un (altro) insieme di attributi con ordinamento per gli attributi in e un ordinamento per quelli in . Allora la ridenominazione contiene una tupla per ciascuna tupla in , definita come segue: è una tupla su e , per . La definizione conferma che ciò che cambia sono i nomi degli attributi, mentre i valori rimangono inalterati e vengono associati ai nuovi attributi.
Prodotto cartesiano
È definito solo nel caso in cui le relazioni non abbiano attributi in comune, e al contrario dell'omonimo operatore sugli insiemi, il risultato non è un insieme di tuple, ma un'unica tupla composta dalle due tuple delle relazioni originarie.
Logica proposizionale
Selezione
È un operatore unario e restituisce come risultato una relazione.
Chiamiamo "formula relazionale" un'espressione che mette in relazione attributi per mezzo degli operatori =,!= (diverso da),<,>,,. Sia r(X) una relazione sull'insieme di attributi X, e F una formula relazionale. La selezione di r rispetto a F, denotata da "S" F(r), è una relazione definita su X, contenente le tuple di r che rendono F vera, cioè la selezione da una tabella non è altro che l'insieme di righe che appartengono alla tabella e che soddisfano una serie di condizioni indicate nella selezione stessa.
Proiezione
L'operatore di proiezione effettua una modifica al grado della relazione a cui si applica. Il simbolo è a pedice del quale viene indicata la lista degli attributi che costituiscono la nuova relazione, tali attributi sono un sottoinsieme degli attributi della relazione originale.
La proiezione produce una relazione il cui schema è l'insieme degli attributi e la cui istanza è la restrizione delle tuple di sugli attributi .
Formalmente la proiezione elimina le tuple che dovessero risultare duplicate nella relazione finale, infatti istanze con presenza di tuple duplicate non sono ammesse dal modello relazionale.
Join
Il join è un'operazione binaria che si applica a due relazioni ed .
La funzione del join è unire tuple logicamente collegate delle due relazioni in un'unica tupla.
La relazione risultante ha come schema l'insieme degli attributi di R ed S, mentre l'estensione viene espressa come il prodotto cartesiano di R ed S seguito dalla selezione delle tuple che soddisfano la condizione di join.
L'operatore di join non è un operatore elementare dell'algebra relazionale ed è definito nel seguente modo: . Per il significato e la sintassi della condizione di selezione vedere l'operatore di selezione.
Nel caso che il criterio di selezione delle tuple sia determinato da un operatore di confronto (<,>,=,ecc.) si può parlare di theta-join. Un caso particolare del theta-join è l'equi-join, in cui si applica l'operatore di uguaglianza.
Nel caso si voglia eseguire un equi-join su attributi con lo stesso nome, si può ricorrere a un'operazione particolare chiamata natural-join. In presenza di due attributi uguali, viene rinominato l'attributo comune in una delle due relazioni, viene eseguito l'equi-join rispetto ai due attributi, e viene eliminata una delle colonne che risultano uguali. Nel natural-join, quindi, la condizione di join è implicita, e lo schema della relazione risultante è l'insieme degli attributi di R ed S meno uno degli attributi uguali.
Divisione
La divisione è un'operazione binaria che si applica a due relazioni ed , rispettivamente con schemi relazionali ed , dove è un sottoinsieme proprio di (e quindi sempre).
La relazione risultante, , è detta il quoziente della divisione di per e ha come schema , cioè l'insieme degli attributi di non compresi in . In essa saranno presenti tutte (e solo) le tuple tali che per ogni tupla di , la tupla risultante appartenga ad .
Più precisamente
Bibliografia
- Paolo Atzeni, Stefano Ceri, Piero Fraternali, Stefano Paraboschi e Riccardo Torlone, Basi di dati, 5ª ed., Milano, McGraw-Hill, 2018, ISBN 978-88-386-9445-5.
- Abraham Silberschatz, Henry F. Korth e S. Sudarshan, Database system concepts, Seventh edition, McGraw-Hill, 2020, ISBN 978-0-07-802215-9.
Voci correlate
Altri progetti
Collegamenti esterni