Databázové kandidátske kľúče sa niekedy stanú primárnymi klávesmi
Kandidátsky kľúč je kombinácia atribútov, ktoré sa môžu jednoznačne používať na identifikáciu záznamu databázy bez odkazovania na iné údaje. Každá tabuľka môže mať jedného alebo viacerých kandidátov. Jeden z týchto kandidátskych kľúčov je vybratý ako základný kľúč tabuľky. Tabuľka obsahuje iba jeden primárny kľúč, ale môže obsahovať niekoľko kandidátskych kľúčov. Ak je kandidátsky kľúč zložený z dvoch alebo viacerých stĺpcov, potom sa nazýva kompozitný kľúč.
Vlastnosti kandidátneho kľúča
Všetky kandidátske kľúče majú niektoré spoločné vlastnosti. Jednou z vlastností je, že počas životnosti kandidátneho kľúča musí atribút použitý na identifikáciu zostať rovnaký. Ďalšou je, že hodnota nemôže byť nulová. Nakoniec musí byť kandidátsky kľúč jedinečný.
Napríklad, aby sa jednoznačne identifikoval každý zamestnanec, spoločnosť môže používať číslo sociálneho poistenia zamestnanca. Ako vidíte, existujú ľudia s rovnakými krstnými menami a priezviskami, ale žiadni dvaja ľudia nemajú rovnaké číslo sociálneho poistenia.
Číslo sociálneho poistenia | Krstné meno | Priezvisko | pozície |
---|---|---|---|
123-45-6780 | Craig | jones | manažér |
234-56-7890 | Craig | Beal | spolupracovník |
345-67-8900 | sandra | Beal | manažér |
456-78-9010 | Trina | jones | spolupracovník |
567-89-0120 | sandra | kováč | spolupracovník |
Príklady kandidátnych kľúčov
Niektoré typy údajov sa ľahko dajú kandidovať:
- Medzinárodné štandardné čísla kníh - kódy ISBN jednoznačne identifikujú knihy a súvisiace médiá. Vydávanie kódov ISBN je prísne regulované priemyselnými vrátnikmi a publikácie spravidla nevyužívajú kódy ISBN.
- Čísla bankových účtov - Väčšina bánk nespracováva čísla účtov.
- Sériové čísla - napriek tomu, že sériové čísla nie sú v jednotlivých odvetviach riadené, v kontexte jediného dodávateľa by malo byť sériové číslo jedinečné.
- Čísla vodičských preukazov - tieto čísla nie sú zvyčajne duplikované. Avšak osoba, ktorá sa presťahuje zo štátu do štátu, môže mať viac ako jedno číslo DL.
- ID národného poskytovateľa - Lekári a ďalší licencovaní poskytovatelia zdravotníckych služieb majú aspoň jedno NPI, ktoré je pre nich jedinečné, vydané Ministerstvom zdravotníctva a ľudských služieb USA.
Avšak niektoré typy informácií, ktoré sa môžu zdajú byť dobrými kandidátmi, sa v skutočnosti ukážu ako problematické:
- Telefónne čísla - Väčšina operátorov recykluje telefónne čísla a jednotliví účastníci môžu mať niekoľko telefónnych čísel súčasne.
- Univerzálne cenové kódy - UPC sú jedinečné, ale vlastník UPC bloku môže recyklovať výrobky podľa želania.
- Zdravotné záznamy MRN sa zvyčajne vydávajú na úrovni nemocnice bez akéhokoľvek druhu vnútroštátnych pokynov
- Čísla sociálneho poistenia - aj keď sú teoreticky jedinečné, SSN sa recyklujú a podvody SSN sú dosť bežné, aby sa tento identifikátor stal problémom vo veľkých množinách údajov. (V kontexte zamestnávateľa, ktorý overuje SSN, táto výzva nie je problém.)