kategória | ||||||||||
|
||||||||||
|
||
A hagyományos adatfeldolgozásban elsösorban az index-szekvenciális file-okat használták. A nagyméretü, komplex rendszereknél több probléma is felvetödött.
Az index-szekvenciális file-ban az adatokat a leggyakrabban használt kulcsmezö 515h76f szerint tárolják, azonban szükség lehet rá, hogy az adatokat másféle rendezettség szerint dolgozzák fel. Ekkor vagy létrehoznak még egy file-t, ami a kívánt kulcs szerinti rendezettségü - ezzel redundánsan (többszörösen) tárolják az adatokat - vagy ragaszkodnak az egyszeres tároláshoz és az adatokat a feldolgozás elött rendezik, ekkor a feldolgozási idö növekedik meg jelentösen. A redundáns tárolásnak a hátránya a nagyobb tárfoglalás mellett az is, hogy nagyméretü adatfeldolgozó rendszerek esetén szinte lehetetlen a redundáns adatokat az aktualizálás azonos szintjén tartani. Például egy vállalati ügyviteli rendszerben egy dolgozó személyi adatai több helyen is szerepelnek (pl. munkaügyi rendszer, bérrendszer). Ha megváltozik a dolgozó lakcíme, elöfordulhat, hogy az egyik rendszerben még a régi lakcím szerepel, egy másikban pedig már az új.
A hagyományos feldolgozásnál a rekordstruktúra
leírását a program tartalmazza. Maga az állomány - a file-szervezéstöl
függetlenül - csak az adatokat tartalmazza, bitsorozatok formájában. Azt, hogy
egy rekordban található bitsorozatot hogyan kell mezökre bontani (hány bit
tartozik egy-egy mezöhöz), valamint, hogy egy mezö tartalmát milyen
típusú adatként kell értelmezni (pl. karakteres, vagy decimális, stb.) , meg
kell adni a feldolgozó program számára. Ezért
A hagyományos adatfeldolgozásban egy-egy
szervezetnél több egymástól független adatfeldolgozó rendszert használtak.
Egy integrált adatstruktúrának általában több
felhasználója van, de többnyire mindegyiküknek az adatoknak csak egy részére
van szüksége, söt sok esetben nem is szabad megengedni, hogy
Ezeknek a problémáknak és igényeknek a kezelésére új típusú software-re volt szükség, hiszen a hagyományos file-kezelö rendszerek nem tudták ezt biztosítani. Ezek az új típusú software-k az adatbáziskezelö rendszerek lettek.
Az 1960-as években jelentek meg az elsö adatbáziskezelö rendszerek, ezek a hagyományos file-kezelö rendszerekböl alakultak ki. Az elsö alkalmazási területei a bank-rendszerek, repülögép-helyfoglalás és a vállalti nyilvántartási rendszerek voltak.
1971-ben a Data Base Task GROUP (DBTG) konferenciát tartott, amelyen elkészítették a CODASYL (COnference on DAta System Languages) javaslatot. Ennek során kidolgozták az adatbázisokkal szembeni követelményeket. Ezek közül a legfontosabbak, hogy az adatbázisok az adatokat redundancia mentesen tárolják, az adatbázist használó programok adatfüggetlenek legyenek, egy idöben több alkalmazás is használhassa ugyanazokat az adatokat, továbbá kényelmes adatkezelési és adatvédelmi szolgáltatásokat nyújtsanak.
Az adatfüggetlenség azt jelenti, hogy az adat és az öt használó program független egymástól, azaz bármelyik megváltoztatható a másik módosítása nélkül. Ezt úgy érik el, hogy az adatok leírását, vagyis az adatbázisban tárolt adatok struktúráját is maga az adatbázis tartalmazza, nem pedig az alkalmazói programok, így az adatstrruktúra megváltozása nem feltétlenül igényel programmódosítást.
Az elsö adatbáziskezelö software-k a hierarchikus, majd a hálós adatmodellen alapultak.
1970-ben Ted Codd publikált egy cikket, amelyben egy új típusú adatbázismodellt vázolt fel. Eszerint az adatokat a felhasználó felé táblázatokban kellene megjeleníteni. Ezeket a táblázatokat relációknak nevezte, ebböl származik a modell neve is (relációs adatmodell). A gyakorlatban azonban sokáig nem sikerült elkészíteni ennek a modellnek megfelelö adatbáziskezelö software-t. Az IBM cég 1982-ben jelentette meg az elsö relációs adatbáziskezelö rendszert, ezután egyre több software-gyártó cég fejlesztett ki ilyen rendszereket. A relációs adtbáziskezelö rendszerek hamar népszerüvé váltak és szinte teljesen kiszorították a hierarchikus és a hálós adatbázisokat.
Az adatbáziskezelö rendszereket folyamatosan fejlesztik, hiszen ma már nagyon nagy mennyiségü adat tárolására és gyors feldolgozására van igény. Egy-egy nagyobb adatbázis akár több terabyte-nyi adatmennyiséget is tartalmazhat. A hagyományos adatok - karakterek, számok - mellett ma már egyre nagyobb az igény újabb adattípusok tárolására, mint például a multimédiás adatokéra. A képek, hangok videofelvételek általában sokkal nagyobb adatmennyiséget jelentenek, mint a hagyományos adatok. Egy másik új kihívás a világháló. Számos adatbázis már interneten keresztül is hozzáférhetö, és sok estben több adatbázisban található ugyanarra a dologra vonatkozó információ. Például egyre népszerübbek az interneten történö vásárlások, ehhez katalógusokat kell közzétenni a világhálón. Ha egy cikket szerertnénk megrendelni, nem árt, ha több katalógusban is utánanézünk és így választjuk ki a legmegfelelöbbet. Felvetödött a gondolat, hogy ezeket az információkat célszerü lenne egyetlen adatbázisba integrálni. Így alakultak ki az adattárházak, amelyek több adatbázis adatait tartalmazzák. Ha valamely adat megváltozott az eredeti adatbázisban, akkor a változtatást elvégzik az adattárházban is. Persze általában nem azonnal, hanem például éjszakánként frissítik az adattárház adatatit, amikor kevés felhasználó dolgozik az adatbázisokkal.
Az adatbázis fogalma
Adatbázisnak nevezzük a szükségtelen redundancia nélkül együtt tárolt, egymással kapcsolatban levö adatok együttesét, amelynek célja egy vagy több alkalmazás optimális kiszolgálása. Az adatokat úgy tároljuk, hogy azok függetlenek legyenek az öket használó programoktól. Az adatbázison belül közös és ellenörzött hozzáférés szolgál az új adatok felvitelére, a már felvitt adatok módosítására és lekérdezésére.
A teljes redundanciamentességet általában nem lehet megkövetelni, az adatok bizonyos ismétlödésére szükség lehet biztonsági okokból, vagy az elérés meggyorsítása miatt. Az adatfüggetlenség mértéke is adatbázisról adatbázisra változik.
Az adatbázisokban az adatokat meghatározott logikai struktúra szerint szervezik, ezt a struktúrát az adatbázis sémájának nevezik.
Az adatbázisok kezelését ellátó software-t adatbáziskezelö rendszernek (ABKR) nevezzük, angolul Data Base Management System - DBMS. Az adatbáziskezelö rendszer az adatokat file-okban tárolja, melyek rekordokból épülnek fel. Az adatbázist alkotó file-ok belsö struktúrája az adatbáziskezelö rendszer függvénye. Ezért az adatbáziskezelö rendszer tulajdonképpen egy bonyolult file-kezelö rendszer, melynek egyik alapvetö feladata a bonyolult adatstruktúrák hatékony kezelése.
Egy adatbáziskezelö rendszer legfontosabb feladatai:
Az adatbázis létrehozása
Az adatbázis adatainak karbantartása (módosítás, törlés, új adatok felvitele)
Az adatok visszakeresésének biztosítása
A minél nagyobb adatbiztonság elérése. Védje az adatokat az illetéktelen felhasználótól és a meghibásodásoktól, a lehetöségek szerínt szürje ki az adatbázisba bekerülö adatok közötti hibákat..
Szinkronizáció
Biztosítani
kell, hogy az adatbázis adataihoz egyidöben több felhasználó is
hozzáférhessen úgy, hogy az egyes felhasználó müveletei ne okozzanak hibát
a többi felhasználó munkájában. Bizonyos esetekben viszont azt kell
biztosítani, hogy amíg az egyik felhasználó dolgozik, a többiek ne férhessenek
hozzá az adatokhoz.
Az adatbáziskezelö rendszerhez tartozik egy adatbáziskezelö nyelv, amelynek segítségével az adatbázis felépíthetö, továbbá az alkalmazások készítöi megfogalmazhatják módosítási, illetve lekérdezési igényeiket. Ez a nyelv lehet önálló programozási nyelv, vagy pedig beágyazott (embedded) nyelv, amelynek utasításait más programnyelvekbe (host nyelv) beépítve használhatjuk, kifejezetten az adatbázis kezelésére. Az adatbáziskezelö nyelv legfontosabb utasításcsoportjai a következök:
adatdefiníciós nyelv, ez az adatbázis sémájának megadására szolgál
adatmanipulációs nyelv, segítségével vihetünk fel, módosíthatunk, vagy törölhetünk adatokat
lekérdezö nylev, amely az adatok visszakeresésére szolgál
Maga az adatbázis az adatokat és azok szerkezetének leírását tartalmazza. Az utóbbit szokás metaadatoknak is nevezni. Az adatbázis létrehozását, az adatok kezelését az adatbáziskezelö rendszer végzi. A felhasználók általában nem közvetlenül az adatbáziskezelö rendszerrel dolgoznak, hanem különbözö alkalmazások segítségével végzik az adatok felvitelét, módosítását, vagy visszakeresését. Ezeket az alklamazásokat programozók készítik valamilyen programnyelven. Az alkalmazások az adatbáziskezelö rendszernek adnak utasításokat, az adatokat csak az adatbáziskezelö rendszeren keresztül érik el.
Találat: 1517