online kép - Fájl  tubefájl feltöltés file feltöltés - adja hozzá a fájlokat onlinefedezze fel a legújabb online dokumentumokKapcsolat
  
 

Letöltheto dokumentumok, programok, törvények, tervezetek, javaslatok, egyéb hasznos információk, receptek - Fájl kiterjesztések - fajltube.com

 

Online dokumentumok - kep
  

Szöveges adatbazisok

számítógépes

Fájl küldése e-mail



egyéb tételek

 
A B/K szoftver
Egy operaciós rendszer bemutatasa
Klasszikus IPC problémak (processzus kommunikació)
Csomag alapú hang halózatok tervezése
Web-programozas
Betűtípusok
A C# BEMUTATÁSA
Import, export
Csoportosítas, kombinalas
Vonalak rajzolasa
 
 

Szöveges adatbázisok


Az eddig látott adatbázisokban az adatok szigorú szabályok szerint kerültek tárolásra, az adatok között meglévö összefüggések szerint. A szöveges adatbázisok ezzel szemben folyamatos, vagy bizonyos szempontok szerint tagolt szövegek összessége. A szöveges adatbázisok tipikus példái a könyvtári rendszerek. Egy könyvtári rendszerben nemcsak a könyvek, cikkek 757g64h íróját és címét kell tárolni, hanem a könyv tartalmának rövid ismertetését is, ezzel lehetöséget biztosítva a téma szerinti keresésre. A téma szerinti keresés során egy, vagy több tárgyszót adunk meg, és keressük azokat a dokumentumokat, amelyekben ezek a tárgyszavak elöfordulnak.

A legegyszerübb szöveges információ-visszakeresö rendszerek a kért szövegrészt a tárolt szövegek egyszerü végigolvasásával sorosan keresik meg. Ez nagy adatmennyiségnél igen lassú.


A visszakeresést lényegesen gyorsítja az indextáblák alkalmazása. Az indextábla a szövegekben elöforduló kulcsszavakat tartalmazza, minden kulcsszóval együtt tárolva azon dokumentum, vagy dokumentumok azonosítóját, amelyben szerepel.

Az indextábla felépítése történhet automatikusan, ekkor a felvitt szöveg minden szava kulcsszó lesz, kivéve a tiltott szavakat, melyeknek listáját egy külön file tartalmazza. Ezek általában a kötöszavak, névutók.

Az indextábla felépítése történhet úgy is, hogy a szöveg felvitelekor meg kell jelölni, hogy mely szavak legyenek kulcsszavak, vagy meg kell adni a kulcsszavak listáját. Ekkor csak a megjelölt szavak kerülnek az indextáblába.

Az indextáblák használata lényegesen megnöveli az adatbázis méretét, az adatok felvitele is lelassul, azonban a visszakeresés gyorsasága jelentösen megnö.


Példa indextáblára:       


Kulcsszó                      Dokumentumazonosító, elöfordulás

-------- ----- ------ ---

kritikus szakasz 10987(023),20345(345),30124(456)

kulcs 34098(112),45098(876)

kulcsszó 56789(154)

kurzor 34098(054),56798(178)

külsö adat                     56789(543)

külsö hivatkozás           20345(402),56798(254)

külsö megszakítás         10987(433),20345(186)


Az indextáblába célszerü a dokumentum azonosítója mellett az elöfordulási helyet is tárolni, hogy az egyes találatok közötti távolság gyorsan meghatározható legyen.

A keresés hatékonyságát tovább növeli az a lehetöség, hogy nem követeli meg a kulcsszavakkal a teljes hosszban való egyezést, így a különbözö ragozott alakokra nem kell külön keresést kérni.


További segítséget nyújt a szinonimaszótár. Ebben a tárgyszavak szinonimái (vele egyenértékü szavak) találhatók meg. Segítségével a keresést kiterjeszthetjük a keresett szó szinonimáira is. Ha a keresési feltétel megfogalmazásában ezt kérjük, akkor a rendszer a szinonimaszótár alapján automatikusan elvégzi a keresést a szinonimákra is.


A keresési szempontok összetettek is lehetnek. Keresési feltétel lehet több kulcsszó együttes elöfordulása, vagy több kulcsszó közül valamelyik elöfordulása a szövegben. A kulcsszavak együttes elöfordulásánál kiköthetö, hogy legfeljebb milyen távolságra lehetnek egymástól a szövegben, így csak azokat az elöfordulásokat kapjuk meg, amelyekben a keresett kulcsszavak egymással összefüggésben szerepelnek.


A rövid leírás mellett tárolhatók még egyéb információk is a dokumentumokról. Például egy könyvtári rendszerben a könyvek megjelenésének dátuma, a kiadó, stb. A keresési feltételben ezen adatokat is felvehetjük a szempontok közé. Így megfogalmazhatunk kombinált kereséseket, ahol a feltételek egy része a strukturált adatokra vonatkozik, a másik része pedig a szöveges adatokra. Például azon dokumentumokat keressük, amelyeket 1992 után adtak ki és az adatbáziskezelés szerepel bennük.

Léteznek teljes szövegü adatbázisok is. Ezekbe a tárolt dokumentumok teljes szövegét felviszik. Például rögzítették Goethe összes müvének szövegét és a Bibliát is. Ezeket az adatbázisokat föként a kutatók használják. Meghatározható például, hogy Goethe mely szavakat használta a leggyakrabban, vagy a Bibliában milyen gyakorisággal van szó húsételekröl, és milyen gyakran növényi ételekröl.

Nagyobb könyvtárakban már többnyire számítógépes nyilvántartást használnak. Ezek általában a könyvek rövid tartalmi kivonatát is tárolják, ezzel segítve a téma szerinti keresést. Számos számítógépes könyvtári rendszert alkalmaznak, ezek közül a TINLIB és az ALEPH könyvtárkezelö rendszert említjük meg.


Találat: 963