ARCHITEKTÚRÁK I

egyéb tételek

ARCHITEKTÚRÁK I.

Számítási modellek

70-es évek: Az IBM 370-nel a Neumann architektúrájú gépek korlátjuk széléhez értek, teljesítményüket nem lehetett már jobban növelni. Ezért az újdonságok kerültek elötérbe, mint a RISC architektúra, futószalag elv (pipeline), programnyelvek (konkurens parancsnyelvek, objektum orientált nyelvek). Ezek már a számítási modelljükben különböznek.

A Számítási modell fogalma: A számításra vonatkozó alapelvek absztrakciója.

Jellemzöi:

Min hajtjuk végre a számítást?
Hogyan képezzük le a számítási feladatot?
Mi vezérli a végrehajtást?

Adatokon hajtjuk végre a számítást.

Fejlesztési kronológia:

A számítási modellek osztályozása:

Adatalapú számítási modell

Neumann féle számítási modell

adatfolyam számítási modell piaci megvalósítás

applikatív

Objektum alapú számítási modell 141h71b 141h71b 141h71b 141h71b 141h71b 141h71b bonyolultság

Predikátum - logikai számítási modell (prolog)

Tudás alapú számítási modell 141h71b kísérleti stádium

Hibrid számítási modell

Adatalapú számítási modell:

Az adatokat típusokba soroljuk (elemi és összetett). Az elemi adattípusok meghatározzák az adat értelmezési tartományát, érték készletét, az értelmezett müveletek halmazát. Pl.: integer (16 bites) esetén ÉT: -32768 - +32767, ÉK: egész értékek, értelmezett müveletek: +, -, ×, ÷.

Neumann féle számítási modell:

adatmanipuláció

utasítások

Min hajtjuk végre a számítást:

Adatokon.

deklarált változók

Az adatokat a változók képviselik.

Az architektúra biztosítja, hogy a változók

vezérlést átadó utasítás

korlátlan számban változtathassák értékeiket.

Hogyan képezzük le a számítási feladatot:

Adatmanipuláló utasítások sorozatával.

Mi vezérli a végrehajtást:

Az adatmanipuláló utasítások implicit szekvenciája

Az explicit vezérlést átadó utasítás.

Nem számolja, csak egyesével tudja növelni magát. Az adat elejét tudja értelmezni move utasításként.

Programnyelvek: Imperatív (parancs) nyelvek, pl.: Pascal, C, Basic, Fortran.

Architektúra: Neumann féle architektúra.

adatfolyam számítási modell:

Min hajtjuk végre a számítást: Adatokon.
Hogyan képezzük le a számítási feladatot:

Bemenö adatok halmaza.

Adatfolyam gráffal:

a) Csomópontok: müveletvégzök.

b) Élek: input/output lehetöségek, ahol az adat áramlik.

Pl.: Z=(X+Y)×(X-Y)

141h71b X Y bemenö adatok halmaza

141h71b + - párhuzamos müveletvégzés

141h71b 141h71b idömegtakarítást eredményez (33%)

141h71b × a Neumann féle szekvenciálisan dolgozott

141h71b Z

Mi vezérli a végrehajtást: Adat.
Stréber modell:

1. Még nincs operandus.

2. Az egyik operandus megjelent.

3. Összes operandus megérkezése → Müveletvégzés. 141h71b @

4. Megjelenik az eredmény.

Az utolsó operandus megjelenése indítja el a müveletet.

Lehet akárhány operandus, akár több száz is.

Programnyelv: Sisal.

Architektúra: The Manchester Dataflow Machine

Neumann féle számítási modell	adatfolyam számítási modell
1. Közös memória (adat + program)	Müveletvégzöben "tárolhatóak" az adatok
1. Változó	Egyszeri értékadás (a bejött adat elveszik)
2. Adatmanipuláló utasításokkal	Adatfolyam gráffal
3. Implicit szekvencia	Adatvezérelt
3. Explicit vezérlésátadás	Nincs PC, nincs vezérlési szekvencia

A Pentium processzorokban a CISC magban van adatfolyam.

Architektúra

1964 Amdahl: Azon ismeretek összessége, amelyeket egy alacsony szintü programnyelvben programozónak ismernie kell, hogy hatékony programot írjon, pl.: regiszterek, memória, címzési módok, utasításkészlet.

1970 Bell: szinteket rendelt az architektúrához

P.M.S. (processor, memory, switches)

Programozási szint:

Magas színtü programnyelvek

Alacsony szintü programnyelvek

Logikai tervezöi szint

Áramköri szint

A külsö jellemzök, a belsö felépítés és a müködés összessége.

Adott absztrakciós szinten (L) a számítási modell (M), a specifikáció (S) és az implementáció (I) összessége.

Számítási modell: _L

Logikai architektúra + Fizikai architektúra

külsö 141h71b 141h71b belsö

absztrakt 141h71b 141h71b konkrét

ISA (Instruction Set Architecture) MA (Microarchitecture)

Logikai architektúra: _L

Adott absztrakciós szinten a fizikai architektúra elvonatkoztatása.

A fekete doboz külsö megjelenése, viselkedése adott absztrakciós szinten.

A processzorszintü logikai architektúra részei:

Adattér.

Adatmanipulációs fa.

Állapottér.

Állapotmüveletek.

A fizikai architektúra részei: _L

A logikai architektúra megvalósítása adott absztrakciós szinten.

Adott absztrakciós szinten a fekete doboz belseje.

A processzorszintü fizikai architektúra részei:

Müveletvégzö

Vezérlö

Memória

Sínrendszer

I/O rendszer

Megszakítási rendszer

Egy korszerü számítógép szintjei (Tannenbaum, 6 db):

Alkalmazások 141h71b 141h71b Word, Excel

5. Problémaorientált nyelvek 141h71b Pascal, C

4. Assembly szintü nyelvek

3. Operációs rendszerek 141h71b operációs rendszerek

2. Utasításrendszer architektúra (ISA) architektúra

1. Mikroarchitektúra (MA) 141h71b architektúra

0. Digitális elemek szintje 141h71b digitális technika

Áramköri szint

Adattér

A processzor által manipulálható tér.

Adattér
Memóriatér	Regisztertér
Nagyobb	Kisebb
Lassúbb	Gyorsabb
Olcsóbb	Drágább
Processzoron kívül (külön lapkán)	Processzoron belül
Közös az I/O térrel	Mindig önálló

Memóriatér:

A legfontosabb jellemzöje a tárolási kapacitása.

Címtér:

a) Modell címtere: címsín szélessége határozza meg

b) Implementáció címtere: pénztárca

A valós memóriatér fejlödése:

a) 40-es évek: néhány száz szó.

b) 1950 IAS: 10 bites címsín, 2¹⁰=1024 szó.

c) 1964 IBM 360: 16 Mbyte.

Virtuális tár

a) 1960-ban jelent meg az ötlete s az IBM 370-es gépcsalád vitte sikerre.

b) Alap jellemzöi:

1. kétféle címet értelmezünk:

a. valós cím (ezt látja a processzor)

b. virtuális cím (programozó)

Virtuális tér	Valós címtér
Nagyobb	Kisebb
Lassúbb	Gyorsabb
Háttértárolón helyezkedik el	Alaplaphoz illesztve, félvezetö lapkán
Programozó látja	Processzor látja
Várakozik a program	Itt fut a program

2. Létezik egy olyan, a programozó számára transzparens mechanizmus, mely:

a. Az éppen futó program számára szükséges program- és adatrészeket behozza a virtuális tárból a valós tárba, illetve

b. Az éppen futó program számára nem szükséges program- és adatrészeket kiviszi a valós tárból a virtuális tárba.

3. Létezik egy olyan, a felhasználó számára transzparens mechanizmus, mely a programozó által használt virtuális címeket a végrehajtási (execution) fázisban lefordítja valós címekké.

Valós címek

Virtuális címek

2. pont

transzparens

141h71b 141h71b 141h71b mechanizmus

3. pont

2. Két eredmény esetén csak az egyiket tudta tárolni (pl.: osztásnál a hányados és a maradék).

2. Új programozói stílus: a regiszter operandusú müveletek számának maximalizálása.

Megszakításkor a futó program kontextusát le kell menteni annak érdekében, hogy a megszakítás feldolgozása után azt visszatöltve a program futása folytatódhasson.

Többfeladatos és többfelhasználós környezetben igen sok megszakítás lép fel. A kontextus memóriába való mentése lassú → gyorsítás többszörös regiszterkészlet révén.

Paraméterátadásos eljáráshívásoknál a paraméterátadás csak memórián keresztül történhet, így nem gyorsít.

A programozás módszertana sem ajánl nyolcnál több egymásba ágyazott eljárást, mivel az ennél több már nehezen tekinthetö át.

A compiler minden eljáráshoz hozzárendel egy változó hosszúságú aktiválási rekordot (regiszterkészlet).

A SP és a relatív távolság megadásával bármely adat közvetlenül elérhetö a stack-cache-ben.

Az aktiválási rekordok számának csak a stack cache fizikai mérete szabhat határt.

egyrészt a lehetséges adattípusokat, müveleteket, operandustípusokat és címzési módokat.

másrészt egy alfája pedig megmutatja egy adott modell által megvalósított lehetöségeket.

technológiai korlát: a lapkaméret adott, ezért lebegöpontos .
koprocesszorkészletként alakították ki.

gazdasági korlát (pl.: drága a bövítés, a lebegöpontos rendszer több millió Ft.)

Tudományos-müszaki célú konfiguráció: volt benne lebegöpontos aritmetika.

Összetett adattípusok (adatstruktúrák vagy adatszerkezetek): elemi adattípusokból épülnek fel, pl.: tömb, verem, fa, sor.

A müveleteket pontosan kell definiálni, beleértve a kivételek kezelését is (pl.: a nullával való osztás).

ALU: Arithmetical Logical Unit - müveletvégzö (utasítást is képes továbbítani).

PC ← PC + 1 - következö feldolgozandó utasításra mutat, a +1 egységre utal, 2, 4 byte lehet.

feltétlen vezérlésátadás (ne a soron következö utasítást végezze, hanem amit mi megadunk):

Az op4 a következö utasításra mutat, csak néha van nagy ugrás. Neumann szerint PC és címregiszter legyen az op4 helyett.

Az aktuális utasítás eredményének mentésével párhuzamosan betölthetjük a következö utasítás bemenö operandusait.

Neumann szerint: Az aktuális müvelet eredménye tipikusan a következö müvelet egyik bemeneti operandusa.

Memória- vagy regisztertakarékosabb, kiküszöböli a Neumann által említett hátrányt.

Az a forrásoperandus, ahol az eredmény képzödik értékét veszti, ha késöbb szükségünk van rá, a müvelet elött ki kell menteni.

Az AC aktuális tartalmához hozzáadjuk az utasításban szereplö operandust: ADD[102]

Pl.: 1951 IAS (Neumann gépe), csak az 50-es 60-as években készült ilyen processzor.

Minden bithelyiérték jelentéssel rendelkezik, pl.: 0 negatív, túlcsordulás (flag).

1973 → IBM 370-es gépcsaládnál bevezetik a PSW-t (Program Status Word): megszakításoknál a PSW-t mentik el.

Szinkron: egy elektronikus óra meghatározott idöközönként órajelet ad. Minden elemi müvelet órajelre kezdödik. Az elemi müveletek különbözö ideig tartanak → idöveszteség. Megvalósítása egyszerü és olcsó. Van olyan jel, ami nem hajtódik végre egy órajel alatt, ezt a gép lekezeli.

Aszinkron: minden elemi müvelet befejezése egyben jelzés a következö müvelet megkezdéséhez. Az elemi müveletek befejezésének észlelése bonyolult és drágán valósítható meg. Az elemi müvelet befejezésének észlelése is idöt igényel → itt is van holtidö.

A ma piacon lévö processzorok szinkron vezérlésüek, ~3 GHz a frekvenciájuk.

Rejtett regiszterek: az adatfeldolgozási technológiához szükséges puffer regiszterek.

A müveletvégzö egységen belül nem értelmezett a címsín, hisz a memória hozzáférést a vezérlö végzi.

Az összeadás alapvetö müvelet, hiszen erre vezetjük majd vissza a szorzást, a kivonást és az osztást. Tehát a sebessége alapvetöen meghatározza a processzor sebességét.

Figyelembe veszi a bejövö átvitelt (megvalósítása két félösszeadóból).

C_out=ABC+ ABC+ ABC+ ABC+ ABC+ ABC=(A+A)BC+(B+B)AC+(C+C)AB = =BC+AC+AB=AB+(A+B)C_in

Megjelenésének oka az, hogy az összeadandók tipikusan n bit hosszúságú regiszterekben helyezkednek el. n fokozatosan növekszik (ma: 32/64).

A kimenö átvitelt tárolóba vagy késleltetöbe helyezzük, hogy a következö bitpároshoz (összeadáshoz) megfelelö idöben érkezzen.

Ha az egybites teljes összeadó müveleti ideje t, akkor az n-bites összeadási ideje: T=n×t.

N: Az egybites teljes összeadók számát megtöbbszörözzük → n-bites párhuzamos összeadóra.

Igen komoly beruházás árán (egy darab helyett n db egybites teljes összeadó) csupán hullámzó teljesítményt értünk el. Az ok: meg kell várni az átvitel terjedését.

melyek elöre ismertek, de nem függ az elözö bithelyiértékeken keletkezö átviteltöl.

Amennyiben egy fokozat végrehajtási ideje d, akkor egy bithelyiérték átviteli idejének meghatározása: T=3d

2. Az egybites teljes összeadókat kiegészítjük a P és a G meghatározásához szükséges kapukkal (vagy valamint és kapuk)
A vagy kapu bemeneteinek száma technológiai korlátba ütközik, ezért max. 8 bithelyiértékre alakítható ki a CLA.

A kivonás csak akkor ad helyes eredményt, ha a nagyobb számból vonjuk ki a kisebbet. → Minden kivonást megelözöen komparálnunk kellene, ezért lassúbb.

A kivonó áramkörök megvalósításával megduplázódik a müveletvégzö helyfoglalása, a lapka mérete pedig korlátozott.

b) Hátulról az összes nullát és az elsö egyest leírjuk, a többit invertáljuk: 010010011000-ból 101101101000 lesz.

Az ideális az lenne, ha tudna összeadni is → megoldása vezérelhetö TRANS egységgel:

Minden müveletvégzönek ismernie kell az összeadást, az invertálást és a léptetést, de nem kell tudnia a szorzást és az osztást.

a) Olcsó processzor, aminél alacsonyszintü nyelven írt rutin végzi a szorzást és az osztást.

b) Középárú processzor, aminél mikroprogram végzi a szorzást és az osztást.

c) Drága processzor, aminél áramköri úton megvalósított a szorzás és az osztás.

A bináris szám hosszabb, mint a decimális, ezért a ciklus többször fut le.

A szorzó és a szorzandó egy-egy regiszterben helyezkedik el, ezért az eredmény két regiszterben képzödik.

Legyen egy regiszterünk három helyiértékü, a szorzat kisebb helyiértékei keletkeznek a szorzó helyén:

Bitcsoportokkal való szorzás: A szorzó helyiértékeit nem egyesével, hanem csoportokban kezeljük, így a csoportokat léptethetjük, ami gyorsabb.
Pl.: kettes csoportokban:
00 - kettöt léptetünk balra.
01 - a gyüjtöhöz hozzáadjuk a szorzandó egyszeresét és kettöt léptetünk balra.
10 - a gyüjtöhöz hozzáadjuk a szorzandó kétszeresét és kettöt léptetünk balra.
11 - a gyüjtöhöz hozzáadjuk a szorzandó háromszorosát és kettöt léptetünk balra.

Bináris számok esetén az összeadási ciklus annyiszor fut le, ahány egyes van a szorzóban (nulla esetén csak léptetünk).

Itt minden kivonás automatikus (nincs komparálás, ami lassú). Mivel nem kell minden kivonás elött komparálni, csak a gyors elöjel flag vizsgálatot végezzük, a két felesleges müvelet (hozzáadás +48 és szorzás) ellenére gyorsabb.

digitális jelfeldolgozásához digitalizálni kell analóg digitális (A-D) konverter

A leképezendö hanghullám minimális és maximális értékhez hozzárendeljük az értelmezési tartományunk minimális és maximális értéket.

Példán keresztül: Egy 50kHz-es mintavétel azt jelenti, hogy másodpercenként 50000 mintát veszünk az adott hullámból (minden egyes mintánál az amplitúdó értékét tároljuk el).

Egy másodperc hanganyag tárolási igénye audio CD, 16 bites felbontás, sztereó esetén:

44000 minta×2 byte felbontás×2 a sztereó miatt = 176000 byte/sec ~ 170 kbyte/sec

A fénykép és a festmények analóg formátumúak, hiszen a fények, árnyékok és színek folyamatos átvitelével írhatók le.

A képeket képpontokra (pixel) bontjuk. Minél sürübb a rácsszerkezet, annál jobb minöségü képet kapunk a digitalizálás során. Minél kisebb egy pixel, annál jobb a leképezés. Pl.: 800×600; 1280×1024

Minden szín leírható három szín összetételeként, tehát minden pixelhez három darab színkódot kellene hozzárendelni, de helyette ezeket egyetlen vektorrá kódolták.
Pl.: 000 → 0, 001 → 1, 010 → 2 .

3 byte: 2²⁴ féle szín (true-color) (az emberi szem ennyit nem tud megkülönböztetni, azért jó a sok szín, mert a számítógép ezt is tudja értelmezni)

4 byte: a negyedik byte az úgynevezett alfa csatorna, az effektek jelzésére szolgál (pl.:

A képfeldolgozás feladata: Nagy tömegü fixpontos adat tárolása, továbbítása, feldolgozása.

Hagyományos feldolgozás:
pl.: 2 kép összeadása a 800×600-as felbontás mellett

2. A 2. kép 1. byte-ját hozzáadjuk az AC-hoz, az eredmény az AC-ban keletkezik.

3. Az AC tartalmát lementjük az eredmény memóriaterületre.
Ez a ciklus 480000-szor fut le. (minden bájtra)

Több adattal ugyanazt az utasítást hajtja végre, ~ 8-szoros gyorsítást eredményez, 60000-szer fut le a ciklus.

az általános célú processzorba beleintegrálják a multimédia feldolgozó egységét.

a. Ezek mindegyike 64 bites, ami megegyezik a processzor belsö sínjének szélességével.

b. Fajtái:
pakolt byte: 8 db 8 bites = 64 bit,
pakolt félszó: 4 db 16 bites = 64 bit,
pakolt szó: 2 db 32 bites = 64 bit.

2. Új utasítások bevezetése
A négy aritmetikai müvelet (+,-,×,÷) és a logikai müveletek mindhárom új adattípushoz.

1. Az Intel nem akart új regisztereket bevezetni az új adattípusokhoz, hanem a 80 bites lebegöpontos regisztereket használja a 64 bites pakolt adattípusok feldolgozására.

2. Egy évre rá az MMX müveletvégzöket 2-re növelték, így a ciklusok száma 30000-re csökkent.

A lebegöpontos ábrázolás kialakulásának oka a fixpontos ábrázolás következö hiányosságai:

A törtérték ábrázolásának pontatlansága, pl.: 7/4=1.
Amennyiben a kettedes pontot a regiszter végére helyezzük, akkor 7/4=1, ami nem elégíti ki a gyakorlati igényeket. Ha több a kettedes pont utáni hely, akkor kevesebb jut az egész számok ábrázolására.

Ezen hátrányokat küszöböli ki a sokkal bonyolultabb lebegöpontos ábrázolás, itt a számokat hatványkitevös formában írjuk fel:

1933-ban Konrad Zuse elkészítette a Zuse-3 nevü jelfogós számítógépet, melyben alkalmazta a lebegöpontos ábrázolást.

b) A számítások bonyolultak bonyolult a müveletvégzö és annak vezérlése

b) Szöveggel: A törtpontot mindig az elsö értékes számjegy elé tesszük a mantisszában:

2. Vagy a lehetö legnagyobb számot vagy elöjeles végtelent ábrázol. Azért van a két végén (n-1), mert az n fenn van tartva a végtelen jelzésére.

Denormalizált szám: Szabály szerint nem ábrázolhatom a 0,04-et (0 0,04 0,1), de egy flag helyiértéket hozzárendelek, és azzal jelzem, hogy ez egy denormalizált szám.
Verseny van a processzorgyártók között a pontosság miatt, ezért a mai architektúrák alkalmazzák.

Nulla környéki számok: Amennyiben a mantissza nulla, akkor elvárt az architektúrától, hogy a karakterisztika is nulla legyen.

Pontosság: Három helyiérték áll rendelkezésre a mantissza számára a regiszterben. Ábrázolni kell a 0,1234 mantisszát. Ekkor csak a 0,123 ábrázolható, s ha pl. a karakterisztika 10⁶ (0,123400), akkor a pontatlanság 400 veszteséget okoz. Konklúzió: A pontosság függ a mantissza hosszától.

Mantissza esetében a normalizálás szabálya kettes számrendszerben 1/2≤M<1. A kettedes pontot az elsö értékes jegy elé kell tennünk, annak tehát nincs információtartalma.

Ezért az operatív tárba vagy háttértárba való kiírás elött a rejtett bitet balra léptetjük és jobbról beléptetünk egy értékes helyiértéket. A mantissza hossza ezáltal 1 bit helyiértékkel nö, így növekszik a pontosság.

Az operatív tárból vagy háttértárról való beolvasás során a processzoron belül helyreállításra kerül a rejtett bit, így a beolvasott adat feldolgozásra kész formára alakul.

A Zuse-3 (1933) már alkalmazta a rejtett bitet, és napjainkban is valamennyi piacon lévö architektúra alkalmazza.

A lebegöpontos számok mantisszáját a processzoron belül hosszabb formátumban tároljuk, mint az operatív tárban.

Amikor az eredményt normalizáljuk, és jobbról további helyiértékeket beléptetünk, akkor az örzöbitek lehetövé teszik, hogy ezek értékes helyiértékek legyenek.

A rejtett bit balra kiléptetésekor így jobbról értékes bit kerül beléptetésre.

Mantissza kódolása: A mantissza a gyakorlatban mindig kettes komplemens formában tárolt.

b) A karakterisztikával csak léptetést, összeadást és kivonást lehet végezni, s ez többletes kóddal is helyesen elvégezhetö.

Cél: a különbözö architektúrák közti adatszintü kompatibilitás megteremtése.

Rendszerszintü szemlélet, azaz nem írták elö a gyártóknak, mit valósítsanak meg hardver, és mit szoftver úton.

Nem valamelyik gyártó által kialakított megoldást fogadták el, hanem valamennyi architektúra lebegöpontos megoldásából összegyüjtötték a legjobbakat.

A szabvány 1985-ben jelent meg, az elsö gyakorlati megvalósítása 1981-ben jelent meg.

a) A szabványos formátum az operatív tárban illetve a háttértárolón alkalmazott formátum ezt pontosan beszabályozták.

b) A kiterjesztett formátum a processzoron belül alkalmazott formátum → ennek a szabályozása igen laza.

A szabvány csak az egyszeres pontosság megvalósítását írja elö, a kétszeres pontosság megvalósítása opcionális.

Egyszeres pontosság: rövidebb adat, kisebb memóriaigény, gyorsabb feldolgozás, nem nagyon pontos eredmény.

Kétszeres pontosság: hosszabb adat, nagyobb memóriaigény, lassabb feldolgozás, pontosabb eredmény.

Az utóbbi kettöt az intervallum algebrában használjuk.
Kétszer hajtjuk végre a számítást:

Amennyiben a két eredmény közötti különbség a számításunk szempontjából kicsi, akkor az eredmény elfogadható.

Amennyiben nagy, elemeznünk kell a programot (pl.: részeredményeket ne írjunk be a memóriába) vagy magát az architektúrát.

Mind az egyszeres, mind pedig a kétszeres pontosság megvalósításra került.

Kiterjesztett formátum: 80 bit hosszú (1, 15, 64), a programozó dönti el, hogy ezt egyszeres vagy kétszeres pontossággal írja ki az operatív tárba vagy a háttértárolóba.

Az Intel 80486DX-töl már közös lapkára integrálták az általános célú és a lebegöpontos processzort.

A 100-szoros növekedés a hardver úton megvalósított lebegöpontos feldolgozás eredménye.

A 3-szoros pedig a futószalagos feldolgozás és a kétszeres órajel eredménye.

A= m_Ar^ka 141h71b +0,95×10⁴ törtpontot ciklikusan léptetetem jobbra/balra.

Algoritmus: A mantisszákat összeszorozzuk, a karakterisztikákat pedig összeadjuk.

Algoritmus: A mantisszákat elosztjuk, a karakterisztikákat pedig kivonjuk egymásból.

a) Mind a mantisszát, mind a karakterisztikát külön-külön regiszterekben helyezzük el.

Míg a mantissza egységnek ismernie kell a szorzást és osztást is, a karakterisztika egységnek elegendö az összeadást és a kivonást ismernie.

A szük keresztmetszetet a mantissza egység jelenti (a szorzás, osztás miatt), mivel a karakterisztika egység az összeadást és kivonást gyorsan el tudja végezni. A gyorsítást a mantissza egységnél kell végezni.

Az egyenesekkel és görbékkel határolt objektumok geometriai jellemzöikkel leírhatók.

Egy kép igen sok objektumra (sokszögre, háromszögre) bontható egy átlagos kép objektumainak száma ~20000.

Miután a számítógép a geometriai jellemzök alapján meghatározza a ~20000 objektumot, a színek valósághübb átmenete érdekében egy úgynevezett textúrát alkalmaz.

b) Az atmoszférikus sajátosságok is megvalósításra kerülnek, azaz a közelebb lévö tárgyak élesebbek, a távolabbiak kékesebbek és elmosódottabbak.

Sok 3D film készül, ahol minimum 15 képet kell vetíteni másodpercenként annak érdekében, hogy folyamatosnak láthassuk.

Pl.: képenként 20000 objektummal számolva 20000×15=300000 obj/sec feldolgozási sebesség szükséges.

1985 óta elöször új regisztereket vezetett be az Intel: 8 db 128 bites regisztert.

Megszakítás esetén az új regisztereket is menteni kell, ezt elöször a Win98 operációs rendszer végzi.

A miniatürizálás és a fajlagos árcsökkenés eredményeként a jelenleg kereskedelmi forgalomban lévö processzorok mindegyike hardver úton megvalósítja.

A lebegöpontos ábrázolásnál a mantissza, karakterisztika formátuma lényegesen pontosabb, de nem teljesen.

A tízes számrendszerböl a kettes számrendszerbe a számokat átszámítjuk, ezzel szemben a tízes számrendszerböl a BCD-be a számokat átkódoljuk.

A kódolás egyértelmü megfeleltetést jelent.
Pl.: 12_D=1100_B=0001 0010_BCD (átszámítás és átkódolás)

a) Zónázott: Minden byte kisebb helyiértékü tetrádjában helyezkedik el a BCD szám, a nagyobb helyiértéküben pedig a zóna:

A zóna értéke jellemzöen nyomtatható karakterre egészíti ki a BCD értékét. Azaz ASCII esetén általában 3 (Intel), EBCDIC esetén általában F (15). Általában nem lehet ezzel a formátummal számítást végezni (pl.: VAX, IBM), kivéve Intel.

2. A további 9 bájtban 18 db BCD szám helyezkedik el:
-9.9-töl +9.9-ig (18 db 9-es lehet).

b) Nagyobb tárigény: a 16-os értékkészletböl csak tizet használ ki, tehát 40% kihasználatlan, pl.: 12_D=1100_B=0001 0010_BCD 8 biten ábrázoljuk.

A formátumok között a szükséges értelmezési tartománynak megfelelöen válasszunk (a lehetö legrövidebb formátumút).

Egész számok esetén teljesen pontos: if a=1 csak fixpontos illetve BCD esetén alkalmazható, lebegöpontosnál nem.

A lehetöségek közül csak indokolt esetben válasszuk a kétszeres pontosságút, mert annak számítása lassabb.

A karakteres müveleteket általában az általános célú müveletvégzö végzi.

Elöírjuk a módosító áramkör számára, hogy most éppen milyen módosítást hajtson végre. (Pl.: léptetés, összeadás.)

A mai processzorokban tipikusan több száz olyan vezérlési pont van, amit vezérelni kell.

a) Mikroutasítások, melyek meghatározott vezérlövonalat, vagy -vonalakat aktiválnak.

b) A gépi kódú utasítások végrehajtása mikroutasítások sorozatával érhetö el.

c) A hagyományos (Neumann-elvü) számítógépet tekinthetjük egy makroszámítógépnek, ezen belül helyezkedik el egy mikroszámítógép mikroutasítássokkal, mikroprogrammal.

a) A mikroprogramot tároló Control Memory-ban cserélhetjük, változtatjuk magát a mikroprogramot.

a) A gépi kódú utasításoknak a müveletikód része - megfelelöen kódolva - beírásra kerül a CMAR-ba.
Megfelelö kódolás: Az adott gépi kódú utasítás (pl.: add) végrehajtását elemi müveleti szinten végigvezérlö mikroprogram kezdöcíme.

b) Ez a cím beírásra kerül a dekóderbe. Az ily módon kiválasztott mikrotasítás

1. a megfelelö vezérlövonalak meghatározott ideig aktiválásra kerülnek, majd

2. a feltétel igaz vagy hamis voltától függöen vagy az elsö vagy a második cím kerül letöltésre a CMAR-ba.

Feltétel-kiválasztó mezö: Tipikusan azt jelenti, hogy melyik flag-et teszteljük.

Ugrási cím: Amennyiben a feltételes ugrásnál a feltétel igaz, akkor ez a cím kerül az MPC-be.

a) Az MPC által kijelölt, következö végrehajtandó mikroutasítás a CM-böl eljut a CMDR-be.

b) Meghatározott ideig aktiválásra kerülnek a mikroutasítás vezérlörésze által kijelölt vezérlövonalak.

a) Meghatározott ideig aktiválásra kerülnek a mikroutasítás vezérlörésze által kijelölt vezérlövonalak.

b) A feltétel kiválasztó mezö által meghatározott külsö feltétel kiválasztásra kerül, s annak igaz vagy hamis voltától függöen

1. vagy a végrehajtás alatt álló mikroutasítás ugrási cím mezöjének tartalma felülírja az MPC tartalmát,

2. vagy a MPC inkrementálva határozza meg a következö végrehajtandó mikroutasítás címét.

Míg a Neumann féle makroszámítógépben együt tároljuk a programot és az adatokat, a mikroszámítógép mikroprogram-tárában nincs adat, csak mikroutasítás. Ezért:

b) a korszerü mikrovezérlö inkrementálási képessége miatt MPC alkalmazható.

a. A Wilkes-féle modellben a mikroutasítás tartalmazza a következö végrehajtandó mikroutasítás címét.

a. Az ugrási címtér rövidebb, mint a tár címtere. A tár címtere pl.: 1024 (10 bit), ugrási címtér 256 (8 bit).

c. Az ugrási cím mezöt viszonylag ritkán hasznosítják, ezért nem ugrás esetén vezérlömezöként is használható lehet.

d) Kétszintü mikroutasítás (Motorola): Elönye, hogy több mikroutasításban is szerepelhet ugyanaz a vezérlörész, viszont csak egyszer tároljuk.

Ezt 21 változó hosszúságú vezérlömezöre osztották:

21 darab egymástól függetlenül is müködöképes hardver egységet alakítottak ki, tehát elvben maximum 21 egység müködet párhuzamosan.

3. 65-67. bit vezérli az ALU jobb oldali bemenetét, azaz ezek jelölik ki, mely regiszterböl kerüljön betöltésre az egyik operandus.

4. 68-71. bit határozza meg, hogy az ALU milyen müveletet hajtson végre. Lehetöségek: fixpontos vagy BCD összeadás a bejövö és a kimenö átvitel különféle kezelésével.

2. Hipotézis: 2⁷=128 azaz 7 biten kódolhatjuk az értékeket. ez az elve a vertikális vagy függöleges mikroutasításoknak.

Mai gyakorlat: hibrid változat:

A gyakran használatos vezérlések horizontálisak, míg a ritkábban használatosak vertikálisak Kódoltak, dekóderen keresztül aktiválják a vezérlövonalakat (idöveszteség)

Monofázisú mikroutasítások: egy mikroutasítás végrehajtási ciklus megegyezik az óra ciklussal.

Polifázisu mikroutasítások: egy mikroutasítás végrehajtási ciklus több óraciklus alatt hajtódik végre egy mikroutasításon belül elemi müveleti szekvenciákat írhatunk le. Pl.: r₁ f(r₀)
Végrehajtás menete:

b) Az r₀ regiszter kimenetét rákapuzzuk az f módosító áramkör bemenetére.

c) Meghatározzuk, hogy az f módosító áramkör milyen módosítást hajtson végre.

d) Az f módosító áramkör kimenetét rákapuzzuk az r₁ regiszter bemenetére.

Következtetés: Mivel a huzalozott vezérlés esetében nem értelmezett a mikroutasítás lehívása, ezért a huzalozott vezérlés mindig gyorsabb.

Amennyiben mikroprogramozott vezérlés mellett döntünk, akkor a gyors vezérlés érdekében

a) Amíg a CMDR0-ból történik a vezérlés, addig a CMDR1-be lehívjuk a következö végrehajtandó mikroutasítást.

Szükség lehet arra, hogy bizonyos vezérlövonalak több, mint egy óraütem alatt legyenek aktívak. (pl.: adatátvitel)

Ekkor a vezérlörészt egy regiszterbe mentik és onnan történik a vezérlés.

A mikroutasítások tipikusan assembly szintü programnyelvre emlékeztetnek (szintén mnemonikus kódok).

a) Létezik micro assambler, azaz fordítóprogram, mely a forrásnyelvü mikroprogramokat végrehajtható formátumra alakítja ez tölthetö be a CM-be.

b) A mikroprogramok írásához igen mély hardver ismeretre van szükségünk, amit a gyártók nem szoktak publikálni.

Hibás mikroprogram esetén müködésképtelenné válik a hardver (nem segít a reset gomb), az operációs rendszer sem müködik.

A sínrendszer fogalma alatt a kommunikációs infrastruktúrát értjük, az I/O rendszer a perifériának a processzorral és a memóriával történö kommunikációjának sajátosságaival foglalkozik.

Az egységek a sínrendszeren keresztül szabályozott, egységes módon kommunikálnak.

Az egységek közötti kommunikáció (pl.: processzor és a perifériák között).

Müszaki: Olyan vezetékköteg, melynek minden egyes erén vagy csak a logikai 0-nak megfelelö 0 Volt, vagy csak a logikai 1-nek megfelelö +12, +5, +3.3, +2.8 Volt jelenhet meg.

Funkcionális: Olyan vezetékköteg, mely lehetövé teszi egyszerre n bit továbbítását a forrástól a célig. Ebben a kontextusban a sín fogalmába beleértjük a sín forgalmát vezérlö intelligenciát is.

b. Megbízhatóság: amennyiben biztosított az infrastruktúra, akkor pl. az U₁-U₂ közötti szakadás esetén a két egység továbbra is kommunikálhat U₃ vagy U₄ egységen keresztül.

d. Újabb csatlakozási felületek kialakítása technológiai nehézséget jelent.

A szabványos 141h71b 141h71b 141h71b közös sín
csatlakozási felületek miatt könnyü az újabb egységek csatlakoztatása.

a. Lassúbb, mivel egyidejüleg csak egyetlen adó lehet a sínen, a többinek várnia kell a sín felszabadulására.

1. Feladata: Az egységek (pl.: hálókártya) illetve egységrészek (pl.: memóriacím) azonosítása.

20 bitnél 1MB-ot tudunk megcímezni, 24 bitnél már 16MB-ot, 32 bitnél 4GB-ot. Napjainkban is 32 bit a címzési lehetöség.

2. Külön vezérlövezetékkel kell jelezni, hogy mi van az adott pillanatban a sínen (cím vagy adat).

3. Akkor érdemes alkalmazni, ha blokkos átvitelt használunk. A blokk kezdöcíme átvitele után a többi cím inkrementálással megállapítható.

1. R/W - read/write:
a processzor nézöpontjából mutatja az átvitel irányát.

2. A rendszersín nehezen szabványosítható, mivel CPU közeli sajátosságok kihasználásával teljesítménye növelhetö.

1. A winchesteren tárolt adatokat a DMA vezérlö segítségével közvetlenül a memóriába visszük.

1. Feladata: az I/O egységek csatlakoztatása a processzor-memória kettöshöz.

b. DEC elsö gépei sín-orientáltak voltak. Aljzatokat alakítottak ki tesztkészülékek csatlakoztatására. Megoldásaikat szerzöi jogi védelem alá helyezték.

c. 1976: az Altair tervezöje kialakította az S-100-as bövítösín architektúrát, mely 100 db érintkezö felületet biztosított. Ezt az IEEE szabványként fogadta el.

Típus	Megjelenés éve	Valós memória (Mbyte)	Virtuális memória
8086	1978	1		20 bit
80286	1982	16	1 Gbyte	24 bit
80386	1985	4096	64 Tbyte	32 bit

Megjelenés éve:	Típus	Általános célú regiszterkészlet	Lebegöpontos regiszterkészlet	Katmai (MMX2)
1964	IBM 360	16x32	4x64
1985	Intel 80386	8x32	8x80
1990	IBM RISC 6000	32x32	32x64
1998	Pentium III	8x32	8x80	8x128

MK	Opd	ops1	ops2	op4

Állapotmüveletek
PC	Flag
Inkrementálás (növelés)	Set (beállítás)
Felülírás	Save (mentés)
	Load (visszatöltés)
	Clear (törlés)
	Reset (kezdeti értékek visszaállítása)

Fixpontos	Lebegöpontos	BCD	Egyéb
Összeadás	Összeadás	Összeadás	Logikai
Kivonás	Kivonás		Címszámítás
Szorzás	Szorzás		Léptetés
Osztás	Osztás
Multimédia	Multimédia

Példa	Decimális szám helyiértékeinek száma	Bináris szám helyiértékeinek száma
9	1	4
99	2	7
999	3	10

	A decimális helyiértékek száma				Általánosítva
	A	1	2	2	m
	B	1	1	2	n
	X_max	2	3	4	m+n
Példa:		9×9	99×9	99×99

	egy byte	két byte
800×600	480000 byte	960000 byte
1280×1024	1,3 Mbyte	2.6 Mbyte

A karakterisztika helyiértékeinek száma:	Példa	Konklúzió
Tízes számrendszer
1	9⁹ milliárd	Függ a karakterisztika helyiértékeinek számától.
2	9⁹⁹milliárd	Függ a karakterisztika helyiértékeinek számától.
Kettes számrendszer
1	2¹ egyesek	Függ a számrendszer alapjától.

Típus	MHz	relatív MIPS
Intel 80386	25	17
Intel 80486DX	66	~1700
Pentium I	133	~6000

sebesség	gyors	mindig lassabb
áttekinthetöség	ember számára nehezen áttekinthetö	ember számára áttekinthetö
módosíthatóság	merev, nehézkesen módosítható	rugalmas