34
Pokročilé architektury počítačů (PAP_15.ppt) Karel Vlček, karel .vlcek@ vsb . cz katedra Informatiky, FEI VŠB Technická Univerzita Ostrava

Pokročilé architektury počítačů (PAP_15)

  • Upload
    dreama

  • View
    50

  • Download
    1

Embed Size (px)

DESCRIPTION

Pokročilé architektury počítačů (PAP_15.ppt). Karel Vlček , [email protected] katedra Informatiky, FEI VŠB Technická Univerzita Ostrava. Architektury příštích procesorů. Speciální architektury - úvod Data-flow procesory Umělé neuronové sítě Architektury s fuzzy logikou - PowerPoint PPT Presentation

Citation preview

Page 1: Pokročilé architektury počítačů (PAP_15)

Pokročilé architektury počítačů (PAP_15.ppt)

Karel Vlček, [email protected] katedra Informatiky, FEIVŠB Technická Univerzita Ostrava

Page 2: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 2

Architektury příštích procesorů

Speciální architektury - úvod Data-flow procesory Umělé neuronové sítě Architektury s fuzzy logikou Kvantové počítače

Page 3: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 3

Speciální architektury procesorů - charakteristika

Jako speciální architektury procesorů jsou označovány všechny, které nemají společný základ vytvořený von Neumannem (princetonský) nebo architekturu vzniklou na Harvardově universitě

Bývají označovány pojmem „non-von Neuman architectures“

Zpracovávají informaci ne podle programu, ale na základě jiného popisu algoritmu

Page 4: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 4

Speciální architektury procesorů - odlišnosti

Speciální architektury procesorů se vyznačují dvěma základními odlišnostmi:

Neobsahují čítač instrukcí Nepracují podle algoritmu ve formě

programu

Page 5: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 5

Speciální architektury procesorů - podobnosti

Speciální architektury procesorů se vyznačují i podobnostmi:

Mohou být podobné například tím, že jejich architektura je superskalární, závislá na činnosti překladače (obdoba VLIW)

Některé architektury je možné přirovnat k architekturám SIMD, až na to, že mechanismus působení instrukce je nahrazen jiným mechanismem

Page 6: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 6

Data-flow architektury - úloha token

Vykonávání algoritmu není zapsáno jako program, ale je řízeno přítomností dat, která mají být zpracovávána operací

Vykonávání operace je uvedeno do činnosti tím, že jsou přivedena data, potom, co byla dokončena předcházející operace

Spouštění operace zajišťuje tzv. token, stejně jako povel „pal“ vojákům na střelnici

Page 7: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 7

Druhy token

Operace může být spouštěna dvěma token, když se jedná o operaci sčítání, odečítání, násobení, dělení nebo o podobnou operaci

Operace je spuštěna boolovskou proměnnou, jedná-li se o přepínač nebo o filtr dat

Rozhodovací blok je realizován rovněž pomocí token, které je představováno boolovskou proměnnou

Page 8: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 8

Práce s pamětí u data-flow procesorů (1)

Data-flow architektury mají vlastnosti, které jsou vhodné pro realizaci paralelních struktur

Realizace není snadnou záležitostí, vyžadují použití rychlé paměti, které jsou schopné reagovat na požadavky více procesních elementů

Page 9: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 9

Práce s pamětí u data-flow procesorů (2)

Při výstavbě Data-flow architektury se často uvažuje o principu superthreaded procesoru nebo hyperthreaded procesoru

Přitom jsou využívány nečinné časové sloty stejně jako při provozu linky výkonných jednotek

Tím je zvyšován paralelismus na úrovni, která je příznačná pro replikované výkonné jednotky data-flow procesorů

Page 10: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 10

Umělé neuronové sítě (1)

Umělé neuronové sítě jsou založeny na součinnosti mnoha umělých neuronů

*

*

*

*

+ Aktivační funkce

i0

i1

i2

in-1

w0

w1

w2

wn-1

výstup

Page 11: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 11

Umělé neuronové sítě (2)

Neurony mohou být uspřádány do jednovrstvových struktur nebo vícevrstvoých struktur

Činnost je demonstrována na operaci komprese obrazu pro různé podmínky

Page 12: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 12

Goals

Investigation of the two types of nn (AMLP, SOFM)

Testing Software Development Verify compression, possibly additional

effects of the nn’s Evaluate and compare results

Page 13: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 13

Auto-associative multilayer perceptron

Perform dimensionality reduction The principle of compression/decompression:

Page 14: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 14

Self-Organizing feature map

Compress using categorization SOFM is a quantization vector

Page 15: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 15

Competence of the Testing (simulation) software

Design AMPL’s and SOFM ‘s Change architecture of nn on demand Adapt nn’s to images Simulate compression and decompression

using nn’s Calculate SNR

Page 16: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 16

Simulation (1) 8bit quantization Investigate (objective and subjective) effects

of the blocks size and CR Fidelity Criterion:

][log10 10 dBMSE

MSESNR max

1

0

1

0

2),(),(1 M

x

N

y

yxfyxgNM

MSE

Page 17: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 17

Simulation (2)

4 models of AMLP (for CR=2:1 and 4:1) and 8×8 and 4×4

6 models of SOFM for image block sizes 8×8 and 4×4

Page 18: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 18

Results – AMLP

Adaptation to image Table only – generalization capabilities Compress Ratio

– CR= n / p – smallest 2:1 – largest 4:1

Image Block Sizes– Optimal size is 8×8

Page 19: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 19

Results – AMLP

For block sizes 4×4 one iteration of the adaptation is sufficient

Page 20: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 20

Results – AMLP

Faultiness of SNR (block 4x4)

CR = 4:1 CR = 2:1 SNR = 27,67 dB SNR = 27,67 dB

Page 21: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 21

Results – SOFM

Compress Ratio– evaluation:

– large CR’s, but with higher image distortion– it is possible to reduce the number of ID

bits and thereby increase CR Image block sizes

– it influences on Kohonen’s size layer

LKI

NMCR

Page 22: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 22

Results – SOFM

Effect of image block size:

blocks 8×8 blocks 4×4

Page 23: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 23

Results – SOFM

The best result

Page 24: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 24

Scheme of perceptron

Page 25: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 25

The VHDL model of perceptron

-- NeuronENTITY neuron IS PORT (x1,x2: IN floating; Y: OUT floating);END neuron;ARCHITECTURE behavioral OF neuron IS BEGINperc: PROCESS (x1, x2)

BEGIN y <= ‘0’; IF (x1*w1+x2*w2) > b THEN

y <= ‘1’; END IF; END PROCESS perc;END behavioral;

Page 26: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 26

Conclusion

Disadvantage: quality of compression is lower compared to special compression algorithms. (Method was compared with JPEG standard)

Advantage: the method allows to reconstruct non-complete or noised data, which are caused by transmission channel

Page 27: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 27

Test Designs – Multilevel nets

Page 28: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 28

Test Designs – Kohonen’s net

Page 29: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 29

Image “Table”

Page 30: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 30

Image “Bird”

Page 31: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 31

Image “Lena”

Page 32: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 32

Image “Pepper”

Page 33: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 33

Image “Poruba town”

Page 34: Pokročilé architektury počítačů (PAP_15)

Karel Vlček Pokročilé architektury procesorů 34

Literatura:

Dvořák, V.: Architektura a programování paralelních systémů, VUTIUM Brno, (2004), ISBN 80-214-2608-X

Dvořák, V., Drábek, V.: Architektura procesorů, VUTIUM Brno, (1999), ISBN 80-214-1458-8

Drábek, V.: Výstavba počítačů, PC-DIR, s.r.o. Brno, (1995), ISBN 80-214-0691-7

Mueller, S.: Osobní počítač, Computer Press, Praha, (2001), ISBN 80-7226-470-2

Pluháček, A.: Projektování logiky počítačů, Vydavatelství ČVUT Praha, (2003), ISBN 80-01-02145-9

Havel, V., Vlcek, K., Mitrych, J.: Neural Network Architecture for Image Compresson, IFAC PDS04, pp. 389-394, ISBN 83-908-409-8-7