Esercizio Pipeline MIPS

Soluzione

 


Considerando la pipeline MIPS vista a lezione, si consideri il seguente frammento di codice:
 

loop:

LW

$1, 0($2)

 R1← mem[0+[R2]]

ADDI

$1,$1, 1

 R1← [R1] + 1

SW

$1, 0($2)

 mem[0+[R2]] ← [R1]

ADDI

$2, $2,  4

 R2← [R2] + 4

SUB

$4, $3, $2

 R4← [R3] - [R2]

BENZ

$4, loop

 if([R4] != 0) PC ← indirizzo(loop)

assumendo che il valore iniziale di R3 sia R2+396.

a) si individuino e discutano le dipendenze dovute ai dati

Soluzione:

DIPENDENZE  

[dipendenza dati (senza considerare limiti architettura MIPS)]

[dipendenza dati considerando i limiti della architettura MIPS]

R1 in ADDI  $1,$1, 1 

dipende da

LW $1, 0($2)

[input EXEADDI ha bisogno di output da MEMLW]

[IDADDI deve legge R1 aggiornato da WBLW (stesso ciclo clock)]

R1 in SW  $1,0($2) 

dipende da

LW $1, 0($2)

 [input MEMSW ha bisogno di output da MEMLW]

[IDSW deve legge R1 aggiornato da WBLW (stesso ciclo clock)]

R1 in SW  $1,0($2) 

dipende da

ADDI  $1,$1, 1

 [input MEMSW ha bisogno di output da EXEADDI]

[IDSW deve legge R1 aggiornato da WBADDI (stesso ciclo clock)]

R2 in SUB $4, $3, $2

dipende da

ADDI  $2,$2, 4 

[input EXESUB  ha bisogno di output da EXEADDI]

[IDSUB deve legge R2 aggiornato da WBADDI (stesso ciclo clock)]

R4 in BENZ $4, loop

dipende da

SUB $4, $3, $2 

[input EXEBENZ ha bisogno di output da EXESUB]

[IDBENZ deve legge R4 aggiornato da WBSUB (stesso ciclo clock)]

 

b) mostrare come evolve la pipeline durante l'esecuzione del codice per le prime 6 istruzioni eseguite, assumendo:

Si calcoli inoltre il numero totale di cicli di clock necessari per portare a termine l'esecuzione completa del codice.

Soluzione:

Evoluzione pipeline per le prime 6 istruzioni eseguite
 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

 loop:

LW

$1,0($2)

IF     

ID    

EX  

MEM

WB

 

 

 

 

 

 

 

 

 

 

ADDI

$1,$1, 1

  

IF

ID

ID

EX

MEM

WB

 

 

 

 

 

 

 

 

SW

$1, 0($2)

 

 

IF

IF

ID

ID

ID

EX

MEM

WB

 

 

 

 

 

ADDI

$2,$2, 4

 

 

 

 

IF

IF

IF

ID

EX

MEM

WB

 

 

 

 

SUB

$4,$3,$2

 

 

 

 

 

 

 

IF

ID

EX

MEM

WB

 

 

 

BENZ

$4, loop

 

 

 

 

 

 

 

 

IF

ID

ID

ID

EX

MEM

WB

 

non preso/preso

 

 

 

 

 

 

 

 

 

 

 

 

 

IF (preso: LW R1,0(R2)

ID (preso: LW R1,0(R2)

 

Notare che la SW deve aspettare che $1 sia scritto perché non è previsto un circuito di bypass in grado di catturare l'uscita della ALU della istruzione ADDI precedente (fase EX) e di portare il dato in ingresso alla memoria durante la fase MEM di SW. Lo stesso vale per il registro $4 letto da BENZ, il cui contenuto va in input al dispositivo ad hoc per il confronto:

Il numero totale di cicli è calcolato come segue:

numero di iterazioni del ciclo = (396/4) = 99

          numero cicli di clock per eseguire il codice = 98 * 13 (si sovrappone MEMBENZ della iterazione i con IFLW della iterazione i+1) + 1*15  = 1289

Se si considera che lo stadio WB di BENZ in effetti non fa nulla, i cicli sono 1288.