@TObi: kommt auch drauf an, wie du die tabelle dazu gedacht oder gegeben hast.
Das CPU-mäßig schnellste wäre ein stück assembler-spaghetti code, der gleichzeitig das Mapping bildet
Code:
 CBI   PORTD, 4  ; outpin löschen
 SBRC R16, 0     ; nächsten Befehl überspringen, wenn das bit = 0
 SBI  PORTD, 4  ; sonst outpin setzen
..
 CBI   PORTC, 3
 SBRC R16, 1
 SBI  PORTC, 3
..
 CBI   PORTx, n
 SBRC R16, 7
 SBI  PORTx, n
Zyklenmäßich ist das recht flott. Bei jeder Schleifenkonstruktion brauchst du ein vielfaches

Ich weiß auch, daß das saumäßig auschaut