Ja, genau so.
SBI u. CBI haben jeweils 2 Cycles,
SBRC hat 1 oder 2 (ohne skip / mit skip)
d.h Je Bit (also 8 mal)
ist das R16 bit = 0, brauchst du 4 Cyklen,
ist das R16 bit = 1, brauchst du 5 Cyklen
also minimal 32 Cyklen (alles Null)
maximal 40 Cyklen (alles Eins)

bei 8 MHZ also ca 4 - 5 uS

Schneller wird's nicht gehen, denk' ich. (Vorschläge werden aber gerne angenommen)


Edit: wer nicht schreiben kann, soll's bleiben lassen