So. Also bei mir war des Rästels Lösung:

a) um delays im µs Bereich zu erzeugen habe ich erstmal den CPU Takt von 1MHz auf 8MHz erhöht. Das macht denke ich auch Sinn, wenn man bedenkt, dass die _delay_us() Routine wohl viel mehr als 1-2 Anweisungen abarbeiten muss.

b) habe ich Compiler-Optimierungen verwendet. Damit kann ich mir jetzt perfekt getimte delays im niedrigen µs, z.B. 10µs