Selbst mit Laden und Speichern komm ich nur auf 7 Takte:
2*2 Laden
1 Addition
2 Speichern

Wenn ein Summand im Flash liegt und man ein LPM braucht, dann sind es schon 10 Takte.
2 Z-vorladen
3 LPM
2 Laden
1 Addiation
2 Speichern

Warum 9 Takte gebraucht werden, wird dir erst ein Blick in den erzeugten Code erhellen. So ist's nur rumgerate.