Hallo,
als größte Optimierung würde ich die Globale Variable sync rausschmeissen und den Pin einfach nur in der ISR toogeln,
Code:
PORTA ^=(1<<PA1);
Das dürfte schon ein paar Takte einsparen

Aber wie gesagt, am besten alles in Hardware machen,
non PWM ,den zugehörigen PIN bei Compare Match toogeln und OCR0 auf 16 stellen.

Nachteil, es ist nicht unbedingt PA1
Vorteil der Controller kriegt langeweile und kann in der Zeit was anderes machen

Gruß Sebastian