Danke für den Tip. Ich habe mir mittlerweile eine Assembler Funktion geschrieben. für eine 16Bit*16Bit=32Bit Multiplikation braucht sie nur 24 Takte