1. Überprüft, ob der Prozessor wirklich mit 168MHz läuft?
2. HardFPU auch in den Build Optionen eingestellt?
3. Dissasembly überprüft, ob er dafür auch kompiliert?
4. Ergebnis geprüft?
5. Optimierung?
mfg
1. Überprüft, ob der Prozessor wirklich mit 168MHz läuft?
2. HardFPU auch in den Build Optionen eingestellt?
3. Dissasembly überprüft, ob er dafür auch kompiliert?
4. Ergebnis geprüft?
5. Optimierung?
mfg
Hi,
danke erstmal für die Antwort!
1. Ja, ich hab mir den geviertelten Systemtakt ausgeben lassen, mein Oszi kann es leider nicht anzeigen, geht nur bis 25MHz, aber man sieht, dass es passt.
2. __FPU_PRESENT & __FPU_USED sind beide definiert, das sollte also passen?!
3. Nein, welche Datei meinst du genau?
4. Nein.
5. Hab nichts verändert, sind also alle aus.
Hab gerade mal folgendes probiert:
Laut Debugger braucht die Multiplikation 13 Takte, was jetzt nicht mit meinem Ergebnis von vorhin zusammenpasst und außerdem immernoch zu lange ist (oder??).Code:#define CORE_SysTickEn() (*((u32*)0xE0001000)) = 0x40000001 #define CORE_SysTickDis() (*((u32*)0xE0001000)) = 0x40000000 #define CORE_GetSysTick() (*((u32*)0xE0001004)) uint32_t t1, t2, dt; float32_t float1 = 3.14f; ... ... ... CORE_SysTickEn(); t1 = CORE_GetSysTick(); float1 *= 5.1f; t2 = CORE_GetSysTick(); CORE_SysTickDis(); dt = (t2 - t1) - 9;
Gruß
Chris
Wenn du debuggst, kannst du dir den Assembler code anzeigen lassen. Denn Teil mit der Multiplikation mal posten.3. Nein, welche Datei meinst du genau?
Ohne Optimierung benötigt eine Berechnung oft ein vielfaches als mit Optimierung.5. Hab nichts verändert, sind also alle aus.
Und ich bezweifle, dass 50 Multiplikation auch nur 50 Takte insgesamt benötigen.
mfg
Sorry für die blöde Frage, aber wie lasse ich mir das Assembler file anzeigen? Hab da nirgends was gefunden.
Wenn ich Breakpoints setze oder auch beim Debuggen einzelne Schritte ausführe (mit f10 / f11), wird mir die aktuelle Position im Programm nur im normalen Code angezeigt. Zu sehen, was da auf ASM Höhe passiert, wäre wirklich interessant!
Laut dieser Tabelle ( http://infocenter.arm.com/help/index.../BEHJADED.html ) braucht eine FPU-Multiplikation nur 1 Takt.
Aber klar du hast Recht, es dauert wohl schon länger wegen speichern etc...
Mit Optimierung ist es übrigens tatsächlich um EINIGES schneller, meine Versuche decken sich annähernd mit denen: http://blog.stm32f4.eu/category/fpu/
Das einzige, was ich noch nicht in den Griff bekommen habe, ist der CORE_SysTick.
Sobald die Optimierungen eingeschaltet sind (egal welcher Level), funktioniert das nicht mehr:
Dabei stehen nur konstante Werte in t1 & t2 (beide als volatile, aber auch ohne bringt nichts).Code:CORE_SysTickEn(); t1 = CORE_GetSysTick(); float1 = float2 * float3; t2 = CORE_GetSysTick(); CORE_SysTickDis(); dt = (t2 - t1) - 9;
Gruß
Chris
Ich denke, der Hase liegt bei der fehlenden Aktivierung der FPU im Pfeffer. Leider verliert das Referenc Manual zum Thema kein einziges Wort, dafür muss man auf das Dokument PM0214 ausweichen. Ab Seite 236 geht das da dann um die Konfiguration der FPU. Auf Seite 241 wird einem dann mitgeteilt, dass die FPU per Default nicht aktiv ist. Da ich nicht genau weiß, was alles in den Headern steht, würde ich das mal als nächsten Anhaltspunkt wählen.
Zu dem Teil mit dem Systick: Ich nehme an, die Makros sind nicht selbst gebaut? Ich würde da empfehlen, sich einmal das Referenc Manual zu gemüte zu führen und dann die Konfiguration für den SysTick daraus zusammen zu bauen.
Gruß Jannis
MfG (Mit feinem Grübeln) Wir unterstützen dich bei deinen Projekten, aber wir entwickeln sie nicht für dich. (radbruch) "Irgendwas" geht "irgendwie" immer...(Rabenauge) Machs - und berichte.(oberallgeier) Man weißt wie, aber nie warum. Gut zu wissen, was man nicht weiß. Zuerst messen, danach fragen. Was heute geht, wurde gestern gebastelt. http://www.youtube.com/watch?v=qOAnVO3y2u8 Danke!
Debug->Debugging Windows->DisassemblySorry für die blöde Frage, aber wie lasse ich mir das Assembler file anzeigen? Hab da nirgends was gefunden.
Wenn ich Breakpoints setze oder auch beim Debuggen einzelne Schritte ausführe (mit f10 / f11), wird mir die aktuelle Position im Programm nur im normalen Code angezeigt. Zu sehen, was da auf ASM Höhe passiert, wäre wirklich interessant!
Den Systick zur Zeitmessung zu benutzen ist suboptimal. STM32s haben normal alle einen Cycle Counter impelementiert. Damit siehst du ganz genau wie viele Zyklen zur Berechnung benutzt werden. Aber bei einer einfachen Multiplikation kann man das am einfachsten eh am Disassembly auslesen.Das einzige, was ich noch nicht in den Griff bekommen habe, ist der CORE_SysTick.
Sobald die Optimierungen eingeschaltet sind (egal welcher Level), funktioniert das nicht mehr:
mfg
Lesezeichen