Hallo,
ich denke, das wird nicht all zu einfach. Als erstes müsste man, wenn mehrere Menschen anwesend sind, die Erschütterungen, die ein einzelner verursacht ausfiltern. Bei nur einem Anwesenden entfällt dies schon mal.

Mit genügend Wissen und Erfahrung in Mustererkennung würde ich so vorgehen:
1. Dafür sorgen das die Umgebung immer die selben eigenschaften hinsichtlich Bodenbeschaffenheit, Schwingverhalten und Absorbtion der Schallellen aufweist.
2. Dafür sorgen, das die zu erkennenden Personen immer die selben Schuhe tragen und nicht zu oder ab nehmen.
3. Mindestens 3 besser mehr Sensoren verwenden, die unterschiedliche Eigenschaften haben (Piezo mit großer / kleiner Fläche, Mikrofon, Beschleunigungssensor usw.) und davon mehrere Gruppen auf der Fläche plazieren.
4. Eine bestimmte Anzahl von Schritten in einer folge aufnehmen, diese separieren und mitteln, dabei die mit der größten Abweichung vom Mittel verwerfen. Und das für jeden Sensor einzeln.
5. die so gewonnene Kurven mit in einer Tabelle abgelegten Vergleichsliste der einzelnen Personen vergleichen und bei einer differenz, die einen Maximalwert nicht überschreitet eine Person als erkannt kennzeichnen.

Das mal so als meine Gedanken zu diesem Thema.
Schwierigkeiten sehe ich dabei darin, das recht viele Daten in recht kurzer Zeit anfallen, diese gespeichert(RAM), verarbeitet(CPU) und verglichen werden müssen (schneller Massenspeicher für Vergleichswerte)
Mit einem schnellen PC und Schnellen AD-Wandlern sollte das, denke ich, mit ausreichend Wissen und Erfahrung im Programmieren machbar sein.
Auch zu bedenken ist, das viele Menschen wohl von Gewicht und Gangart her ähnlich sind, weshalb wahrscheinlich viele sehr ähnliche Daten anfallen werden und entsprechend fein muss dann die Erkennung sein

Florian