Die Fourieranalyse ist schon mal ein erster Möglicher Ansatz, aber man verschenkt dabei relativ viel Information. Wirklich hilfreich wäre es wenn jeweils der gleiche Text gesprochen wird. Sonst müsste man wohl noch erst die Laute / Worte identifizieren und die einzeln vergleichen - das Wäre ggf. auch bei gleichem Text noch aufschlussreicher.