LevensteinDistance – API Commons Lang 3.0

Avec Commons Lang api, je peux calculer la similarité entre deux chaînes de la distance de Levenstein . Le résultat est le nombre de modifications nécessaires pour changer une chaîne en une autre. J’aimerais que le résultat se situe dans la plage de 0 à 1, où il serait plus facile d’identifier la similarité entre les chaînes. Le résultat serait plus proche de 0 grande similitude. C’est possible?

Ci-dessous l’exemple que j’utilise:

public class TesteLevenstein { public static void main(Ssortingng[] args) { int distance1 = SsortingngUtils.getLevenshteinDistance("Boat", "Coat"); int distance2 = SsortingngUtils.getLevenshteinDistance("Remember", "Alamo"); int distance3 = SsortingngUtils.getLevenshteinDistance("Steve", "Stereo"); System.out.println("distance(Boat, Coat): " + distance1); System.out.println("distance(Remember, Alamo): " + distance2); System.out.println("distance(Steve, Stereo): " + distance3); } } 

Merci!

Divisez simplement par un nombre. La question est quel numéro? Probablement la distance maximale possible pour la paire de chaînes donnée. Je pense que c’est la longueur de la chaîne la plus longue (c’est-à-dire que tous les caractères sont différents et que quelques chaînes supplémentaires ont été ajoutées par rapport à la chaîne la plus courte).