La ressemblance entre deux textes peut être considérer en terme de distance. La bibliothèque Simmetrics permet de calculer la distance entre deux chaînes de caractères à l'aide d'un certain nombre de métriques. Il est également possible de l'étendre assez facilement, l'API étant assez bien pensée.