ごく稀にですが、文字列同士の編集距離を求める必要が発生するのでその時のメモです。
編集距離(レーベンシュタイン距離)とは、二つの文字列がどの程度異なっているかを表す距離の一種です。
Wikipediaにも解説があります。
一方の文字列に対して、1文字の挿入、削除、置換を最低何回施せばもう一方の文字列に等しくなるかで定まります。
pythonでこれを求めるときは、python-Levenshtein というライブラリが使えます。
インストール
pip install python-Levenshtein
使い方
>>> import Levenshtein
>>> text1 = 'Levenshtein'
>>> text2 = 'Lenvinsten'
>>> Levenshtein.distance(text1, text2)
4