generated at
差分検出アルゴリズム

差分検出アルゴリズムの基本用語
差分検出アルゴリズムの話をした時によく出る用語

文字列Aを1文字ずつ挿入削除してBになる操作回数のこと
上記の操作に「置換」を加えたものはレーベンシュタイン距離とも言う
最短の編集距離
双方の文字列に含まれる共通の文字列の中で一番長いもの
この「共通の」には一定の条件がある
やっていいのは文字の削除のみ
削除する文字は双方の文字列で異なっていても問題ない
文字の並べ替えをしてはいけない
つまり、
infight から文字を消して nit にするのはあり
init fit もおk
infight に含まれる文字を並べ替えて hit にするのはダメ
文字を削除して最長になるものなので、例えば acded eacdd では acdd (4文字)が最長になる
参考
誤訳が多いらしいので原文の記事を見たほうが良いかもしれない

アルゴリズムの種類
色々あるっぽい


参考