Почитай про
Расстояние Левенштейна и почитай смежные темы на
хабре.
P.S. Описанный тобой метод - это метод
N-грамм. Я использую его на сайте
Muza.Name для вычисления схожести текстов местных авторов с текстами известных писателей. Результат можно посмотреть в анкетах пользователей (если там ещё ничего не поломалось при очередном переезде с хостинга на хостинг).