Я сделал бы так:
Проанализировал с помощью графиков первый трек, и второй. Потом сравнил бы данные и поучил бы насколько они похожы между собой.
Итак начнем(сделать можно более универсально, но это в качестве примера):
1.Анализируем громкость левого и правого канала, и забиваем данные в лист.
2.Делаем тоже самое для второго трека.
3.После сравниваем положение точек на первом и втором графике, и высчитываем процент совпадений.
(делал на блицмаксе, в динамике график у меня выгядит так :
anal.rar)
И вот полученый мной результат при сравнивании двух одинаковых треков:
совпадение на 96% (не 100%, возможно по той причине, что я использовал флоат пойнт...хз)
Результат на сравнение разных треков :
совпадение на 2%
Желтая линия, это левый канал, розовая - правый. красная линия - это то где треки не совпадают.
Сделал в обеденный перерыв...если уделить оптимизации то можно добится 99% результата и хорошей гибкости анализа, ну тут ты уже сам идею розвивай.
Разная продолжительность - анализируй только одинаковый отрезок времени(ориентируясь на меньший конечно).
С разным качеством пока не тестировал.