Стандартный sort у Vector весьма тормозен, также осуществляет вызов функции на каждом сравнении, что не есть гуд. Эту сортировку можно оптимизировать как алгоритмически, так и просто ускорить итерацию. Тов. geser опубликовал заметку о том как можно сделать не только быструю сортировку слиянием, но и вынести самые последние часты итерации в шейдер. Почитать можно
у нас, на someideas.ru там же есть исходники и проект FD. На моей машине(C2D@3.6Ghz, GTS250) стандартная сортировка занимает 2389 миллисекунд, ...