prog: threads
vgopts: --separate-threads=yes --cacheuse=yes --collect-bus=yes --collect-systime=yes
cleanup: rm callgrind.out.*