Bienvenido al foro.
Lo que dices de capturar por separado el audio y luego juntarlo (multiplexar), es juntarlo sobre el video que capturaste previamente con audio, o lo capturas sin audio, creo qeu te vendría mejor la segunda opción, no deberías tener problemas de codecs, a menos que tengas un terrible pack instalado
De todas formas, esas tarjetas de captura de TV no son muy estables, y causan más conflictos que felicidades :P