Один из лучших сервисов по синтезу речи это Облако ЦРТ. Услуги платные, но не дорогие. 10 рублей за 1000 символов.
А также на этом сайте возможно распознать записанную речь и получить файл в виде текста.