arnyc:
Filalex2007
Цитата:
1. Хорошо и бесплатно распознаёт русский разговор несколькими голосами онлайн-сервис Google Web Speech API Demo.
Если надо распознать запись разговора с аудио файла, устанавливаем VAC, затем используем его 1-й дефолтный кабель: открываем Windows Sound Panel, назначаем Line 1 как Default device во вкладках Recording и Playback. В свойствах Мика Line 1 отмечаем "Listen to this device" и выбираем рабочие наушники.
Открываем любой аудио плеер и начинаем проигрывать нужный файл. В Хроме на веб-странице Google выше кликаем Мик, разрешаем ввод с мика для Хрома в Настойках Винды и на жеб-странице, затем кликаем в поле ввода. Аудио с плеера начинает передаваться на сервера Гоогл, и в поле ввода появляется распознанный текст аудио записи с плеера. По окончание его можно вставить в Word и отредактировать, заново прослушивая файл.
2. Ещё вариант на пробу : IBM Watson Text-to-Speech Demo. У этого веб-сервиса походу меньше выбор языков, вроде нет русского, зато распознаёт хорошо другие популярные языки, и есть прямое распознавание из аудио файла, хотя файлы неподдерживаемых форматов надо сначала перекодировать в WAV.
Для обоих вариантов нужен быстрый интернет без затыков в режиме Upload.
Filalex2007
Цитата:
После долгих поисков и проб разных программ, которые бы распознавали русскую речь и переводили бы ее в текст на достаточно высоком уровне, могу сказать, что такая только одна - Voco от ЦРТ. |
1. Хорошо и бесплатно распознаёт русский разговор несколькими голосами онлайн-сервис Google Web Speech API Demo.
Если надо распознать запись разговора с аудио файла, устанавливаем VAC, затем используем его 1-й дефолтный кабель: открываем Windows Sound Panel, назначаем Line 1 как Default device во вкладках Recording и Playback. В свойствах Мика Line 1 отмечаем "Listen to this device" и выбираем рабочие наушники.
Открываем любой аудио плеер и начинаем проигрывать нужный файл. В Хроме на веб-странице Google выше кликаем Мик, разрешаем ввод с мика для Хрома в Настойках Винды и на жеб-странице, затем кликаем в поле ввода. Аудио с плеера начинает передаваться на сервера Гоогл, и в поле ввода появляется распознанный текст аудио записи с плеера. По окончание его можно вставить в Word и отредактировать, заново прослушивая файл.
2. Ещё вариант на пробу : IBM Watson Text-to-Speech Demo. У этого веб-сервиса походу меньше выбор языков, вроде нет русского, зато распознаёт хорошо другие популярные языки, и есть прямое распознавание из аудио файла, хотя файлы неподдерживаемых форматов надо сначала перекодировать в WAV.
Для обоих вариантов нужен быстрый интернет без затыков в режиме Upload.