Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Распознавание речи (Speech Recognition) Горыныч / Диктограф

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7

Открыть новую тему     Написать ответ в эту тему

Infection

iB3 PostgreSQL Coder
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Программы распознавания речи

 
Распознавание речи
 
Название Статус Языки Обсуждение Поиск    
MSpeech Free >50 - Программы    
RealSpeaker Shareware 11 - Варезник    
Диктограф Shareware ? - Варезник    
Горыныч Shareware ? - Варезник    
Dragon NaturallySpeaking Shareware ? Программы Варезник  

Речевые технологии
Каталог программ на Озоне
 
Статьи
On-line и OS сервисы
 
Microsoft Agent / Speech API / Text-to-Speech
Yandex SpeechKit
Google Web Speech API Demo
Google Cloud Speech-to-Text (free $300 credit)
IBM Watson Text-to-Speech Demo
VoiceNavigator Web
 
 
Родственные темы
Программы для транскрибирования - транскрайберы
 


старая шапка

Всего записей: 352 | Зарегистр. 21-12-2001 | Отправлено: 12:34 18-06-2003 | Исправлено: Maz, 17:58 17-03-2020
eddddddy

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
МСпич Запустил на восьмерке – то же самое, Она оказывается для каких-то команд, а не для набора текста голосом. Так что мне искать?

Всего записей: 81 | Зарегистр. 08-02-2010 | Отправлено: 08:22 16-05-2016
Filalex2007

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подниму тему.
По роду деятельности часто приходится брать интервью на диктофон - времени на транскрибацию уходит очень много (15-минутное интервью - это при хороших условиях около часа мучений).
Есть программы, которые немного упрощают ручной перевод голоса в текст, например, Transcriber-pro (бывший Словомол), но хотелось именно автоматической транскрибации.
После долгих поисков и проб разных программ, которые бы распознавали русскую речь и переводили бы ее в текст на достаточно высоком уровне, могу сказать, что такая только одна - Voco от ЦРТ.
Единственный минус - цена за версию Pro (а именно в ней есть функционал транскрибации из аудиофайлов, который мне нужен) - 13к рублей Но дают в комплекте джабровскую гарнитуру...
Для записи текста с микрофона подойдет базовая версия - 1,6к рублей.

Всего записей: 3 | Зарегистр. 11-06-2008 | Отправлено: 16:58 14-09-2016
romby



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
на достаточно высоком уровне, могу сказать, что такая только одна - Voco от ЦРТ. Единственный минус - цена

Voco стал немного доступнее широким массам
Пробуем и делимся впечатлениями от «85%» распознавания речи

Всего записей: 1785 | Зарегистр. 09-02-2006 | Отправлено: 13:52 03-01-2017
DrAlexMD

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MSpeech не скачивается - или это только у меня так?
Разобрался.

Всего записей: 174 | Зарегистр. 31-03-2005 | Отправлено: 12:51 02-09-2017 | Исправлено: DrAlexMD, 13:03 02-09-2017
1lex1

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ссылки в шапке не рабочии:
Цитата:
RealSpeaker

Цитата:
Речевые технологии  

Цитата:
Каталог программ на Озоне  


Всего записей: 278 | Зарегистр. 22-11-2013 | Отправлено: 08:23 14-03-2018 | Исправлено: 1lex1, 08:24 14-03-2018
FUTURiTY

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
https://www.speechpro.ru/product/sistemy-audio-i-videoprotokolirovaniya/nestor
https://www.speechpro.ru/product/sistemy-audio-i-videoprotokolirovaniya/nestor-pravosudie
 
Кто что скажет по данным продуктам?

Всего записей: 2948 | Зарегистр. 24-04-2007 | Отправлено: 10:22 05-09-2018
arnyc



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Filalex2007

Цитата:
После долгих поисков и проб разных программ, которые бы распознавали русскую речь и переводили бы ее в текст на достаточно высоком уровне, могу сказать, что такая только одна - Voco от ЦРТ.

 
1. Неплохо распознаёт спокойный разговор на русском несколькими голосами или диктовку под микрофон онлайн-сервис  Google Web Speech API Demo.  
 
Он также может распознать запись разговора с аудио файла. Для этого устанавливаем VAC, затем используем его 1-й дефолтный кабель: открываем Windows Sound Panel, назначаем Line 1 как Default device во вкладках Recording и Playback. В свойствах Мика Line 1 отмечаем "Listen to this device" и выбираем рабочие наушники для прослушки.  
 
Разрешаем ввод с Мика для Хрома в Настойках Винды и вверху на веб-странице Google Speech. Открываем  десктопный аудио плеер и играем нужный файл с выводом звука на Line 1 или default speakers. В Хроме на веб-странице Google Speech кликаем иконку Мик, затем кликаем в текст-боксе для фокуса на нём. Плеер начинает стримить аудио на сервер Google через виртуальный Мик VAC, и в текст-боксе появляется распознанный текст. По окончании его можно скопировать, вставить в Word и отредактировать, заново слушая файл.
 
2. Пробуем Google Cloud Speech-to-Text. Продвинутое распознавание нескольких голосов с диктовки или аудио файла. Демо-файл с сайта до 1 мин разговора. После реги дают бесплатный кредит $300 в обмен на номер кредитной карты. Если кредит исчерпан, карта не дебитуется без апгрейда акка на Paid юзером. Список поддерживаемых языков периодически расширяется.
 
3. Ещё вариант: IBM Watson Text-to-Speech Demo. У этого веб-сервиса походу меньше выбор языков, нет русского, зато хорошо распознаёт другие популярные языки с Мика и аудио файла. Записи в неподдерживаемых аудио форматах надо сначала перекодировать в WAV.
 
Для всех вариантов нужен быстрый интернет без затыков в режиме Upload. Чем медленнее и чётче разговор, и меньше акценты, тем точнее распознавание. Можно попробовать нажать Паузу в плеере после каждой фразы, если это повысит точность распознавания и уменьшит нужду в правках.

Всего записей: 1191 | Зарегистр. 28-05-2003 | Отправлено: 00:59 08-11-2019 | Исправлено: arnyc, 09:33 09-11-2019
Rapunzi



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Infection
https://cloud.mail.ru/public/3d95/FgyVb4BXT
 
Чем можно автоматически распознать фразу?
Именно машинно не на слух?
Что порекомендуете?
 


----------
Пожалуйста ЛЮДИ выкладывайте скриншоты и в черной теме тоже - так лучше видно!!!
https://www.upload.ee/thumb/11004571/2020-01-09_141745.jpg

Всего записей: 679 | Зарегистр. 20-01-2017 | Отправлено: 17:23 17-03-2020
TORFER

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Залейте пожалуйста любую рабочую версию Realize Voice  

Всего записей: 422 | Зарегистр. 17-07-2012 | Отправлено: 16:26 24-04-2020
Liliya1999

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Очень ищу дистрибутив Realize Voice 4.1.736
Залейте пожалуйста у кого сохранилась
Лекарство есть
 
С Realize Voice, теперь вы можете делать почти все, что на вашем компьютере с помощью голоса.  
Просматривайте веб-страницы, перемещайте программы, захватывайте и воспроизводить вход, диктуйте текст и многое другое!  
Вы даже можете добавить свои собственные голосовые команды для любой программы.  

Всего записей: 494 | Зарегистр. 02-03-2018 | Отправлено: 04:18 29-05-2020
ULer



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Существуют ли грамотные решения по загрузке звуковых дорог от кинофильмов, с получением на выходе текста с таймингом (субтитров)?

----------
http://dc.ru-board.com/ — Anime, Books, Cartoons, Clips, Databases and Maps, Games, Misc, Music, Movies, Scripts and Templates, Series, Soft, Training Courses, XXX.

Всего записей: 7445 | Зарегистр. 18-10-2007 | Отправлено: 23:01 03-02-2022
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ULer
Можно попробовать adobe premiere + Adobe Speech to Text for Premiere.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 12:48 09-10-2022
Natalia2362

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте! Помогите полному чайнику. Нужнл сделать транскрибацию видеолекции. Тут рекомендуют Adobe Speech to Text for Premiere. Входит ли эта штука в сам Адоб Премьер или нужно докачивать откуда-то? Где ее взять?
Спасибо. И не пинайте меня, пожалуйста.

Всего записей: 141 | Зарегистр. 22-11-2017 | Отправлено: 10:57 08-01-2023
ULer



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Natalia2362

Цитата:
Где ее взять?

http://forum.ru-board.com/topic.cgi?forum=35&topic=47387&start=700#13

----------
http://dc.ru-board.com/ — Anime, Books, Cartoons, Clips, Databases and Maps, Games, Misc, Music, Movies, Scripts and Templates, Series, Soft, Training Courses, XXX.

Всего записей: 7445 | Зарегистр. 18-10-2007 | Отправлено: 13:05 08-01-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть еще такая вещь https://docs.kdenlive.org/ru/effects_and_compositions/speech_to_text.html
Причем, Kdenlive необязателен, можно даже из командной строки.

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 14:34 08-01-2023
Goodwin7



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что на данный момент порекомендуете конкретно для вин XP - 7, (желательно XP) ?
без питонов (нетфреймворков если XP (или макс 2) )

Всего записей: 70 | Зарегистр. 10-12-2022 | Отправлено: 21:56 15-02-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Goodwin7
Комбат
Voco

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 23:46 15-02-2023
Goodwin7



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
neorion
винды 32бит.
Voco оно очень жирное, 64бит, MS Word 2010, 2013, 2016 ...  
А Комбат там качает некое YandexPackLoader, а не саму прогу.
При том после небольшого исследования стало ясно что многие из них требуют интернета, тобиш тупо работают с гуглоапи или Yandex.  Никакого желания предоставлять биометрию и тексты в эти шпионские конторы нет во-первых и во-вторых нужна автономия
Ну и на том Спасибо.

Всего записей: 70 | Зарегистр. 10-12-2022 | Отправлено: 21:37 16-02-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Goodwin7

Цитата:
Комбат там качает некое YandexPackLoader, а не саму прогу

Ошиблись ссылкой. Правильная ссылка вот. Но Комбат очень старый, 16 битный (даже не 32), распознает плохо, хоть и оффлайн. Это обученный русскому языку древний английский Dragon Dictate. Принимает звук только с микрофона. Если натренировать и четко говорить, кое что распознает.
 
Добавлено:
На XP юзабельней всего интернет решения. Например, speechpad или youtube. На win7 32 bit из оффлайн самый юзабельный питон, про которого я рассказывал раньше.

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 01:44 17-02-2023 | Исправлено: neorion, 01:48 17-02-2023
Goodwin7



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В общем, похоже, без подключения к интернету вообще ничего нет, для любых осей.
тоже Voco оно тоже требует подсоединения (так пишут), хотя прога 2ГБ+ Та и версии ни одной его взломанной нет.
Ненужно никому такое развивать, проще слить всё гуглу, мелкософту или подобной шараге. А их хозяева и не допустят, чтоб кто-то что-то реальное сделал, ведь так им нужно снять с вас дополнительные биометрические данные, что при использовании смрадфона с андроидом только ещё чётче пополнит ваш профиль у гугла.  
Все те старые, что в шапке то вообще шлак.
 
Добавлено:
neorion

Цитата:
 speechpad  
только хромоноги и слив гуглу.
Цитата:
На win7 32 bit из оффлайн самый юзабельный питон, про которого я рассказывал раньше.
где именно, что за питон ?
 

Всего записей: 70 | Зарегистр. 10-12-2022 | Отправлено: 02:23 23-09-2023 | Исправлено: Goodwin7, 02:28 23-09-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7

Компьютерный форум Ru.Board » Компьютеры » Программы » Распознавание речи (Speech Recognition) Горыныч / Диктограф


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru