Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » MSpeech

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2

Открыть новую тему     Написать ответ в эту тему

CHERTS



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

 
MSpeech - это программа для распознавание речи используя Google Voice API выполнения голосовых команд, передачи распознанного текста в другие программы и многое другое.
 
    На текущий момент в программе реализован следующий функционал:
  • Распознавание голоса с помощью Google Voice API более чем на 50 языках.
  • Активация записи по заранее заданному уровню сигнала.
  • Неограниченное количество команд, которые можно добавить через удобный интерфейс.
  • Возможность назначить горячие клавиши для начала-остановки процесса записи-распознавания.
  • Передача распознанного текста в поля ввода других приложений разными методами.
  • Коррекция текста после распознавания и до передачи в поля ввода (Замена слов по списку, Изменение первых букв предложений на прописные).
  • Работа через прокси-сервер.
  • Возможность выбора источника звука.
  • Изменение языка интерфейса программы (English, Russian).
  • Синтез голоса через Microsoft SAPI (Бесплатный синтезатор RHVoice), Google Text-To-Speech, Yandex Text-To-Speech, iSpeech Text-To-Speech, Nuance Text-To-Speech.

 
Текущая финальная версия: 1.5.9 (32-битная) (31.03.2016)

Всего записей: 489 | Зарегистр. 01-06-2002 | Отправлено: 21:07 31-08-2014 | Исправлено: CHERTS, 21:19 31-03-2016
newptc

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
MSpeech давно уже устарел и я его не развиваю, если нужно нечто более удобное и более функциональное, то рекомендую программу Laitis  

Вы тоже бросились убивать WinXP ? ))
А за что? За то, что на неё забанили свежие сертификаты?
Нормальная рабочая система по сути, могли бы и попилить эту версию.

Всего записей: 32 | Зарегистр. 22-12-2018 | Отправлено: 00:24 23-12-2018
CHERTS



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не против WinXP, но у меня ее не осталось нигде. Не на чем собирать программу. А на виртуалке это делать не сильно приятно.

Всего записей: 489 | Зарегистр. 01-06-2002 | Отправлено: 04:18 23-12-2018
newptc

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я не против WinXP, но у меня ее не осталось нигде. Не на чем собирать программу. А на виртуалке это делать не сильно приятно.

ну хотя бы запрос к яндексу подправить ...

Всего записей: 32 | Зарегистр. 22-12-2018 | Отправлено: 12:41 05-01-2019
CHERTS



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ну хотя бы запрос к яндексу подправить ...

 
О каком запросе идет речь ?
 
Напишите мне в skype (cherts74) или tg (https://t.me/CHERTS), так будет оперативней.

Всего записей: 489 | Зарегистр. 01-06-2002 | Отправлено: 13:57 05-01-2019
newptc

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
О каком запросе идет речь ?

CHERTS, уже не получится сделать это тривиально. Они сменили правила строки запроса с 31 декабря.

Всего записей: 32 | Зарегистр. 22-12-2018 | Отправлено: 14:41 04-02-2019
tt43

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
есть какие-либо хорошая и свежая альтернатива сабжу ?

Всего записей: 2217 | Зарегистр. 04-02-2014 | Отправлено: 21:43 19-02-2020
dnmka



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
tt43
Есть Лайтис, выше упоминали. Довольно хорошая альтернатива.
 
Но там жопа в том, что она бесконтрольно устанавливается и, самое главное, обновляется в фоне. Сервер взломают, зальют троян и программа автоматом его установит без всяких вопросов, проверок и уведомлений пользователя...  Сколько такого воя было в интернетах - уже не счесть.
Автор, плюс/минус, вчерашний "школьник/студент" и о таких вещах не слышал, не думает или надеется, что его пронесёт. На многие вопросы, замечания и т.д. отвечает "мне лень/нет времени/не интересно".
 
Сейчас сам ищу замену. По уму бы всё сделать - цены бы софту не было!

Всего записей: 192 | Зарегистр. 29-09-2005 | Отправлено: 14:33 23-05-2020 | Исправлено: dnmka, 14:34 23-05-2020
BolgarchukR

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dnmka, Нашли замену? Удивительно, но я не нашёл вообще никаких альтернатив этой программы. Более того нет Обсуждения на форумах. Вот только здесь и то 2014 Вопросов много. Может попробовать этот MSpeech. Но насколько я понял здесь проект заглох. Кстати этот текст Диктую в Лайтис

Всего записей: 26 | Зарегистр. 27-03-2016 | Отправлено: 16:36 11-09-2022 | Исправлено: BolgarchukR, 16:37 11-09-2022
androabo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
**LilySpeech**
 
https://lilyspeech.com/

Всего записей: 49 | Зарегистр. 05-01-2013 | Отправлено: 17:42 11-09-2022
Natalia2362

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тут нет русского.

Всего записей: 141 | Зарегистр. 22-11-2017 | Отправлено: 21:13 08-01-2023
greeple

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вот такая еще есть
https://www.speechpro.ru/product/programmy-dlya-raspoznavaniya-rechi-v-tekst/voco
не использовал, но если нужно только распознавание и запись, то справится, но не аналог сабжу, хотя пишут что работает без интернета, какое качество распознавания без гуглов с яндексами, вопрос

Всего записей: 4234 | Зарегистр. 11-02-2020 | Отправлено: 22:28 08-01-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В Mageia Linux есть утилита для диктовки Elograf https://wiki.mageia.org/en/Voice_recognition (использует vosk модели)
Бесплатно, оффлайн, высокое качество распознавания даже с lite моделями, есть поддержка распознавания русского, украинского. Но там не управление компьютером, а именно диктовка в любом приложении.
Я знаю больную французскую женщину, которая успешно этим пользуется. А я проверил качество русского.
Linux в распознавании обскакал винду уже давно. В синтезе плох, да.

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 14:30 09-01-2023 | Исправлено: neorion, 14:38 09-01-2023
greeple

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
neorion

Цитата:
Linux в распознавании обскакал винду уже давно.

так там же отдельно на питоне написанное, его наверно и под винду можно сделать, причем тут обскакал то? это же не сам линукс распознаёт

Всего записей: 4234 | Зарегистр. 11-02-2020 | Отправлено: 16:29 09-01-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
greeple
Есть несколько сфер.
1. Диктовка с микрофона.
2. Распознавание звуковых файлов с сохранением в txt.
3. Распознавание звуковых файлов и создание синхронизированных субтитров srt (без знаков препинания, к сожалению, хотя для русского вроде есть отдельный модуль пунктуации)
2 и 3 можно делать из командной строки на Win7+, если установить python и модули. Только, мало кто знает команды. Для 3 также есть Kdenlive под Windows x64.
1 т.е. elograf написан на Qt5 и его в принципе можно собрать под Windows, но этого никто не делал. А papoteur (разраб) линуксоид магеевец.
 
Под обскакал я имею в виду сколько-нибудь готовое решение. Ну в общем, Kdenlive кроссплатформенный, да. Хотя, под Windows только x64, на линуксе есть 32 битные сборки Kdenive. Если не хочется с командной строкой возиться.
Elograf (диктовка) пока юзабельна только под Linux, причем только в Mageia. Хотя, может уже появились аналогичные программы под Windows, использующие vosk, я особо не слежу.
 
Но в общем вы правы. Это всё кроссплатформенно. Только приложение для диктовки не собрано под Win. Ну, тогда можно переиначить, что opensource обскакал.

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 17:08 09-01-2023 | Исправлено: neorion, 17:10 09-01-2023
mithridat1



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне нужно тупо распознать текст из звукового файла. Какие есть вменяемые приложения для решения этой задачи ? Желательно бесплатные.
Как я понял ни MSpeech, на Laitis такого делать не умеют.

Всего записей: 4946 | Зарегистр. 05-01-2006 | Отправлено: 19:37 13-02-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
mithridat1
Для Win7+ x64:
Ставите python 3.8 https://www.python.org/ftp/python/3.8.10/python-3.8.10-amd64.exe (все галки)
В терминале вводите pip install vosk
Скачиваете и распаковываете https://github.com/alphacep/vosk-api/archive/refs/tags/v0.3.45.zip
Заходите в папку vosk-api-0.3.45\python\example (в терминале команда cd)
Скачиваете голосовой модуль отсюда https://alphacephei.com/vosk/models (подойдет small)
Например, для русского языка https://alphacephei.com/vosk/models/vosk-model-small-ru-0.22.zip
Распаковываете в папку vosk-api-0.3.45\python\example\model
Скачиваете ffmpeg.exe https://ffmpeg.org/download.html в C:\Windows
Конвертируете ваш звуковой файл в wav любым конвертером и помещаете в папку example (необязательно)
В терминале выполняете команду python test_ffmpeg.py audio.wav | findstr "text"
Лучше настроить отображение терминала на весь экран
 
Для Win7+ x86:
Ссылка на python будет https://www.python.org/ftp/python/3.8.10/python-3.8.10.exe
https://github.com/alphacep/vosk-api/archive/refs/tags/v0.3.41.zip
pip install vosk==0.3.41
ffmpeg.exe скорее всего должен быть 32 битным
 
Как-то так.

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 20:46 13-02-2023 | Исправлено: neorion, 23:56 13-02-2023
mithridat1



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
neorion
Спасибо. А без питона, одним приложением, есть какие то варианты для Windows ?

Всего записей: 4946 | Зарегистр. 05-01-2006 | Отправлено: 06:41 14-02-2023 | Исправлено: mithridat1, 06:56 14-02-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
mithridat1
Есть плагин для Adobe Premiere.
 
А в чем проблема установить Python? Есть portable версия (portable установщик).
Проверил работоспособность в Windows (точнее, в Wine, но думаю не важно):
 
Win7+ x86:
Портативный python можно скачать здесь https://sourceforge.net/projects/mwayne/files/PythonPortable/PythonPortable_3.8.10_Dev_Test_1.paf.exe/download (взято отсюда https://portableapps.com/node/59485 ) и установить в C:\python (это установщик portable)
Зайти в эту папку в терминале
c:
cd c:\python
python -m pip install vosk
Это установит версию 0.3.44 (в c:\python)
Скачать и распаковать https://github.com/alphacep/vosk-api/archive/refs/tags/v0.3.45.zip в c:\vosk-api
cd c:\vosk-api\python\example
Скачать голосовой модуль отсюда https://alphacephei.com/vosk/models (подойдет small)
Например, для русского языка https://alphacephei.com/vosk/models/vosk-model-small-ru-0.22.zip
пока не распаковывать
Скачать ffmpeg, распаковать и скопировать ffmpeg.exe в C:\Windows https://ffmpeg.org/download.html (или поискать 32 битный в другом месте)
Положить звуковой файл audio.wav в папку example
В терминале ввести команду
C:\python\python.exe test_ffmpeg.py audio.wav
Автоматически скачается английский языковой модуль vosk-model-small-en-us-0.15.zip в эту папку
C:\users\user\.cache\vosk (пожалуй единственное нарушение portable режима)
Где user ваше имя пользователя Windows
Как заставить качать другие языки я не знаю. Всегда пытается использовать английский.
Так что будем подменять файлы. Нужный скачанный вами ранее языковой модуль (распакованный) поместить в папку
C:\users\user\.cache\vosk\vosk-model-small-en-us-0.15
неважно, что указано en-us, вот с таким именем
И повторить команду
C:\python\python.exe test_ffmpeg.py audio.wav
К сожалению, выводится и техническая информация и все слова поэтапно. Команда | findstr "text" (или | grep "text", если grep.exe aka grep for Windows скачан и находится в PATH) по идее должна фильтровать лишнее, но здесь она почему-то приводит к ошибке, может у вас заработает.
Так что придется копировать из терминала лишнее и фильтровать в другом месте. Терминал лучше заранее сделать в максимальный размер, ПКМ - пометить - выделить все - Enter (это скопирует весь текст в буфер обмена, там будут еще лишние переносы строк, где они в терминале).
А потом можно отфильтровать в LibreOffice Calc или Excel
ПКМ - Вставить (текст) - Данные - Еще фильтры - Стандартный фильтр - Параметры - снять галочку "диапазон содержит подписи столбцов" - столбец A содержит значение "text"
LibreOffice жирный пакет, но наверняка тоже есть portable версия или другие фильтровальщики.
Все это можно автоматизировать в батниках.
 
Добавлено:
И в свойствах терминала укажите большой буфер. По умолчанию всего 50 строк.
 
Добавлено:
pip еще гадит кэшем в Roaming\Local\pip

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 17:58 14-02-2023 | Исправлено: neorion, 18:37 14-02-2023
neorion

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А субтитры можно создать так:
C:\python\python.exe test_srt.py audio.wav > audio.srt
Но здесь уже на входе нужен именно wav. К сожалению, знаки препинания отсутствуют.
И кодировка может оказаться OEM-866 (DOS). srt файл скорее всего надо будет открывать в Akelpad или Notepad++.
Поэтому я не знаю, что станет, например, с западноевропейской диакритикой.

Всего записей: 448 | Зарегистр. 02-10-2022 | Отправлено: 21:34 14-02-2023 | Исправлено: neorion, 21:35 14-02-2023
Goodwin7



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оно только через интернет и гугла работает или без интернета ?

Всего записей: 70 | Зарегистр. 10-12-2022 | Отправлено: 22:04 15-02-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2

Компьютерный форум Ru.Board » Компьютеры » Программы » MSpeech


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru