Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Pitersky

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Boris 123

    Цитата:
    есть ли Украинский движок?

    Есть программа для чтения украинских текстов использующая русский движок - Bazikalo

    Всего записей: 2532 | Зарегистр. 19-06-2003 | Отправлено: 16:18 16-04-2007
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    есть ли Украинский движок?  

    ... Или попробуй поискать файл "ukrvox" в Google. Cам не ставил - просто читал где-то информацию что этот украинский синтезатор совместим с SAPI5. О качестве не-знаю.
     
     
    ....
     
    А вот тут нашёл. Ukrvox

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:06 18-04-2007 | Исправлено: vikkiv, 19:09 18-04-2007
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    По звучанию что-то вроде Кати, но гораздо хуже.

    Всего записей: 2232 | Зарегистр. 17-07-2006 | Отправлено: 16:51 23-04-2007
    hyphen

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Может кто знает?
    Я установил textAloud для прослушивания текстов. Но все голоса идут с каким-то эхом. Можно ли от этого избавиться?

    Всего записей: 101 | Зарегистр. 22-04-2002 | Отправлено: 06:01 06-05-2007
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    "все голоса идут с каким-то эхом. Можно ли от этого избавиться?"
     
    да вроде не должно быть такого.Я несколько раз устанавливал и таких эффектов не было.Эхо только с textAloud возникает?Если другие программы нормально работают и это не эффект вашей звуковой карты,то стоит переустановить textAloud попробовать.

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 20:55 06-05-2007
    LAndrew



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    подскажите, плз, как сделать следующее: имеется около 50 txt файлов, каждый содержит по одной строчке текста на русском языке. Необходимо перевести каждый файл в mp3 (идеально - сразу в ogg).  
    Накачал кучу разных прог и голосов (в т.ч. и Екатерину - ни одну прогу из скачанных так и не сумел заставить увидеть ЭТОТ голос).  
    Из прог имеется:
    Digalo 2000 rus
    Говорилка
    ELAN TTS Speeche Cube v4.2.0.0
    ELAN Tempo Multimedia v.5.1.0.0
    MP3book2005 (не запускается)
    Cool Reader 2.0
     
    более менее нормально работает Cool Reader - видит голоса от двух эланов (оба - Николай) и еще третьего Николая. Катерину не видит.
     
    Что делать? Как достичь желаемого с наименьшими усилиями?

    Всего записей: 390 | Зарегистр. 10-05-2003 | Отправлено: 23:58 20-06-2007
    Foss

    Advanced Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    LAndrew
    Попробуй
    ICE Book Reader Professional
    Может он увидит.
    Если все MS Agent (0419), Speech API, MS TTS 5.1 правильно установлены....

    Всего записей: 1316 | Зарегистр. 15-04-2003 | Отправлено: 00:37 21-06-2007
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Cool Reader 2.0  
     более менее нормально работает Cool Reader - видит голоса от двух эланов (оба - Николай) и еще третьего Николая. Катерину не видит.

     
    ... странно    у меня CR работает и с Катей и с Дженнифер " на ура " ... попробуй скачать последний билд (5807) , переинсталь компоненты , Катю - должно работать !.. попробуй ( на худой конец ) TextAloud ...  
     

    Цитата:
    MP3book2005

     
    это тоже - косяк ... что значит - не запускается ?.. вообще не стартует что ли ?.. или ошибку какую - то " выдает " ?..  

    Всего записей: 5708 | Зарегистр. 19-12-2003 | Отправлено: 01:49 21-06-2007 | Исправлено: maK, 03:26 21-06-2007
    LAndrew



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    maK
    MP3book2005 выдает ошибку, описанную в факе -  

    Цитата:
     
    При установке программы выскакивает ошибка Run-time error '429': ActiveX component can't create object В чем проблема?  
     

    ...
    винду переставлять не вариант.

    Всего записей: 390 | Зарегистр. 10-05-2003 | Отправлено: 08:07 21-06-2007
    LAndrew



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    что-то никак не могу понять...
    скачал Катерину, установил - появилась папка c:\Program Files\NextUp-ScanSoft\, в ней - папка speech, а в ней components\ и rssolov4\.
    а что с ней делать? может её в папку с text aloud надо ставить? или с серверами elan? или перенести файлы куда?
     
    при переключении SAPI Version в TextALoud на Use SAPI5 Only (с Use SAPI4 Only) получаю ошибку Sapi5 Create Error: Test for Sapi5 installed failed. Хотя Microsoft-English-TTS-51.msi я ставил два раза - все проходит успешно.  
     
    может какую службу надо запустить? (Win XP, без сервиспаков)
     
     
     
    если у кого-нибудь есть рабочая Катя и немножко времени - переведите плз эти текстовые файлы http://stream.ifolder.ru/2438821 в mp3 (22050 bit rate, 16 bit)

    Всего записей: 390 | Зарегистр. 10-05-2003 | Отправлено: 21:23 21-06-2007 | Исправлено: LAndrew, 21:30 21-06-2007
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    LAndrew
     
    21:23 21-06-2007
    Цитата:
     (Win XP, без сервиспаков)

     
    ... это , конечно , нонсенс ...  
     
    LAndrew
    08:07 21-06-2007
    Цитата:
    винду переставлять не вариант.

     
    ... а вот этого , похоже , - не избежать ..
     
    P.S. ...  по твоей ссылке файлы скачал - завтра , после завтра выложу " работу " ... устроит ?
     
     
    Добавлено:

    Цитата:
    завтра , после завтра выложу

     
    ... а вот здесь я слегка поторопился
     
    http://dump.ru/files/g/g4020954/  ... получи и распишись
     

    Всего записей: 5708 | Зарегистр. 19-12-2003 | Отправлено: 22:16 21-06-2007 | Исправлено: maK, 22:36 21-06-2007
    seagram



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, что за ерунда движок Nicolai вылетает с ошибкой память не может быть red

    Всего записей: 107 | Зарегистр. 27-08-2007 | Отправлено: 16:31 27-08-2007
    rwiss



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Есть ли оболочка для SAPI5 которая может читать введенные с клавиатуры фразы? Т.е. не заранее написанный текстовый файл, а именно текст написанный в окне программы?

    Всего записей: 37 | Зарегистр. 09-10-2006 | Отправлено: 12:23 09-09-2007
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Есть ли оболочка для SAPI5 которая может читать введенные с клавиатуры фразы? Т.е. не заранее написанный текстовый файл, а именно текст написанный в окне программы?

    Ну,к примеру, TextALoud можно настроить и он будет любой подсвеченный текст читать.
    Еще можно настроить,чтобы он вводил к себе с КлипБорда и читал.
     

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 23:40 09-09-2007
    Jugador

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Katerina есть на www.torrents.ru Конечно, получше Николая, но слишком уж булькает...   вот английские движки natural voices супер!!! Сэмплы тут www.nextup.com/ . А скачать можно на www.mininova.org  точнее http://www.mininova.org/search/tts/7    
    Качать не просто, а данной прогой.. http://www.utorrent.com

    Всего записей: 138 | Зарегистр. 14-04-2004 | Отправлено: 05:37 10-09-2007
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    как вам последнее предложенине из
    http://nshmyrev.narod.ru/temp/example2.wav
    ?

    Всего записей: 2232 | Зарегистр. 17-07-2006 | Отправлено: 19:03 01-10-2007
    nag

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    king_stiven
    Нет такого файла, а что за предложение?
     
    2all:
    Подскажите, пожалуйста, как научить Катерину произносить слова? Сейчас вместо обычного смайлика "" она произносит минуты две какие-то дробные числа вслух. Хотя смайлик ":-D" она произносит как "Смайлик громко смеётся". Если был бы у нее какой-нибудь словарь с возможностью редактирования, то было бы замечательно.

    Всего записей: 858 | Зарегистр. 01-10-2003 | Отправлено: 10:22 27-10-2007 | Исправлено: nag, 10:25 27-10-2007
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    nag
     
    Обратись сюда, но в твоем случае это вряд ли поможет...
    Тема по сабжу в "Программах"

    Всего записей: 5708 | Зарегистр. 19-12-2003 | Отправлено: 12:21 27-10-2007
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Нет такого файла, а что за предложение?  

     
    имелась ввиду система синтеза русской речи-
     
    http://festlang.berlios.de/docu/doku.php?id=russianru  Русский в Festival
     
    Представлены 4 образца синтеза:  
     
    russian_diphone.wav - дифонный синтез  
    russian_cl.wav - кластерный синтез
    russian_cg.wav - кластерный синтез с HMM
    russian_cl_urp.wav - кластерный синтез с помощью базы urp (msu_ru_nsh_clunits-0.4)
     
    Четвертый образец, вроде как, поприличнее звучит.
    Но все они явно хуже Катерины пока.
     
     
     

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 23:44 27-10-2007
    SelenaNight



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    У меня с давних времен установлен Николай Digalo 2000, я к нему привыкла, только тихий очень. Катерину тоже поставила, но очень уж раздражает эта стерва (хотя говорит хорошо и громкость нормальная).
    Подскажите, пожалуйста, новый Николай 5.1 будет громче прежнего? и нужно ли деинсталировать старый перед установкой нового?
     
    Не дожалась ответа, установила... поэтому сама себе отвечаю
    1. Коля 5.1 громче, чем Коля Digalo2000
    2. После установки нового старый Коля тоже работает корректно. А вот новый работает только как SAPI5, как SAPI4 говорит молча ) что в общем-то не так критично, поскольку остался старый Коля, а он SAPI4.

    Всего записей: 335 | Зарегистр. 27-02-2006 | Отправлено: 22:06 30-11-2007 | Исправлено: SelenaNight, 02:31 01-12-2007
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru