Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Спасибо.
    Попробовал легкий вариант.
    Все встает без вопросов.
    Создал LTTS  и туда Спичпак установил.Да, теперь,не вываливается ошибка, как раньше было. Но просто звука нет, молча без всяких сообщений.
     
    Добавлено:
    а движок надо по умолчанию ставить или в созданную папку LTTS, куда Спичпак поставил?

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 22:39 24-01-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    После инсталляции файлы с расширением "dll" (LoqTTS6.dll; loqsapi5.dll) должны находится в директории "...\Program Files\Loquendo\LTTS" , там-же должны оказатся директории типа "EnglishGb", "EnglishUs" - в зависимости от установленного языка.
     Я лично сам ставил через голоса Qualispeak которые можно найти в Emule.
     
    Добавлено
    Аaa... если использовал лёгкий вариант (Собранный нашими корейскими друзьями) то там всё надо ставить (как движок так и SpeechPack) в директории по умолчанию (...\Program Files\Loquendo) - без всяких ...\LTTS. !!!  

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 10:01 25-01-2008 | Исправлено: vikkiv, 21:29 25-01-2008
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Спасибо.
    я поначалу как раз создал LTTS и туда Спичпак поместил,а движок по умолчанию поставил.Не пошло.Снес.
    ТОгда движок тоже в  LTTS при установке выбрал.
    Не пошло.Возможно,потому что он не в LTTS ставит,а папку внутри  LTTS создает.
    Поставил еще Qualispeak, тоже ничего.
    Снес движок и спичпак и их заново установил по умолчанию.Все заработало.И тексталауд и кволиспик.После этого убрал кволиспик. Голос работает.
    Немного смущает меня,что Кволиспик говорил про голос,что это 30 дневная трайл версия. Тексталауд ничего такого не говорит и не ругается.Надеюсь,что нормально будет работать,а не 30 дней.

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 21:37 25-01-2008
    ZeroTime

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Мне тоже в РМ напиши легкий и трудный способ пожалуйста. Кстати что там с регистрацией голосов, они все будут работать, или нужны какие то ухищрения?

    Всего записей: 135 | Зарегистр. 18-11-2007 | Отправлено: 16:50 26-01-2008
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ZeroTime, послал вам легкий способ.
    Трудный здесь описан выше тоже, прочтите внимательнее.
    Ослом,к примеру, воспользоваться можно.
    А вот будет ли через 30 дней голос Локуендо работать, не знаю пока.  
     я только что его поставил.

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 22:43 26-01-2008
    SkySandy

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    to SergeySPB
     
    Тогда и мне плиз вышлите этот способ. Все голоса уже скачал :-)

    Всего записей: 292 | Зарегистр. 20-01-2005 | Отправлено: 06:26 29-01-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Тогда и мне плиз вышлите...

    Появился местный способ установки Loquendo подробней здесь. Проверить не успел но источник сомнений не вызывает...
    Ещё один тестовый линк для Loquendo

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 17:53 29-01-2008 | Исправлено: vikkiv, 17:41 02-02-2008
    SergeySPB

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    SkySandy, послал вам легкий способ.
    Он у меня работает.
    С новой ссылкой от vikkiv пока не сравнивал.
     

    Всего записей: 39 | Зарегистр. 09-02-2006 | Отправлено: 21:02 29-01-2008
    xxx6286

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    николай 5.1 при записи в мп3 тире между словами читает как ИНДАЖ помогите избавится

    Всего записей: 2 | Зарегистр. 26-01-2008 | Отправлено: 20:58 01-02-2008
    Waasja

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Я скачал Катьку от НеоСпич. Подскажите пожалуйста, где взять верификейшен-файл и что с ним делать.
     
    Заранее спасибо.

    Всего записей: 16 | Зарегистр. 23-01-2008 | Отправлено: 09:15 03-02-2008
    Mister_Che

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Извините, а что нужно скачать, чтобы компьютерный голос читал текст и чтобы качать не много надо было, не эти 200метровые файлы. Объясните, пожалуйста, подробно.

    Всего записей: 353 | Зарегистр. 05-02-2006 | Отправлено: 17:58 03-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


    Цитата:
    ...николай 5.1 при записи в мп3 тире между словами читает...

     С такой проблемой не сталкивался - может это вина используемой программы для чтения или словаря.
     
     

    Цитата:
    ...Подскажите пожалуйста, где взять верификейшен-файл...

    Здесь с такими вопросами обращатся нельзя - читай правила (открытые зaпросы на кряк = бан)
    Что с ним делать - описано здесь. Где его взять затрудняюсь сказать #скрыто#
     
     

    Цитата:
    ...а что нужно скачать, чтобы компьютерный голос читал текст...

    Во первых - программу для чтения например такую или такую. А вообще выбор на рынке большой.
    Во вторых голос - тут уже по вкусу - либо 10, либо 200 метров или 800Мб, а можно использовать встроенный Microsoft. По русскому голосу есть отдельная ветка.

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 18:56 03-02-2008 | Исправлено: vikkiv, 01:24 04-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Выкладываю очередную партию ТТS голосов - на этот раз от Nuance - Realspeak Solo v4.0.2. По поводу демо это или нет - пока незнаю - время покажет.
     
    Внимание !!! Если у вас стояли предыдущие SAPI5 RealSpeak голоса - то установка этих их отключит (они перестанут работать) вследствии их несовместимости!!!
     
    Russian Katerina
    English US Jennifer Tom Jill Samantha
    English UK Daniel Emily Serena
    English Australian Karen
    English Indian Sangeeta
    French Canadian Julie Felix
    French European Sebastien Virginie
    Spanish Castilian Isabel
    Spanish Mexican Javier Paulina
    Partuguese Raquel - Brazilian  Madalena - European  
    German Steffi Yannick
    Chinese Sin-Ji (Catonese)  Mei-Ling (Mandarin) Ya-Ling (Taiwanese Mandarin)
    Greek Alexandros
    Polish Agata
    Danish Nanna
    Dutch Claire Laura Ellen (Belgian)
    Norwegian Nora
     
    Недостающие номера:
    02 - English - Lee - возможно встроен в этот продукт
    07 - English - Jane - старый очень, но возможно встроен в этот продукт
    17 - Italian - Silvia  
    18 - Japanese - Kyoko
    19 - -
    28 - Swedish - Ingrid - возможно встроен в этот продукт
    37 - -

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 02:58 04-02-2008 | Исправлено: vikkiv, 15:31 06-02-2008
    IGORGUBA



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Здравствуйте.
    Кто нибудь проверял, ссылки от vikkiv на голоса от  

    Цитата:
    Nuance - Realspeak Solo v4.0.2
    :
    это полные версии или все-таки демо?
    И как отличить демо от полной версии. Ограничение времени использования или функциональности?
     

    Всего записей: 2245 | Зарегистр. 19-02-2007 | Отправлено: 15:06 04-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    С ограничениями пока никто не сталкивался. Подробней в этом и в этом постах.
     
    Добавленно
     
      Вот косяк - перемотал время на системе на пару лет вперёд - и Катя тут-же заявила что работать дескать больше не буду, попользовался, поиспытывал и хватит... Ну что-ж будем копать глубже.

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 16:35 04-02-2008 | Исправлено: vikkiv, 22:41 05-02-2008
    IGORGUBA



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Здравствуйте!
    Поскольку в теме регулярно всплывают варезные вопросы, предлагаю создать ветку в ВАРЕЗНИКЕ по Text To Speech - софту. Там создать нормальную шапку и обобщить все, что уже добыто непосильным трудом.
    Знаю, что в варезнике есть топики и по WordRead, и по Loquendo. А вот другие голоса не охвачены. Вот и появляются здесь вопросы, за которые могут забанить и ответы на которые приходится шифровать...

    Всего записей: 2245 | Зарегистр. 19-02-2007 | Отправлено: 08:50 06-02-2008
    Schmul_1

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Господа участники форума!
    У меня вот какие проблеммы c движками Loquendo 6.
    1. При попытыке установить Simon_UK16 или Kate_UK16 или Bernard_Kate_UK16 программа установки говорит, что не установлен Character Builder.
    Что это такое и где его взять?
    2. Движки при снижении скорости чтения от положения по умолчанию (другими словами "0") останавляваются (т.е. виснут) после прочтения нескольких слов или строчек. Как бороться с этим?
    3. В TTSDirect не получается текст сохранить в mp3 (или в wav). Программа виснет (хотя чтение не оснавливается). Что с этим делать?
    4. Программа mp3book2005 не хочет работать с движками Loquendo (Мне нравится функция mp3book2005 сохранять аудиофайлы блоками). KoobAudio с движкамм Loquendo вистнет.
    Кто нибудь с этим сталкивался?
     
    А где ещё, кроме рапиды, можно взять английские голосовые движки от Acapela? Мне надоели ограничения бесплатного скачивания.
     
    Выложите где-нибудь программу Qualispeak.
     
     
     

    Всего записей: 5 | Зарегистр. 30-03-2007 | Отправлено: 18:30 06-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    1) При установке этих движков инсталятор проверяет наличие ключа HKCU\SOFTWARE\Media Semantics :

    Код:
    Windows Registry Editor Version 5.00
     
    [HKEY_CURRENT_USER\Software\Media Semantics]
    - после этого инсталяция моьет продолжатся.
    Достать демо Character Builder можно на том-же сайте где взял голоса которые нехотят устанавливаться.
    2) Скорость не снижаю поэтому помочь несмогу - пока не сталкивался с такой проблемой (а может вина слишком долго непереустанавливаемого Вондовса или установленного с ошибками)
    3) и 4) Тоже не знаю - никогда не пользовался - изпользую TextAloud (NextUp).
     
    Незаконное распостранение (хостинг) лицензионного софта запрещён законадательством большинства стран (если не всех) - пощтому от таких проблем не избавится - придётся терпеть ....
     
    QualiSpeak Демо можно скачать на одноимённом сайте.

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:10 06-02-2008
    IGORGUBA



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Здравствуйте!
    Такая проблема:
    при попытке установить голоса Loquendo от netsbrain.com выдается такое сообщение
    "Character Builder not found, installation is not Authorised, please install the Character Builder before installing this software".
    Объясните, пожалуйста, что надо сделать.

    Всего записей: 2245 | Зарегистр. 19-02-2007 | Отправлено: 00:44 10-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    а) Не устанавливать голоса этого производителя а использовать другие.
    б,в) Прочитать предыдущее сообщение.

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 01:55 10-02-2008
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru