Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    В конце-концов получил, относительно приемлемый результат, заставляя SAPI формировать треки "+1 буква" и каждый раз меряя длину трека.
    Без callback-ов?

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 05:34 18-08-2016
    esisl

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Варварски.
    Берём фразу текста.
     
    Берём 1-й символ, озвучиваем, меряем длину  трека в отсчётах.
    Прибавляем 2-й символ, озвучиваем, меряем длину трека в отсчётах.
    Прибавляем 3-й символ, озвучиваем, меряем длину трека в отсчётах.
    ....
    Прибавляем последний символ, озвучиваем, меряем длину трека в отсчётах
     
    Страшно? "А мы тут живём!" (с)

    Всего записей: 10 | Зарегистр. 19-07-2016 | Отправлено: 20:50 18-08-2016
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Страшно?
    Лучше б разобрались, почему callback-и не работают.
    Может просто как-то включить нужно?
    А то как в анекдоте, "Дергаем зубы, через Ж, автогеном!"

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 22:12 20-08-2016
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Где последний словарик к Коле можно скачать, на 2x2 вроде старый?

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 23:13 06-03-2017 | Исправлено: king_stiven, 23:14 06-03-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Где последний словарик к Коле можно скачать, на 2x2 вроде старый?
    Да вроде новее и не было...

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 00:33 07-03-2017
    3y6acTuK

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Есть нормальные форумы по Text-To-Speech кроме mytts.forum2x2.ru?
    Там ни зарегистрироваться нормально невозможно, ни сообщение написать, ни скачать - ссылки спрятаны или битые. Пора этот форум в утиль и открыть новый форум или здесь раздел по TTS читалкам.
    Какие альтернативы этому недоделанному mytts.forum2x2.ru ?

    Всего записей: 385 | Зарегистр. 23-07-2007 | Отправлено: 14:30 04-04-2017 | Исправлено: 3y6acTuK, 18:31 04-04-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Какие альтернативы этому недоделанному mytts.forum2x2.ru
    Вроде нет, сам ищу...

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 19:27 04-04-2017
    svitus



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Я правильно понял, что словаря для Ирины (из Windows 10) нет? Может кто-нибудь знает, как хотя бы в тексте или в той же Балаболке можно отредактировать ударения?

    Всего записей: 228 | Зарегистр. 01-09-2006 | Отправлено: 15:19 05-04-2017
    VeryBigFool

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ни у кого нет последней версии myTTS Проверялочки с http://mytts.forum2x2.ru/t344-topic ?

    Всего записей: 37 | Зарегистр. 08-12-2007 | Отправлено: 09:51 10-04-2017
    romby



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    VeryBigFool
    Есть такая... не знаю, последняя ли.

    Всего записей: 1785 | Зарегистр. 09-02-2006 | Отправлено: 22:47 19-04-2017
    VeryBigFool

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Похоже, что последняя. Но почти все ссылки на файлы мертвы

    Всего записей: 37 | Зарегистр. 08-12-2007 | Отправлено: 10:31 20-04-2017
    odinokiyklaus



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Есть нормальные форумы по Text-To-Speech кроме mytts.forum2x2.ru?
    Там ни зарегистрироваться нормально невозможно, ни сообщение написать, ни скачать - ссылки спрятаны или битые. Пора этот форум в утиль и открыть новый форум или здесь раздел по TTS читалкам.
    Какие альтернативы этому недоделанному mytts.forum2x2.ru ?

     
    Ну трёщки-матрёшки! Разве так можно!!? Конечно же есть. идите сюда-http://koobaudio.narod.ru/. На сайте есть последняя версия 2.1.2.8744 (05.02.2017) программы которая и читает и записывает в mp3 формате. Словари к программе и профиль можете к примеру взять у меня - http://koobaudio.narod.ru/load/dic/clovari_ot_odinokiyklaus_obnovleno_na_28_01_2017/1-1-0-12, а если не понравится порыться в других словарях - http://koobaudio.narod.ru/load/
     
    А если не помагает - пишите на форуме. Лично мне сильно нравится Николай, с него не собираюсь уходить. И программа KoobAudio - лучшая не побоюсь этого слова на сегодняшний день для Николая.

    Всего записей: 7 | Зарегистр. 17-10-2006 | Отправлено: 21:35 04-05-2017
    Shershn



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Народ на ru-board вообще есть тема по Acapela-Group Алёна, если нет подскажите плиз где найти версию 3+ под Win10 х64???  
     
    Я честно вспотел искать(
     
    Ps На koobaudio.narod.ru Алёну не нашёл

    Всего записей: 45 | Зарегистр. 14-06-2007 | Отправлено: 23:38 18-05-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Ps На koobaudio.narod.ru Алёну не нашёл
    Алёна это считается несолидно, несовременно и т.п и т.д.
    Вам же написали выше: Николай и никаких дам!

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 01:13 20-05-2017 | Исправлено: Apokrif, 01:48 20-05-2017
    Shershn



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Apokrif - судя по шапке Николай это Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 ???
     
    ps Если не тяжело поделитесь ссылкой на рабочую сборку, а то поиск на ru-board уж очень своеобразный!

    Всего записей: 45 | Зарегистр. 14-06-2007 | Отправлено: 15:10 21-05-2017 | Исправлено: Shershn, 15:18 21-05-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Гуглить не пробовали - живых ссылок вагон.

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 21:23 21-05-2017
    Shershn



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Да много, но не доверяю я им уж очень часто потом лечится приходится.
    А после  ru-board ещё ни разу! )

    Всего записей: 45 | Зарегистр. 14-06-2007 | Отправлено: 20:38 22-05-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    По поводу форума по Text to speech. Давольно давно была создана почтовая конференция с тем же названием: mytts. Естественно, модерирование, поддержка архивов, Web версия, всё как надо короче. Конференция создана в сервисе groups.io. Если надо, могу предоставить.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 16:32 25-05-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Доброго времени суток всем. В связи с периодическими глюками, появилось желание восстановить в нормальном виде форум по TTS. mytts.forum2x2.ru. Естественно, нормальный хостинг, нормальный домен второго уровня, будет всё. Все финансовые вопросы, вопросы поддержки, естественно тоже беру на себя. В создании, пока склоняюсь к движку Pun BB. Если мой выбор кого-нибудь не устроил, высказывайте своё мнение. Что тогда по вашему лучше? Со своей стороны могу горантировать, что форум не уйдёт в вечный даун через некоторое время. Я всегда очень был заинтересован в развитии Tts технологий, можно сказать, использование их в моей жизни даже необходимо, по этому смело могу сказать, что ресурс заброшен не будет. Любая критика принимается, выслушаю всё. Высказывайте своё мнение. Прислушаюсь ко всем.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 21:29 15-06-2017 | Исправлено: se97, 23:36 15-06-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    появилось желание восстановить в нормальном виде форум по TTS. mytts.forum2x2.ru.
    Мне кажется, скорее народ разбежался. Был бы интерес, давно бы сюда или на 4pda перешли...

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 08:05 16-06-2017
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru