Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Yeeshik

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Небольшое дополнение: не устанавливать голоса с nеtsbrain, лучше берите голоса Lоquendo с другого сайта. В любом случае ядро (движок) нужно устанавливать отдельно.

    Всего записей: 185 | Зарегистр. 02-11-2006 | Отправлено: 15:07 10-02-2008
    IGORGUBA



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Здравствуйте!
    С голосами от Loquendo разобрался, спасибо.
    Прошу поделиться ссылками на полные версии голосов Lee, Karen и Daniel от Nuance/ScanSoft.  
    Заранее, спасибо.

    Всего записей: 2242 | Зарегистр. 19-02-2007 | Отправлено: 08:47 11-02-2008 | Исправлено: IGORGUBA, 09:51 11-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Скачай Демо и замени оригинальные файлы на эти (в комплекте Samantha Emily Daniel Tom). Всё что пока достал.. Теоретически должно работать (проверено на Кате).
    Если нужны Австралийские Английские голоса то они есть здесь -Karen Lee. Открой файл rar-ом или zip-ом и там в директории tts/061 найдёшь соответсвующие голоса. Они версии 4.0.0 и не совместимы с теми которые идут под грифом Демо (так как ставятся в другую директорию). Разархивируй и запусти. Они встанут в директорию windows/system32/speech. При наличии необходимых навыков их можно без проблем запустить на более поздних версиях движка 4.0.2 (только последнюю версию надо ставить последней). Необходимо их просто перенести в соответствующую директорию и переписать пути в токенах в Windows регистре. Может на том-же сервере есть и более новые версии но слишком много качать чтобы проверить.

    Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 23:31 11-02-2008 | Исправлено: vikkiv, 01:21 12-02-2008
    KostAntin

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А можно файлы подобные 'этим' и для Кати выложить чтобы она была не демо  ?
    И еще  скажите в какой директории  их заменять

    Всего записей: 8 | Зарегистр. 23-10-2007 | Отправлено: 22:29 23-02-2008
    oleg306

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    М

    Всего записей: 1 | Зарегистр. 25-02-2008 | Отправлено: 15:01 25-02-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    KostAntin
    Для Кати есть отдельная ветка - читай внмательней - там всё есть.

    Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 16:16 26-02-2008
    Tanomir

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    to SergeySPB
     

    Цитата:
    А вот будет ли через 30 дней голос Локуендо работать, не знаю пока.  
     я только что его поставил.

     
    ну и как работает? И еще вышли мне легкий способ. Заранее спасибо.

    Всего записей: 3 | Зарегистр. 03-03-2008 | Отправлено: 22:29 06-03-2008
    demon1981



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    to vikkiv
    Цитата:
    Самый лёгкий вариант смотри в ПМ

    поясни пожалуйста что такое ПМ

    Всего записей: 189 | Зарегистр. 28-03-2007 | Отправлено: 09:08 13-03-2008
    Barik80

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, что мне нужно зделать, чтобы видеть скрытый текст?

    Всего записей: 3 | Зарегистр. 21-06-2007 | Отправлено: 09:43 13-03-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    demon1981
    ПМ = Private Message - личное сообщение в ящик
     (Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору)
    Но конкретно по Loquendo лёгкого варианта у меня больше нету, пропала необходимость.
     
    Barik80
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
     
    И вообще прежде чем писать на форуме надо ознакомится с правилами пользования, там есть ответы на оба вопроса - здесь тематическая ветка а не раздел поддержке пользователей.

    Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 16:09 14-03-2008
    Barik80

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Благодарствую!

    Всего записей: 3 | Зарегистр. 21-06-2007 | Отправлено: 16:22 17-03-2008
    af1995131

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    vikkiv
    Вчера купил на http://www.flamespeech.com/purchase.html FlameReader и два голоса
     от AT@T Charles 16kАudrey 16k, а сегодня нашел вашу ветку.
    Пару вопросов: ATT Natural voices и ATT Natural voices 2 веши разные или нет.
    Что я купил-судя по вашей таблице- просто ATT Natural voices(хотя они 16K)  
    Стоит ли менять на 2? Нужен австралийский английский (karen)-будет ли он работать с  
    FlameReaderom?
    И как итоговый вопрос, ваш совет, что мне установить(какой голос и движок(?) чтобы по-максимуму получить качественный английский(либо австрал.) английский.

    Всего записей: 1 | Зарегистр. 20-03-2008 | Отправлено: 08:38 20-03-2008
    Gideon Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Какой движок из доступных    на данный момент лучше всего воспроизводит английскую речь?

    Всего записей: 8084 | Зарегистр. 02-02-2004 | Отправлено: 08:45 20-03-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    af1995131
    1 и 2 одни и те-же версии - разница просто в поставщике (продавце)
    Карен должна работать с любыми САПИ-5 совместимыми приложениями - большинство современных программ таковыми и являются.
    К стати - там чатсь линков уже мёртвые - будет время - отредактирую.
     
    af1995131
    Gideon Vi
     
    По поводу Английских уже писалось здесь - но мнение субъективное - кому что нравится..

    Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 11:56 21-03-2008
    lexander161

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Народ совсем запутался дайте ссылки на русские ScanSoft Катерина 22Khz, peech Cube Elan v5.1 - Николай (Nicolai) 16Khz, Сакрамент - Рассказчик 3 (TalkerPro) - никак не могу найти где их скачать (ну и кряки для них) заранее спасибо.

    Всего записей: 5 | Зарегистр. 27-04-2008 | Отправлено: 19:58 11-05-2008 | Исправлено: lexander161, 20:01 11-05-2008
    Shadowsmaster

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Установил WinXP SP2 как обычно в который раз с одного и того же дистрибутива. Но никаким усилиями не могу заставить использование какого либо голоса (В основном использую от ATT Crystal, Mike, Julia) ни в говорилке (ругается на ошибку при использовании любого голоса) ни в промте 8 експерте (просто не доступна кнопка настройки речи) хотя раньше все работало чудесно. При том что в настройках речи в панели управления виндовс голоса прекрасно видно и они даже читают тестовый текст! Винда полностью обновлена с майкрософт, сейчас уже даже SP3 поставил думал может поможет, нет толку никакого. Также ставил отдельно SAPI 4, 5.1 тоже толку ноль.

    Всего записей: 20 | Зарегистр. 08-06-2008 | Отправлено: 08:12 08-06-2008
    Gideon Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Shadowsmaster, попробуй

    Всего записей: 8084 | Зарегистр. 02-02-2004 | Отправлено: 10:09 08-06-2008
    Shadowsmaster

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    нет это мне не помогло, но зато благодаря программе Балаболка я понял, что sapi 4.1 у меня не работает совсем, либо пишет выберите голос хотя он выбран, либо тишина. Зато sapi 5.1 работает нормально благо в балаболке можно выбрать. Теперь понятно почему молчали говорилка и промт они юзают только 4.1 а с ней у меня какие то проблемы хотя я ее переустанавливал. А может не ее? Файл spchapi.exe скачанный с майкрософт.

    Всего записей: 20 | Зарегистр. 08-06-2008 | Отправлено: 10:30 08-06-2008
    korvinio



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Народ, скажите пожалуйста, есть у кого STC TTS Engine 1.5 - то бишь Оратор. По характеристикам и примерам озвучки куда кручи Коли. Конечно, к акценту тоже привыкнуть надо, но честно скажу, речь более человеческая. Если кто располагает данным движкем, прошу вас пожалуйста поделитесь.

    Всего записей: 50 | Зарегистр. 12-01-2008 | Отправлено: 21:45 12-06-2008
    raistin

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Тоже интересует - STC TTS Engine
    Поделитесь....
    Хотя бы впечатлениями...)))
    Ценник - 600 рублей.
    Стоит брать или Дигало Николай не хуже?
     
     
    Добавлено:
    Примеры синтеза речи на оф. на сайте особо не впечатляют...

    Всего записей: 12 | Зарегистр. 27-04-2008 | Отправлено: 11:12 25-06-2008
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru