Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    ErikMAL



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    BEERUS

    Цитата:
    Хочу потратить 50$  

    Не трать, скачай бесплатный Cool Reader 2 + голос, например Катерина 2 или Алена (английские голоса не пользую) мне нравится
    Cool Reader 2
    http://forum.ru-board.com/topic.cgi?forum=5&topic=16865&start=60
    а 50$ отдай бедным или руборду.
     
    P.S.
    Так никто и не подскажет мне на вопрос который я задал выше?

    Всего записей: 917 | Зарегистр. 07-11-2006 | Отправлено: 21:05 19-04-2010 | Исправлено: ErikMAL, 23:19 19-04-2010
    edgi



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Центр речевых технологий! Мне кажется один из лучших движков.
    Вот послушайте интерактивную демонстрацию: http://vitalvoice.speechpro.com/index.php?id=12740383881503

    Всего записей: 80 | Зарегистр. 22-12-2006 | Отправлено: 23:35 16-05-2010
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Центр речевых технологий! Мне кажется один из лучших движков.

    Это только кажется.

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 10:45 17-05-2010
    miksanfree



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    lapidus2000 10:45 17-05-2010
    Цитата:
    Цитата:
    Цитата:
    Центр речевых технологий! Мне кажется один из лучших движков.
     
     Это только кажется.    

    А по мне так действительно лучший. По крайней мере голос Владимир.

    Всего записей: 745 | Зарегистр. 28-07-2006 | Отправлено: 14:30 17-05-2010
    SelenaNight



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Центр речевых технологий! Мне кажется один из лучших движков.

    Все то же самое, просто клоны какие-то
    Девочки такие же заики, как и прежние Кати/Оли/Алены причем Мария и Лидия очень визглявостью Катю напоминают.

    Цитата:
    А по мне так действительно лучший. По крайней мере голос Владимир.

    Это если кого-то грузинский акцент радует. Александр нейтральнее, не так отвлекать будет во время чтения. Хотя он тоже заика.

    Всего записей: 335 | Зарегистр. 27-02-2006 | Отправлено: 16:23 17-05-2010
    miksanfree



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    SelenaNight 16:23 17-05-2010
    Цитата:
    Это если кого-то грузинский акцент радует.
    да нет там ничего грузинского.

    Всего записей: 745 | Зарегистр. 28-07-2006 | Отправлено: 18:38 17-05-2010
    ALEKCEN



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ищу прогу Sakrament Personal Voice Master v. 2.0 (for Windows) + кряк

    Всего записей: 687 | Зарегистр. 08-04-2008 | Отправлено: 19:11 20-05-2010
    ego9999

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Почему-то все более-менее приличные русские голоса делают заграничные буржуИ, а нормальные родные русские голоса сами сделать не можем. Парадокс!!!
    Если поверить тому, что выложено в демонстрации Центра речевых технологий, оба мужских голоса вроде неплохие. Но, по-моему, это какая-то афера. Если кто-нибудь уже имеет и использует эти голоса (также и версии для мобильных телефонов), какие впечатления, можете поделиться?  

    Всего записей: 22 | Зарегистр. 27-04-2007 | Отправлено: 01:14 22-05-2010
    Hmuryj_Mik



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ego9999
    С точностью до наоборот. "Приличный движок" только один и именно он "сделан" в Питере.

    Всего записей: 832 | Зарегистр. 22-08-2004 | Отправлено: 21:47 26-05-2010
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Hmuryj_Mik 20:47 26-05-2010
    Цитата:
    "Приличный движок" только один и именно он "сделан" в Питере

    Это который?

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 22:54 26-05-2010
    news2002



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вот кому интересно, нашел еще одну програму Ivona довольно хорошую, подерживает следуюшие языки: Romanian, Polish, American English, British English.
     
     

    Всего записей: 16 | Зарегистр. 09-12-2006 | Отправлено: 23:40 27-05-2010
    Hmuryj_Mik



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Rodny
    Digalo/Acapela ELAN TTS (Nicolai 16 kHz)
    Естественно - это моё мнение.

    Всего записей: 832 | Зарегистр. 22-08-2004 | Отправлено: 22:01 30-05-2010
    Chubchik



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Насколько знаю Digalo - была всегда французская фирма. И кстати если внимательно послушать произношение некоторых слов у Nicolai, отчетливо слышится некий "белоэмигрантский" акцент и определенные особенности произношения слов, характерные именно для дворян начала прошлого века, судя по старым фильмам и сохранившимся звукозаписям тех времен естественно. Т.е. вполне понятно думаю, откуда у этого движка "ноги растут". Непосредственный создатель голоса Nicolai скорее всего русский, но родившийся где-нибудь в Париже в семье потомков эмигрантов. Отсюда и много неточностей Nicolai в отношении современного русского языка.
    Тем не менее, такое впечатление, что несмотря на давность разработки и низкую разрядность звука, этот голос до сих пор остается одним из самых качественных мужских для русского языка.
    А из приведенного демо, действительно Владимир чуть поточнее будет в произношении, чем все остальные у них. В целом же, несмотря на широкий диапазон тембров данных голосов, сама основа у них похоже слабовата - много все тех же вибрирующих призвуков, что и у самых примитивных движков, плохо проработано произношение окончаний некоторых слов.
    Хотя само собой интересно было бы опробовать это все в оффлайн, на реальной проверке.
    Может есть у кого-нибудь ссылки хотя бы на Владимира?

    Всего записей: 17 | Зарегистр. 01-11-2008 | Отправлено: 04:21 05-06-2010
    VsVsV

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    У меня Windows 7 x64. Никакие голосовые движки не работают. Установил Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista и исправление. Безрезультатно. Программа работает, читает, но ничего не слышно! Чот можно сделать?
     
    p.s. Все. Разобрался. Дело было в настрйках звука в системе.

    Всего записей: 65 | Зарегистр. 06-02-2008 | Отправлено: 13:40 06-06-2010 | Исправлено: VsVsV, 23:05 06-06-2010
    Hmuryj_Mik



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    "Digalo Russian Nikolai - разработан в соответствии со стандартом MS SAPI 4 и является собственностью французской компании Elan Informatique. Высокое качество синтезированной речи движка, разговаривающего довольно внятным баритоном и, главное, без иностранного акцента даже при озвучивании ненормативной лексики, может кого-то удивить: "И как это французам удалось так хорошо натренировать "Коляна"?" Однако это вполне объясняется тем, что создан голос русскими людьми на той же кафедре экспериментальной фонетики Санкт-Петербургского Государственного Университета. Информация эта мало кому известна и уж тем более не афишируется владельцами движка."

    Всего записей: 832 | Зарегистр. 22-08-2004 | Отправлено: 18:48 07-06-2010
    ego9999

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    "...Однако это вполне объясняется тем, что создан голос русскими людьми на той же кафедре экспериментальной фонетики Санкт-Петербургского Государственного Университета".
     
     
    В том то и дело что до ума не довели, вот и "является собственностью французской компании Elan Informatique".

    Всего записей: 22 | Зарегистр. 27-04-2007 | Отправлено: 20:59 07-06-2010
    Hmuryj_Mik



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    В том то и дело что до ума не довели, вот и  

    Вы там работали, и Вам не дали дОвЕсти, что-ли? Или у Вас есть результаты успешнее?

    Всего записей: 832 | Зарегистр. 22-08-2004 | Отправлено: 23:06 07-06-2010 | Исправлено: Hmuryj_Mik, 23:08 07-06-2010
    ego9999

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ты так пишешь, как будто ты там работал и довел до конца... Успокойся, и сперва пойми о чем идет речь.

    Всего записей: 22 | Зарегистр. 27-04-2007 | Отправлено: 22:29 10-06-2010 | Исправлено: ego9999, 22:32 10-06-2010
    Hmuryj_Mik



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ego9999
    Да не - я спокоен  Лично я к этому продукту отношения не имею. Не люблю необоснованых "наездов" этак "по-ходу". Ламерство в чистом виде. И что тут можно понять "о чем идет речь" -
    Цитата:
     В том то и дело что до ума не довели, вот и "является собственностью французской компании Elan Informatique".
    Пользуюсь продуктом 10 лет. Да, есть недостатки, но альтернативы пока для меня (!) нет. Это все. Больше "шуметь" не буду

    Всего записей: 832 | Зарегистр. 22-08-2004 | Отправлено: 18:34 11-06-2010 | Исправлено: Hmuryj_Mik, 18:36 11-06-2010
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Предлагаю послушать. Текст похоже неподготовлен, совпадает с онлайн-версиями, считаю, ЦРТ потрудились на славу. По-моему, звучит достаточно эффектно (особенно "Владимир"), если не обращать внимание на заминки при подгрузке и некоторые глюки.  
     Вот как только ПО называется, цена, рабоатает ли с SAPI, как привязать к читалке информации нет,  TTS для шпионов?

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 12:19 06-07-2010
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru