Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Gideon Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Существует ли хороший словарь для Аленки?

    нет

    Всего записей: 8084 | Зарегистр. 02-02-2004 | Отправлено: 03:19 01-08-2008
    dimzdrec33



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ajaja
     
    Так вот с омографами и будут самые главные проблемы. Можно сделать правильные транскрипции на подавляющее большинство "неправильных" слов, но все равно, процентов 5 в русском тексте это омографы и конечному пользователю придется самому при чтении или записи каждого нового текста редактировать произношение слов. Поэтому полагаю было бы здорово, если бы коллективными усилиями тех, кто может, а самое главное, хочет упростить эту процедуру был выработан какой-то алгоритм, используя который, уже можно было бы, в соответствии со своими нуждами, целями и т.д. создавать какой-то упрощенный редактор произношения, работающий непосредственно с самим текстом.

    Всего записей: 1238 | Зарегистр. 20-07-2005 | Отправлено: 23:09 02-08-2008
    irrisorrimus

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Пользуюсь МП3бук2005, с 2006 года. Скачал Alyona (170 мегов), поставил. Хрипов нет, как у николая, но слушать затруднительно из-за интонации. Для записи книг тоже не подходит ввиду малой скорости. Так что рвать себе ради Alyona ничего не советую, она того не стоит.

    Всего записей: 1 | Зарегистр. 22-01-2007 | Отправлено: 00:18 03-08-2008
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    dimzdrec33

    Цитата:
    Так вот с омографами и будут самые главные проблемы. Можно сделать правильные транскрипции на подавляющее большинство "неправильных" слов

    Не так это и просто сделать в дефолтном словаре, учитывая морфологию русского языка. Возьмем слово "оцифровать", которое Алена говорит неправильно, вместе со всеми его формами, которых 74,  если не ошибаюсь. И это еще без приставок недо-, пере- и т.д.
    Как его добовлять в стандартный словарь? Даже если автоматизировать этот процесс, то словари будут выходить просто громадного размера.  
     
    Тоесть в рамках какой-нибудь отдельно взятой читалки что-то еще можно придумать  (упрощенный словарь с *оцифро<ван*,*оцифрова<*,*оцифру<*, и.т.д,  и дальше преобразовывать в фонемы  и работать с нимим, как я писал в соседней теме), но вот сделать универсальный словарь будет по-сложней
     

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 02:11 03-08-2008 | Исправлено: Ajaja, 03:13 03-08-2008
    Wasil

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Пользуюсь МП3бук2005, с 2006 года. Скачал Alyona (170 мегов), поставил. Хрипов нет, как у николая, но слушать затруднительно из-за интонации. Для записи книг тоже не подходит ввиду малой скорости. Так что рвать себе ради Alyona ничего не советую, она того не стоит.

    Я тоже попробовал Алену с буком. Получился полный отстой. При записи в мр3 искажения прут, пытается произнести везде где можно знак абзацка пьяной икотой. А вот  с Audibookом как ни странно все в ажуре.

    Всего записей: 11 | Зарегистр. 18-07-2006 | Отправлено: 11:56 04-08-2008
    slipperyjim2007

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Wasil
    Запись в мп3 в новой версии mp3book2005 уже нормальная, без хрипов и искажений.

    Всего записей: 74 | Зарегистр. 10-01-2007 | Отправлено: 16:47 04-08-2008
    Wasil

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Запись в мп3 в новой версии mp3book2005 уже нормальная, без хрипов и искажений.

    Это какая версия?

    Всего записей: 11 | Зарегистр. 18-07-2006 | Отправлено: 18:00 05-08-2008
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Думется в exe утилиту по извлечению фонем из слова и работающую из командной строки (dic_tts <слово> \clipboard), очень полезно было бы добавить функцию копирования результата в буфер обмена.Это бы упростило продвинутым userам создание словарей.

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 21:52 05-08-2008
    slipperyjim2007

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Wasil
    Пользовался 364й, уже вышла 365я.

    Всего записей: 74 | Зарегистр. 10-01-2007 | Отправлено: 09:38 06-08-2008
    kven

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Лечилка есть. Сдесь всё вчесте
    http://fasterthot.ifolder.ru/7450580
    http://fasterthot.ifolder.ru/7450581
    Если кто знает как заставить Алёну делать ударения, на какой это символ напишите пожалуйсто.

    Всего записей: 1 | Зарегистр. 08-08-2008 | Отправлено: 15:53 08-08-2008
    ALEX666999



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Лечилка есть. Сдесь всё вmесте

    Что конкретно в архиве? Алёна и лекарство? Если да, то лекарство то же что и тут : __ttp://rapidshare.com/files/130555560/inf.rar.html или другое?

    Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 18:31 08-08-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ALEX666999
     
    человек "из-за рубежа", а ты умничаешь - здравый смысл напрочь отсутствует

    Всего записей: 5643 | Зарегистр. 19-12-2003 | Отправлено: 21:16 08-08-2008
    korvinio



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Требуется помощь добровольцев в создании словаря для Алены.
    Ссылки на исходный словарь словарь (282 слова и словосочетания) и обсуждение тут:  
    http://abook-club.ru/forum/index.php?showtopic=2865&st=560&#entry195233
     
    Словарем нужно управлять только черех Lexicon Manager что идет с Аленой.
    ПО поводу ударения - разберу на примере:
    Добра
    #d A b r A1
     
    Cтавим символ "#" и потом расписываем каждый слог. Последний "A1". 1 - это и есть ударения. А вообще ничего сложного - там встроенная фонетическая таблица в Lexicon Manager, так что не ленитесь и сами почитайте.

    Всего записей: 50 | Зарегистр. 12-01-2008 | Отправлено: 23:35 13-08-2008
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    korvinio

    Цитата:
    Добра  
    #d A b r A1  
     

    Та же ошибка. См. мой ответ на abook-club.ru.

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 00:08 14-08-2008
    saikek

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, пожалуйста, какие на сегодняшний день лучшие Англ голоса.
    Спасибо.

    Всего записей: 1 | Зарегистр. 16-08-2008 | Отправлено: 12:22 18-08-2008
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Написал небольшую утилитку, которая может помочь в создании словаря для Алены.
    Идея такая - программа обробатывает книгу (текствый файл), определяет в каких словах из этого файла у Алены возможны проблемы с ударениями, в меру сил правит их. В результате получаем файлик с этими проблемными словами (слов 100-200 для средней книги), которые после ручной проверки и небольшой корректировки можно смело добавлять к основному словарю. И после этого спокойно слушать книгу. Таким образом, словарь будет расти и таких слов постепенно будет становится все меньше и меньше (особенно если этим будет заниматься много людей).
    Проверку ударений удалось реализовать благодаря морфологическому модулю с www.aot.ru , который в свою очередь основан на словаре Зализняка. Само-собой проверяются только те слова, которые есть в этом словаре, зато в любых формах. С помощью этого модуля также удается определять и откидывать омографы.
    Реализовал программу в виде консольной утилиты.  
    Если кого заинтересует, залил ее сюда: http://ifolder.ru/7777876
    Добавлено Немного доработал проверку и правку ударений: http://ifolder.ru/7806893

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 22:50 19-08-2008 | Исправлено: Ajaja, 10:10 22-08-2008
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ajaja
    Ай браво, жаль, что со своими разъездами не имею возможности регулярно следить за веткой, а тут такой прогресс идет

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 19:33 20-08-2008
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    Испытала утилитку по созданию словаря на двух книгах, работает очень хорошо. Конечно, созданный словарик желательно прослушивать, ошибки встречаются, но это очень быстро делается, а главное, что книга потом прослушивается гораздо приятнее. А то раньше словарь правился после прослушивания книги, да и то далеко не все слова. Словарь без особых усилий значительно увеличился, уже более 500 слов. СпасибоAjaja!

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 00:17 21-08-2008
    Gideon Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Написал небольшую утилитку, которая может помочь в создании словаря для Алены.

    Куда и как юзать получившийся файл?

    Цитата:
    Конечно, созданный словарик желательно прослушивать

    Как это правильно делать?

    Всего записей: 8084 | Зарегистр. 02-02-2004 | Отправлено: 07:29 21-08-2008
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Gideon Vi

    Цитата:
    Куда и как юзать получившийся файл?

    Создать в Lexicon Manager-е новый словарь, импортировать туда эти слова.
     

    Цитата:
    Как это правильно делать?

    Прослушать. Часть слов подправиль. В первую очередь надо обращать внимание на ошибки в звучании е/ё, и/ы (в жИ/шИ), на @/V (например V чаще всего хорошо звучит в начале слова и в предударных слогах), иногда $/I и т.д. Алгоритм автоматической правки ударений очень несовершенен. Я его еще буду доробатывать, пока просто времени мало.  
     
    Некоторые слова надо удалить, т.к. модуль AOT не всегда правильно ставит ударения, хоть и ошибается намного реже чем Алена. Кстати, для словаря AOT тоже есть редактор , его можно скачать у них на сайте http://www.aot.ru/download.php  (MorphWizard).
     
    Потом полученные слова экспортировать снова в *.txt, и уже его импортировать в основной словарь.  
     
     

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 12:48 21-08-2008 | Исправлено: Ajaja, 22:32 21-08-2008
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru