Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    sdkeeper

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Да, тембр у Алёны лучше.. Но интонация - караул, спасайся..
    Алёна и Катя хорошо подходят для озвучивания отдельных слов или фраз (допустим в обучающих программах для изучающих русский язык или в словариках).. Для чтения же художественной литературы ни Катя ни Алёна не годится.. Здесь бесспорным лидером считаю Николая - отличный чтец.. Ему бы сделать более качественную звуковую базу - было бы супер.
    Для сравнения привожу результат чтения Николаем того же текста, что несколькими постами выше был представлен в исполнении Алёны.
    http://ukrsokker.h.com.ua/files/nik.mp3

    Всего записей: 9 | Зарегистр. 18-07-2008 | Отправлено: 17:46 18-07-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    sdkeeper
     
    в приведенном примере озвучивается, насколько я понял, текст со спецразметкой, и это как - то нивелирует тот ужас, который сопровождает озвучивание с помощью этого чуда ... или я ошибаюсь ?

    Всего записей: 5643 | Зарегистр. 19-12-2003 | Отправлено: 19:29 18-07-2008
    vengr



    Рафинированный Теоретик
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    пока о качестве можно судить по - Alyona 149мб, UK English Peter - 612мб

    Всего записей: 3579 | Зарегистр. 21-08-2001 | Отправлено: 22:06 18-07-2008
    Gideon Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    ... и этот скрипуче - каркающий тембр ты называешь "лучшим" ?!

    Я тоже называю его лучшим.

    Цитата:
    в приведенном примере озвучивается, насколько я понял, текст со спецразметкой

    Что понимается под спец.разметкой? Коле нужен только качественный словарь и он давно уже есть (mp3book2005)

    Всего записей: 8084 | Зарегистр. 02-02-2004 | Отправлено: 03:45 19-07-2008
    Elfl

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    sdkeeper
    Спасибо) Уже нашла в продаже)
    maK
    А я, наоборот, трагичный голос Катерины не могу слушать) Хочется поплакать )
    Уж лучше совсем без эмоций тогда)

    Всего записей: 125 | Зарегистр. 16-01-2008 | Отправлено: 09:40 19-07-2008 | Исправлено: Elfl, 09:43 19-07-2008
    sdkeeper

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    maK
     
    Касательно спецразметки.. Вставлены тэги динамической смены тембра/скорости голоса и слегка увеличены паузы в конце предложений  для более выразительного отображения диалогов и, соответственно, лучшего восприятия читаемого текста.

    Всего записей: 9 | Зарегистр. 18-07-2008 | Отправлено: 10:26 19-07-2008 | Исправлено: sdkeeper, 10:27 19-07-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    sdkeeper
     
    Хорошо ... Если не "в напряг" - поподробнее в ПМ ...

    Всего записей: 5643 | Зарегистр. 19-12-2003 | Отправлено: 12:14 19-07-2008
    BRTAndrey



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    sdkeeper, напиши здесь-- Касательно спецразметки, подробнее, я думаю всем будет  
    интересно!

    Всего записей: 486 | Зарегистр. 21-09-2006 | Отправлено: 14:38 19-07-2008
    sdkeeper

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Хм.. На самом деле, я думаю, многое об этом уже знают и активно используют.
    В кратце о спецразметке/метатэгах для голосового движка Элан Николай. Многие программы их используют, особенно программы содержащие функцию "анализ диалогов".
    Например, программы: KoobAudio, mp3book2005.
     
    .\abspitch{110}.
    указывает, что текущий тембр голоса должен быть 100.
     
    .\absspeed{113}.
    указывает, что текущая скорость должна быть 113.
     
    .\pause{1500ms}.
    указывает на необходимость паузы в 1500 миллисекунд.
     
    Комбинации, которые используются для разных стилей речи:
    - повествование, абзац:
    .\abspitch{110}.\absspeed{113}.\pause{1500ms}.
     
    - диалог. Персона №1:
    .\abspitch{190}.\absspeed{125}.\pause{300ms}.
     
    - диалог. Персона №2:
    .\abspitch{80}.\absspeed{125}.\pause{300ms}.
     
    - комментарии в диалогах:
    .\abspitch{110}.\absspeed{113}.\pause{300ms}.
     
    - конец предложения
    .\pause{300ms}.
     
     
    Вот пример текста со спецразметкой:
     
    .\abspitch{110}.\absspeed{113}.\pause{1500ms}.Деревенский священник оказался стариком с белыми волосами и лицом, покрытым сетью морщинок.\pause{300ms}. Глаза< с обгоревшего на солнце лица глядели с
    удивительной живостью и жадностью.\pause{300ms}. Они были голубыми, очень ирландскими.\pause{300ms}. Когда высокий мужчина подъехал к дому священника, тот сидел на крыльце и пил ча<й.\pause{300ms}. Рядом стоял мужчина в городском костюме.\pause{300ms}. Его волосы были разделены
    пробором и набриолинены так, что высокому мужчине вспомнились фотопортреты
    девяностых годов прошлого века.\pause{300ms}. Человек этот чопорно сказал:
     
    .\abspitch{190}.\absspeed{125}.\pause{300ms}.Я-Хесус де ла рей Муньос.\pause{300ms}. Отец Гракон попросил меня переводить, сам
    он английским не владеет.\pause{300ms}. Моя семья очень обязана отцу Гракону, не стану упоминать, почему.\pause{300ms}. Что касается дела, которое он желает обсудить, на уста мои ляжет печать.\pause{300ms}. Вы согласны?
    .\abspitch{80}.\absspeed{125}.\pause{300ms}.Да.\pause{300ms}..\abspitch{110}.\absspeed{113}.\pause{300ms}.Он пожал руку Муньосу, потом Гракону.\pause{300ms}. Гракон что-то сказал
    по-испански и улыбнулся.\pause{300ms}. У него оставалось только пять зубов, но улыбка вышла солнечной и радостной.\pause{300ms}.
    .\abspitch{190}.\absspeed{125}.\pause{300ms}.Он спрашивает: хотите чашечку чая? Это зеленый чай.\pause{300ms}. Очень прохладительный.\pause{300ms}.
    .\abspitch{80}.\absspeed{125}.\pause{300ms}.Это было бы прелестно.\pause{300ms}.
    .\abspitch{110}.\absspeed{113}.\pause{1500ms}.
    После обмена любезностями священник сказал:
    .\abspitch{190}.\absspeed{125}.\pause{300ms}.Мальчик не ваш сын.\pause{300ms}.
    .\abspitch{80}.\absspeed{125}.\pause{300ms}.Нет.\pause{300ms}.
    .\abspitch{190}.\absspeed{125}.\pause{300ms}.Его исповедь была странной.\pause{300ms}. По сути дела, за все время, что я являюсь
    священнослужителем, более странной исповеди я не слышал.\pause{300ms}.
    .\abspitch{80}.\absspeed{125}.\pause{300ms}.Меня это не удивляет.\pause{300ms}.
    .\abspitch{190}.\absspeed{125}.\pause{300ms}.Он плакал,.\abspitch{110}.\absspeed{113}.\pause{300ms}.продолжал отец Гракон, прихлебывая чай.\pause{300ms}..\abspitch{190}.\absspeed{125}.\pause{300ms}.И плач этот
    шел из самого сердца, наводя ужас.\pause{300ms}. Из тайников души его.\pause{300ms}. Должен ли я задать
    вопрос, который родила в моем сердце эта исповедь?
    .\abspitch{80}.\absspeed{125}.\pause{300ms}.Нет,.\abspitch{110}.\absspeed{113}.\pause{300ms}.бесстрастно ответил мужчина.\pause{300ms}..\abspitch{80}.\absspeed{125}.\pause{300ms}.Нет.\pause{300ms}. Он говорит правду.\pause{300ms}.
    .\abspitch{110}.\absspeed{113}.\pause{1500ms}.Отец Гракон кивнул даже раньше, чем Муньос перевел, и его лицо
    посерьезнело.\pause{300ms}. Он склонился вперед, зажал ладони между колен, и долго
    говорил.\pause{300ms}. Муньос напряженно слушал, старательно сохраняя бесстрастное
    выражение лица.\pause{300ms}.

    Всего записей: 9 | Зарегистр. 18-07-2008 | Отправлено: 14:50 19-07-2008
    SelenaNight



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Установила Алену, послушала.
    Разочаровалась
    Если образец звучания очень понравился, то при чтении полноценного текста - форменный кошмар. Интонации жуткие, та же фигня что и с Катей, хоть истерики такой явной и нет, но сложилось впечатление, что взяли Катю и немного понизили тембр .... То она торопится и захлебывается, то подтормаживает как будто...
    Размеренная манера чтения Коли осталась лучшей ИМХО.

    Всего записей: 335 | Зарегистр. 27-02-2006 | Отправлено: 15:08 19-07-2008 | Исправлено: SelenaNight, 15:13 19-07-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Разочаровалась

     

    Цитата:
    То она торопится и захлебывается, то подтормаживает как будто

     
    видно, мне особый экзэмпляр сабжа попался ... движок подтормаживает ) - занятно ...
     
     
     
     

    Всего записей: 5643 | Зарегистр. 19-12-2003 | Отправлено: 19:38 19-07-2008
    PONN

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    http://www.kom-pas.narod.ru/audiobook_net.htm бесплатная программа с анализом диалогов и чтением по ролям несколькими движками сразу!!! Пример http://www.kom-pas.narod.ru/files/audiobook_net/primer_2.zip.
    Поддержка Acapella - InfovoxDesktop2 Engine "Alyona22" присутствует.

    Всего записей: 50 | Зарегистр. 15-10-2004 | Отправлено: 03:00 22-07-2008 | Исправлено: PONN, 03:02 22-07-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    PONN
     
    программка хорошая, но , к сожалению, требует .NET ...

    Всего записей: 5643 | Зарегистр. 19-12-2003 | Отправлено: 10:06 22-07-2008 | Исправлено: maK, 10:22 22-07-2008
    rrssrr

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    К Аленке вроде лекарство появилось
    http://rapidshare.com/files/130555560/inf.rar.html

    Всего записей: 77 | Зарегистр. 17-05-2006 | Отправлено: 14:05 22-07-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    rrssrr
     
    это уже давно не новость ... сам заливал ?

    Всего записей: 5643 | Зарегистр. 19-12-2003 | Отправлено: 14:33 22-07-2008
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

    Цитата:
    http://www.kom-pas.narod.ru/audiobook_net.htm бесплатная программа с анализом диалогов и чтением по ролям несколькими движками сразу!!! Пример http://www.kom-pas.narod.ru/files/audiobook_net/primer_2.zip.  
    Поддержка Acapella - InfovoxDesktop2 Engine "Alyona22" присутствует.

     
    Задумка хорошая, только часто женские реплики произносятся мужским голосом и наоборот, видимо от форматирования текста зависит. Если уж сравнивать бесплатные программы, то, по-моему, из этих двух koobaudio удобнее, там есть тот же анализ диалогов (только без поддержки голосов), но зато получше фукция поиска имен и удобнее запись (разбивка по главам, название файлов и т.д.)

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 19:52 23-07-2008
    Magral

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Никто не сталкивался при установке Аленки выдается ошибка "to proceed with the installation you need to first to install th text-to-speech engine.Aborting installation." И установка прерывается.Кто знает решение проблемы помогите пожалуйста,хочется потестить новый движок.

    Всего записей: 9 | Зарегистр. 24-02-2008 | Отправлено: 03:51 24-07-2008
    Yeeshik

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Magral
    Нужно сначала ставить движок, потом голос.

    Всего записей: 185 | Зарегистр. 02-11-2006 | Отправлено: 05:51 24-07-2008
    Magral

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Все понял.Просто не знал что движок и голос идут отдельно.

    Всего записей: 9 | Зарегистр. 24-02-2008 | Отправлено: 18:33 24-07-2008
    Wasil

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Существует ли хороший словарь для Аленки?

    Всего записей: 11 | Зарегистр. 18-07-2006 | Отправлено: 17:47 31-07-2008
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru