Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    folta

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    будете смеяться, но я смотрю в упор и не вижу "Николая".
    сегодня "Алёну" с рслоад стянул, была бы функция закачать обратно - закачал бы.
     
    вобщем, полистал и вообще закопался.
    почту за спасибо целеуказание.
    бо первую часть дня потратил на поиски "Алёны". да, вот так у меня плохенько с поиском.
    может этот голос комплектом с чем-то идёт, а я не догоняю получается)

    Всего записей: 1177 | Зарегистр. 24-11-2010 | Отправлено: 23:42 10-01-2013
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    folta
    Варезник там.

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 01:26 11-01-2013
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    king_stiven

    Цитата:
    Народ, новый голос

     
     Между прочим да, незаслуженно мало внимания к нему. Очень неплохо, даже знак ударения можно свой прикрутить и еще несколько приятных плюшек, у меня сейчас установлен в качестве основного. Еще бы частота у сэмплов была повыше, для чего так сильно пожали под SAPI не понятно.

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 05:23 23-01-2013 | Исправлено: Stroodder, 05:24 23-01-2013
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.14.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    - Добавлена возможность работы с закладками. Маркеры закладок отображаются на бордюре слева от текста. При редактировании текста позиции закладок обновляются.

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 12:00 25-01-2013
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Закинул Nuance Vocalizer SAPI5 for Windows XP/W7 на  
    http://4pda.ru/forum/index.php?s=&showtopic=200728&view=findpost&p=16267391 от аватара.
    Чтобы скачать, нужна регистрация на 4pda

    Всего записей: 1823 | Зарегистр. 09-02-2008 | Отправлено: 09:52 28-01-2013 | Исправлено: Apokrif, 09:53 28-01-2013
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Apokrif
     На win7 x64 балаболка пишет "класс не зарегистрирован", регфайлы соответственно поправлены под Wow6432Node.
     
     А нет, не везде поправил оказывается, все заработало. Спасибо за сабж. Правда движок деревянный: скорость только на компакте можно поменять без искажений, тон же вообще не изменяется ни на каких версиях.

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 12:01 13-02-2013 | Исправлено: Stroodder, 12:30 13-02-2013
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Правда движок деревянный: скорость только на компакте можно поменять без искажений

    Я тоже в недоумении от этого факта. Все, что быстрей обычной скорости, звучит очень неестественно, как у роботов из фантастических фильмов середины прошлого века  
     
     

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 23:46 13-02-2013
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.15. Программа предназначена для озвучивания текстов, создания аудиокниг (в формате wav, mp3, amr, aac + плейлист), расстановки ударений.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    -Обновлены базы и алгоритмы (весьма существенно) расстановки ударений.
     Разнообразные улучшения системы закладок:
    -Цвет бордюра зависит от цветов Windows.
    -Более четкое появление бордюра.
    -Более правильная настройка вертикального положения маркера закладок при различных размерах шрифта.
    -Добавлены сочетания клавиш Ctrl + n для перехода к n-й закладке.

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 17:30 17-02-2013 | Исправлено: MaxMIsaev, 17:31 17-02-2013
    Valdise



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    2 All &MaxMIsaev
     
    MaxMIsaev (21:19 11-05-2012)
    Цитата:
    Вышла новая версия RussAcc - 1.0.9... Что нового:  

    Претит ставить, пробовать и знакомиться... Коли просит пусть даже 12,7 копеек
    Дайте радел вареза
     
    ПС пардон если Вы Автор сабжа

    Всего записей: 2648 | Зарегистр. 11-02-2005 | Отправлено: 18:41 17-02-2013 | Исправлено: Valdise, 18:45 17-02-2013
    Ache



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, появился ли хотя бы один 64-битный русский голос? 32-битные не работают с 64-битными прогами, независимо от версии SAPI.

    Всего записей: 566 | Зарегистр. 05-02-2002 | Отправлено: 08:45 29-04-2013 | Исправлено: Ache, 08:48 29-04-2013
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 2.0
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    "id для регистрации программы создается теперь самой программой на основе информации 1-го жесткого диска, т.к. старый id от системы защиты не нашего производства мог меняться при переустановке системы. Если рег. номер не подходит к первому диску, то проверяются и остальные. (Новый рег. номер бесплатен для тех, кто оплатил RussAcc меньше полугода назад и стоит 50 р. для тех, кто оплатил раньше).
     
    Обновлены базы и алгоритмы расстановки ударений.
     
    Со следующей версии цена будет 195 р. (текущие рег. номера сохранятся, как обычно)."

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 11:39 05-05-2013
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ache

    Цитата:
    Подскажите, появился ли хотя бы один 64-битный русский голос? 32-битные не работают с 64-битными прогами, независимо от версии SAPI.

    Infovox3 Алена:
    http://www.acapela-group.com/infovox3-37-speech-solutions.html
    Уже и Infovox4 вышел:
    http://www.acapela-group.com/infovox-4-41-speech-solutions.html

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 16:27 18-05-2013
    GreatWorm



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Скоро похоже выйдет новый движок от IVONA -
    Tatyana
    Russian, female
    will be released: Q2 2013  
    http://www.ivona.com/en/voices-list/
     
    Озвучить кусочек своего текста:
    http://www.ivona.com/en/

    Всего записей: 120 | Зарегистр. 14-01-2007 | Отправлено: 14:29 20-05-2013 | Исправлено: GreatWorm, 16:43 07-06-2013
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Татьяна уже продаётся.

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 21:00 18-06-2013
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    http://www.ivona.com/en/products/ivona-reader-tatyana/
    "Fully functional 30-day free trial version available"
    У кого-нибудь получилось скачать и установить? У меня при установке полученного по е-мэйлу "ivona_installer_ne.exe"  при выборе голосов русского вообще нет.

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 21:17 18-06-2013 | Исправлено: Ajaja, 21:18 18-06-2013
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    У меня то же самое, скорее всего это просто ссылка для всех триальных голосов, и среди них нет Татьяны.

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 23:21 18-06-2013
    AGrin

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    В теме IVONA Voices 2 (text-to-speech)  
    http://forum.ru-board.com/topic.cgi?forum=35&bm=1&topic=51025&start=20#lt  
    20 июня 2013 указана ссылка на скачивание
    http://download.ivona.com/pub/Install/Ivona_Voice_1.6_Tatyana_22kHz.dat  
     

    Всего записей: 775 | Зарегистр. 14-09-2006 | Отправлено: 12:37 21-06-2013 | Исправлено: AGrin, 12:37 21-06-2013
    Valdise



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    AGrin (Full Member)
    Похоже на деревню "педалёво" - качаю третий раз... Предыдущие 2 раза 75-77%... Докачка ДА, НО ПРЯМАЯ ссыль превращается в динамичную  и в конечном итоге виснет...
     
    P.S вот сижу и думаю - а не позвать-ли в "педалёво" ВВП? Тот "разрулит"!


    ----------
    В очередь сукины дети! В очередь! (М.М.Булгаков)

    Всего записей: 2648 | Зарегистр. 11-02-2005 | Отправлено: 17:03 21-06-2013
    Engaged Clown



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Valdise

    Цитата:
    Похоже на деревню "педалёво" - качаю третий раз... Предыдущие 2 раза 75-77%... Докачка ДА, НО ПРЯМАЯ ссыль превращается в динамичную  и в конечном итоге виснет...

    http://sendfile.su/829006

    ----------
    Опросы ru-board'а

    Всего записей: 8782 | Зарегистр. 08-06-2006 | Отправлено: 17:29 21-06-2013
    Valdise



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Engaged Clown
    Мега Сенькс... Ибо видимо "бог любит троицу" как всегда не прокатывает... Снова повисло на 25% (уже третий раз) ~15-20Кб/с.
    Пробую по твоему ссылю Sendfile. Респекты отпишу в ПМ.
     
    PS правда сам не знаю зачем мне, это нужно? В системе стоит штук ПЯТЬ голосов (муж/жен|EN|RU), работают, жрать не просят
    -... Выберу время- поделюсь

    Всего записей: 2648 | Зарегистр. 11-02-2005 | Отправлено: 17:55 21-06-2013
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru