Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    В честь наступления Года Кролика (в этом году китайский Новый Год наступает 3 февраля), в начале февраля резко, хотя и кратковременно, снижены цены на программу Русак! (RussAcc - озвучиватель текстов, создатель аудиокниг, расстановщик ударений). Подробности на сайте: http://bzsoft.spb.ru/russacc.html

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 11:15 02-02-2011
    WWN



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    как такое может быть

    If you're running a 64 bit version of windows, when you display the speech control panel, the panel will display only 64 bit voices installed on your system. To date, the only 64 bit voice we've run across is Microsoft Anna. In order to display 32 bit voices, you need to run the 32 bit version of the speech control panel, here is how to do it.
    То есть по умолчанию видна 64-разрядная контрольная панель, для которой есть только Анна Мастдаева
     
    В висте-64 это фиксится просто, выбираем классический вид панели, кнопку 32-контрольная панель и текст-то-спич If you're running Windows Vista, display the Control Panel from the Start Button, and click "Classic View" on the left pane. Click "View 32-bit Control Panel Items", and then click "Text-To-Speech". This should run the 32 bit speech control panel and display your 32 bit voices.
     
    В семерке-64 в строке проводника вводим:
    %windir%\SysWOW64\speech\SpeechUX\sapi.cpl
    и жмем кнопку энтер, и будет вам щастье
     
     equivalent in Windows 7 64bit, but you can access the 32 bit speech control panel by opening windows explorer, and pasting the following text into the address field at the top:
     
    %windir%\SysWOW64\speech\SpeechUX\sapi.cpl
     
    Press the enter key to display the control panel.

    Всего записей: 2066 | Зарегистр. 04-03-2006 | Отправлено: 10:06 08-03-2011 | Исправлено: WWN, 18:53 09-03-2011
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.5.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
    - Обновлены базы и алгоритмы расстановки ударений.
    - Улучшена система регистрации, особенно под Vista/64 и Win 7/64.
    - Несколько ускорена расстановка ударений.
    - Изменены цвета подсветки по умолчанию.
    - Индикация времени расстановки ударений.
    - Число недавних файлов увеличено до 16.
    - English версия.

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 18:03 13-04-2011
    Viper25

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4

    Дайте, плиз, ссылку на Варезник.

    Всего записей: 564 | Зарегистр. 03-03-2006 | Отправлено: 11:21 06-05-2011
    ukur



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Viper25
    Infovox desktop pro 2

    Всего записей: 151 | Зарегистр. 07-12-2007 | Отправлено: 22:43 14-05-2011
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    MaxMIsaev
    Не рановато такую поделку пиарить да еще и деньги просить за нее?

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 13:04 15-05-2011
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Да пусть пиарит, лучше б сюда ссылки на отзывы о ней скинул.

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 11:50 16-05-2011
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.6.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    - Добавлено преобразование ударений в файлах из стиля Nicolai (угловые скобки) в стили движков Alyona (Acapela) и Loquendo.
    - Добавлено преобразование файлов *.fb2 (Fiction book) в файлы *.txt.
    - Скорректирован порядок записи информации о последнем файле, текстовых позициях и последних папках для случая, когда запущено несколько копий программы.
    - Обновлены базы и алгоритмы расстановки ударений.
     
    Отзывы на сайте, весьма положительные, и там только их малая часть. Отсутствие малейших аргументов при охаивании - очевиднейший признак черного пиара. То, что это совсем не поделка, очевидно по очень многим ее аспектам и даже по наградам. Но "ты виноват уж потому, что хочется мне кушать".

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 14:10 17-05-2011
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    MaxMIsaev
    Да не глупи, тебе подсказывают, а ты щеришься.  Ветку свою открой на форуме. Меню-заготовка в проге и то осталось. Преобразования чисел, дат, имен нету, защиту попытался сделать, молодец, пытайся дальше ))...

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 19:06 17-05-2011
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Я заходил на форум 2x2 там тоже не хвалят.

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 19:29 17-05-2011
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    MaxMIsaev
     "Как написано в одном из форумов, "в Алене простановка ударений в тексте изначально не предусмотрена". Поэтому в движок добавляют словарь омографов"
     
    Ну... после этого (кстати не нашел где там расстановка ударений для Ольги, комбинацию при выходе этого движка в паблик, опубликовал вроде как Stroodder, как мне помнится =)  ) совсем интерес пропал, кому оно надо, если за три года конструктивного сдвига не было
     
    P.S. Подход очень напоминает подход ШХ, с чем вас обоих и поздравляю, умственнопервичные м/б и купят. Но дальше обсуждать это недоразумение, основанное на чужих разработках смысла не вижу.

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 19:23 18-05-2011 | Исправлено: Stroodder, 19:29 18-05-2011
    manram



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    где можно скачать это?-Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista [?]

    Всего записей: 1 | Зарегистр. 18-07-2011 | Отправлено: 15:59 18-07-2011
    Krestkz

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Народ  
     
    дайте живые ссылки на (с лекарством)
     
    Loquendo TTS -  
     
    Elizabeth - female - UK English
    Kate - female - UK English
    Simon - male - UK English
     
    Olga - female - Russian
    Дмитрий - male - Russian
     
    не могу найти - только на рутрекере - но там версии голосов уже устаревшие

    Всего записей: 37 | Зарегистр. 28-08-2011 | Отправлено: 13:28 28-08-2011
    GRom V

    Full Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    Сталкивался кто? - как известно Microsoft Agent умеет проигрывать wav... так вот:
    У меня установлена семерка и все работает и проигрывает.
    Ставлю на другую семерку (исправление установлено) работает но не проигрывает звуковой файл...В чем может быть проблемка???
     
    Добавлено:
    Все решил проблему

    Всего записей: 466 | Зарегистр. 31-10-2006 | Отправлено: 09:42 07-09-2011
    Kero1



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    del

    Всего записей: 2447 | Зарегистр. 23-08-2011 | Отправлено: 16:05 26-09-2011 | Исправлено: Kero1, 20:57 07-10-2011
    Kero1



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    del

    Всего записей: 2447 | Зарегистр. 23-08-2011 | Отправлено: 20:22 06-10-2011 | Исправлено: Kero1, 20:57 07-10-2011
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Kero1 19:22 06-10-2011
    Цитата:
    Тут вообще кто то бывает?

    Для тех, кто в танке: это раздел "Программы", лекарства ищут в Варезнике.

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 01:12 07-10-2011
    Vladimir_02



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Сакрамент+3 голоса (Юлия, Вика, Юрий) по качеству на уровне Николая и Катерины... рег. ключ в комплекте и для работы ДИСК НЕ НУЖЕН (как об этом написано в шапке)

    Всего записей: 400 | Зарегистр. 14-11-2008 | Отправлено: 23:01 25-12-2011 | Исправлено: Vladimir_02, 20:22 27-01-2012
    Vladimir_02



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Голоса Ирина и Вячеслав для Сакрамента... рег ключ подходит из предыдущего поста
    и еще Ольга-Сакрамент

    Всего записей: 400 | Зарегистр. 14-11-2008 | Отправлено: 20:18 27-01-2012 | Исправлено: Vladimir_02, 23:40 30-01-2012
    ego9999

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Vladimir_02, что-то ты попутал, Сакрамент и близко по качеству НЕ на уровне Николая и Катерины. А про то, что написано в шапке (требующая диска), так эта совершенно другая версия Сакрамента.

    Всего записей: 22 | Зарегистр. 27-04-2007 | Отправлено: 21:36 06-02-2012
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru