Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Vladimir_02



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Недавно скачал голоса Катерина и Аленка (до этого всегда пользовался Николай Дигало)... от Аленки в восторге, голос как живой, Катерина не очень понравилась....

    Всего записей: 400 | Зарегистр. 14-11-2008 | Отправлено: 16:09 14-11-2008 | Исправлено: Vladimir_02, 22:59 29-11-2008
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Vladimir_02
    А это не пробовали? _http://www.vector-ski.ru/vecs/govorilka/subtitlesreader.htm

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 23:10 15-11-2008
    Vladimir_02



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А это не пробовали? _http://www.vector-ski.ru/vecs/govorilka/subtitlesreader.htm
     
    пробовал уже давно... subtitlesreader не поддерживает голоса на САПи 5. а это большой минус...

    Всего записей: 400 | Зарегистр. 14-11-2008 | Отправлено: 13:13 16-11-2008 | Исправлено: Vladimir_02, 22:58 29-11-2008
    KOMODOR

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Всем привет. Всетаки, согласитесь, что у николая речь самая внятная, хотя и как у кибогга) Минус в том, что больно уж скрипучий голос получается. Нет ли плагина для какой-нибудь вавлабы, чтобы хоть как-то "очеловечить" голос, скрипучесть снять?

    Всего записей: 3 | Зарегистр. 26-11-2008 | Отправлено: 15:56 26-11-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    KOMODOR
    Это попробуй

    Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 21:08 26-11-2008
    Mister_Che

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Извините, а что нужно скачать, чтобы компьютерный голос читал текст и чтобы качать не много надо было, не эти 200метровые файлы. Объясните, пожалуйста, подробно.

    Всего записей: 353 | Зарегистр. 05-02-2006 | Отправлено: 17:34 29-11-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Mister_Che
     
    SAPI4
    SAPI5
    Speech Cube Elan v5.1 password: #  
    Balabolka 1.23
    Словарь

    Всего записей: 5640 | Зарегистр. 19-12-2003 | Отправлено: 18:20 29-11-2008 | Исправлено: maK, 18:30 29-11-2008
    Haendler



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Друзья, у кого есть ссылки на комплект Алёны без торрента?
     
    Упс, похоже мне в варезник, создал сабж: http://forum.ru-board.com/topic.cgi?forum=35&topic=42527
     
    Работает ли Digalo.Michelangelo с Алёной?

    Всего записей: 109 | Зарегистр. 16-09-2006 | Отправлено: 21:44 29-11-2008 | Исправлено: Haendler, 22:15 29-11-2008
    KOMODOR

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    SAPI4  
    SAPI5  
    Speech Cube Elan v5.1 password: #  
    Balabolka 1.23  
    Словарь

     
    Я б еще добавил:
    http://koobaudio.narod.ru/
    http://www.mp3book2005.narod.ru/, ибо балаболка, по-моему, не определяет повествование/диалог

    Всего записей: 3 | Зарегистр. 26-11-2008 | Отправлено: 22:19 29-11-2008
    PMRaven666



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    http://www.mp3book2005.narod.ru/, ибо балаболка, по-моему, не определяет повествование/диалог

    не работает

    ----------
    Бомбы дуют с Севера, падает с Неба Ветер
    Расскажи мне, Смерть, разве можно умереть

    Всего записей: 867 | Зарегистр. 04-01-2007 | Отправлено: 23:13 29-11-2008
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Я б еще добавил:  
    http://koobaudio.narod.ru/

     
    этот проект давно реорганизован: Aboo
     

    Цитата:
    ибо балаболка, по-моему, не определяет повествование/диалог

     
    похоже, у товарища Сhe запросы поскромнее )
     
    PMRaven666
     
    ... в смысле ?! Ссылка мертвая ? Все рабочее ... (обрати внимание на присутствие "запятой" в адресе)
     
     

    Всего записей: 5640 | Зарегистр. 19-12-2003 | Отправлено: 03:50 30-11-2008 | Исправлено: maK, 03:58 30-11-2008
    canvass

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вопрос следующий. Аленка раздаваемая на торентсе, чем то отличается от той,
    которую можно забрать с оф.сайта?
    Вопрос возник из-за отличия в размерах. Полученная с оф.сайта после установки занимает 159 мегов, а на торентсе пишут про 300 мегов развернутого дистра.  
    Где правда?

    Всего записей: 200 | Зарегистр. 27-10-2006 | Отправлено: 15:57 30-11-2008
    KOMODOR

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    этот проект давно реорганизован: Aboo

    Так она ж плющевая, эта абу! В ней толком ничего и нет... А koobaudio, хоть год с лишним и сдохла, но все равно по некоторым параметрам даже платную mp3book2005 обходит! Например, там работа со словарем круче и конвертилка из  fb2... Никто, случайно, с автором koobaudio не знаком? Есть шансы, что она воскреснет?

    Всего записей: 3 | Зарегистр. 26-11-2008 | Отправлено: 19:57 30-11-2008
    Vladimir_02



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Никто не знает где можно скачть БЕСПЛАТНО
    Sakrament Personal Voice Master.
    пакет Sakrament Personal Voice Master предназначена для автоматического создания пользователями собственных синтезированных голосов.
    Небольшое величина времени для надиктовки и обработки речевого материала - и Ваши любимые программы заговорят Вашим, а не искусственным голосом.
    Sakrament Personal Voice Master (PVM) 2.0 позволяет на брата создать покрой собственного голоса (или голосов друзей, знакомых) через диктовки определенного набора слов.
    В дальнейшем индивидуальная подмодель голоса может использоваться в других продуктах «Сакрамент», осуществляющих обобщение русской речи.
    броузер позволяет создавать уникальные голосовые базы, как можно больше приближенные к индивидуальному человеческому голосу.
    По сравнению с предыдущими версиями в Sakrament Personal Voice Master 2.0 упрощен и доработан развитие создания индивидуальной голосовой модели.
    созданьице подобных моделей значительно расширяет внутренние резервы применения систем синтеза речи от компании «Сакрамент».
    конвертор Sakrament PVM 2.0 может использоваться в сочетании с системой синтеза Sakrament TTS Engine 3.0 для чтения электронных документов индивидуальным голосом пользователя, при создании голосов дикторов для информационных служб, в образовательных целях и так далее.
     
    Хотя бы демо версию. а то тна сайте САКАРАМЕНТА даже за ознакомитеоьную версию надо платить...

    Всего записей: 400 | Зарегистр. 14-11-2008 | Отправлено: 22:14 01-12-2008
    AndyDA



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    vikkiv
    vikkiv
    vikkiv

    Всего записей: 9 | Зарегистр. 11-08-2005 | Отправлено: 06:58 03-12-2008 | Исправлено: AndyDA, 07:00 03-12-2008
    Widok



    Moderator-Следопыт
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Vladimir_02
    Поиск вареза в Программах.
     
    AndyDA
    Флуд.

    ----------
    Тень превращается в фантазии, таящиеся в глубине вашей души.
    Пока идёшь ты среди теней, да не будет зла с тобой.

    Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 16:58 05-12-2008
    valuevmikael



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Аленка, конечно, огромный шаг вперед по сравнению с Катей и Колей. Слушаю с большим удовольствием на mp3 плеере. Но вот с конверсией - напряженка.  
    Проверил последние версии:  
    ABoo
    MP3book2005
    KooBAudio
    Балаболка
    TextAloud
    ICE Book Reader
    Cool Reader  
     
    С экрана читают все, а вот в mp3 с нарезкой на части, путем пишут только две: ABoo 0.8.1 и MP3book2005, начиная с 364 билда. Остальные, либо отказываются писать, либо не умеют нарезать файл на части, а без этого на mp3 плеере никак.  
    Лучший результат дает MP3book2005, но аптечку нашел только на билд 362.  
    ABoo цены бы не было, если бы умел конвертить в режиме VBR. В режиме  CBR на 32 кбит/с прослушиваются посторонние шумы и подсвисты.
    Может кто посоветует, что еще попробовать?
    Требования
    1. сохрнение в mp3, VBR, 32 кбит/с.
    2. нарезка выхода на части, причем по ходу дела.  Какая-то программа у меня резала, но сначала создавала waw файл на 1-2 гиг.  

    Всего записей: 1193 | Зарегистр. 06-01-2008 | Отправлено: 14:40 08-12-2008
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    valuevmikael

    Цитата:
    С экрана читают все, а вот в mp3 с нарезкой на части, путем пишут только две: ABoo 0.8.1 и MP3book2005, начиная с 364 билда. Остальные, либо отказываются писать, либо не умеют нарезать файл на части, а без этого на mp3 плеере никак.  

    А как же KooBAudio? Я иногда пишу в мр3 Аленой с помощью KooBAudio, правда, CBR, 32 кбит/с, при выборе VBR нет выбора битрейта, но режим VBR, который Вам нужен, там есть. Нарезает файл на части по минутам, делит по главам, если нужно. Сохраняет в мр3. Причем, удобно - можно задавать имена файлов заранее. И можно выбирать список имен, чтоб послушать их перед записью книги и отредактировать звучание, если надо. Я тоже слушаю на мр3-плеере, причем допотопном, ему почти 5 лет, никаких посторонних свистов не наблюдаю, наоборот, хватает более низкой громкости, по сравнению с Колей.
     

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 15:19 08-12-2008
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Кто качал профиксеную Алену - тэги под SAPI5 работают или только баг с SAPI4 исправили?

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 15:27 08-12-2008
    valuevmikael



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Sylvia

    Цитата:
    А как же KooBAudio?  

    Поделись, как укротил его. У меня на выходе какой-то беспорядочный мусор. Размер файлов от 0,2 до 4 мег.  Половину файлов оставляет в формате wav.
     
     

    Всего записей: 1193 | Зарегистр. 06-01-2008 | Отправлено: 20:14 08-12-2008
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru