Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    XATAXAMA

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Люди, а какие "читалки" могут выделенный в любой программе фрагмент текста прочитать по нажатию комбинации клавиш или "росчерку" мыши?
    Я только у "Speak Aloud" в описании такую возможность видел, и найти её в доступном виде пока не удаётся.
    Может, ещё что-нибудь есть?

    Всего записей: 251 | Зарегистр. 27-01-2003 | Отправлено: 00:45 22-06-2009 | Исправлено: XATAXAMA, 00:46 22-06-2009
    sdkeeper

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Если имеется в виду чтение "буфера" - то могу посоветовать программу Balabolka

    Всего записей: 9 | Зарегистр. 18-07-2008 | Отправлено: 16:42 10-07-2009
    XATAXAMA

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Спасибо за совет, Балаболкой я уже давно пользуюсь.  
    Но идеально хотелось бы, чтобы:  
    а) на буфер это не влияло, и  
    б) работало по хоткею из другой программы...

    Всего записей: 251 | Зарегистр. 27-01-2003 | Отправлено: 06:00 12-07-2009
    Seymour

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Обновил архив с MSAgent (чуть чуть подправил инструкцию)

    Всего записей: 1089 | Зарегистр. 07-12-2006 | Отправлено: 04:47 23-07-2009
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ветка про Loquendo обновилась новым голосом - Дмитрий

    Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 03:04 25-07-2009
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

    Цитата:
    Ветка про Loquendo обновилась новым голосом - Дмитрий

    А его можно где-то скачать?
     

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 15:12 29-07-2009
    Proktolog



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    AnitrA
    Качать/инсталить нужно 3 вещи  
    - голосовой движок (я юзаю алену, не знай почему николая все хвалят, оля с аленой получше говорят)  
    - Microsoft Speech API 5.1  
    - программу говорилку (я юзаюTextaloud, хороший выбор также балаболка и MP3BOOK2005)
     
    Вот кстати вопрос ко всем - какая по вашему мнению говорилка наиболее удобна для быстрого конвертирования текста в mp3-файлы? В textaloud что не устраивает - не получилось пакетное создание /обработка нескольких фалов
    - ограничение на размер wav 2 ГБ

    Всего записей: 189 | Зарегистр. 27-03-2004 | Отправлено: 22:42 31-07-2009
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    Proktolog

    Цитата:
    Вот кстати вопрос ко всем - какая по вашему мнению говорилка наиболее удобна для быстрого конвертирования текста в mp3-файлы?

    Вы же сами ответили выше  

    Цитата:
    хороший выбор также балаболка и MP3BOOK2005

    Присоединяюсь.
     

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 11:20 03-08-2009
    farida



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Да конечно это не начитанная поставленным дикторским голосом книга, но через 5-10 минут к некоторым ошибкам произношения и интонирования привыкаешь и становится практически не отличимо от человеческого голоса.
    Делюсь своими наработками в области конвертации текста в голос т.е. как перевести текст в аудиокнигу.
    Во первых на сегодня (на февраль 2009) из всех опробованных TTS (Text to Speech) движков лучший результат выдает Acapela-Group Алёна SAPI5/SAPI4.
     
       Прослушать пример можно прямо на сайте производителя 111www.acapela-group.com/download-infovox-desktop-text-to-speech-dem...
     
    Преобразование текста в голос
     
      Для установки необходимо скачать 2 модуля:
    Движок: 111www.acapela-group.com/FDownload2.php?FId=96 (24Mb)
    Сам голос: 111www.acapela-group.com/FDownload2.php?FId=97 (150Mb)
     
       Скачав и установив, мы получим полнофункциональную 30-и дневную версию. Через 30 дней она просто откажется работать… как это обойти, я поясню чуть ниже.
     
     
    Чем записывать
     
       Кроме того, сразу скачиваем программку, которая будет записывать аудиокниги.
     
       Таких программ несколько, но для себя я остановился на Балаболке как наиболее оптимальном варианте.
     
    1111www.cross-plus-a.ru/balabolka.html
     
    Программа совершенна бесплатна.
     
    взято из 111ancher.ru/content/19-02-2009/audioknigi-delaem-sami

    Всего записей: 44 | Зарегистр. 05-07-2004 | Отправлено: 18:58 03-08-2009
    triskach

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Text to Speech Maker это лучшая программа для преобразования текста в речь, позволит вам прослушивать документы, почту или web страницы вместо их чтения на мониторе. Позволяет превращать текст в WAV, MP3 или VOX файлы для прослушивания на вашем компактном MP3 плеере.
     
     
    Основные качества:
    Поддерживает множество мужских, женских или роботизированных голосов на нескольких языках;
    Быстрая скорость конвертирования;
    Чтение и Конвертирование файлов происходит без временных файлов, что экономит место на жестком диске и обеспечивает высокую скорость конвертирования;
    Поддерживает Функцию MP3 качества;
    Поддержка шрифтовых настроек;
    Удобный пользовательский интерфейс;
    Быстрая скорость работы.
    Таблетка в архиве.
     
    Скачать | Download Text to Speech Maker 1.6.7 (12,11 MB):
    LetItBit: http://letitbit.net/download/fac365821422/ferrocan-Text-to-Speech-Maker-v1.6.7.rar.html
    DepositFiles: http://depositfiles.com/files/s8w7uylej
    RapidShare: http://rapidshare.com/files/182682693/ferrocan_Text_to_Speech_Maker_v1.6.7.rar
     
    +Голосовой движок Acapela Alyona (русский) -самый лучший на сегодняшний день. Так же добавлю что лично мне движок понравился — произношение просто отличное, но встречаются ошибки — поэтому составление словаря должно исправить положение.
    Компания Acapela разработчики популярного русскоязычного голосового модуля Николай, выпустили новый русский, женский голосовой движок, который получил название Алёна, работает на SAPI-5 с частотой 22 КГц , по качеству синтезируемой речи Алёна намного опережает Николая, тембр голоса и интонация по мнению пользователей приятней чем у движка Катерина от ScanSoft RealSpeak.
     
    Вместе с движком поставляется Lexicon Manager — редактор словарей, который позволяет изменять произношение слов как буквенно, так и фонетически.
     
    Доп. информация: Text-to-speech engine или движки синтеза речи — это программы выполненные в виде системного драйвера, предназначенные для преобразования текста в речь. Движки синтеза речи не имеют внешнего интерфейса, поэтому для того, чтобы Ваш компьютер заговорил, не достаточно установить только движок. Для использования движка необходима программа синтеза речи (TextAloud, Cool Reader, Balabolka и т.д), которая выполняет роль интерфейса, позволяет работать с движком, изменять его настройки, звучание речи, использует дополнительные возможности. В нашем случае это программа Text to Speech Maker 1.6.7
    Скачать depositfiles.com
    Скачать vip-file.com
    Скачать letitbit.net
     Таблетка в архиве
     

    Всего записей: 26 | Зарегистр. 19-07-2009 | Отправлено: 09:41 04-08-2009 | Исправлено: triskach, 09:45 05-08-2009
    Wasil

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Я уже однажды сообщал, что по долголетнему опыту использования читалок остановился на Алене и Балаболке к которой привязываются словари, пакетное кодирование работает хорошо. mp3book использовал долгое время, но во-первых, жадная программка, во-вторых, стыдно когда делают за деньги и куча всяких ляп.

    Всего записей: 11 | Зарегистр. 18-07-2006 | Отправлено: 16:07 06-08-2009
    VPK2

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    как это обойти, я поясню чуть ниже.  

    farida-неплохо-бы

    Всего записей: 1448 | Зарегистр. 12-05-2007 | Отправлено: 00:24 26-09-2009
    Viewer



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    VPK2

    Цитата:
    Цитата:как это обойти, я поясню чуть ниже.  
    farida-неплохо-бы

     
    farida

    Цитата:
     ... как это обойти, я поясню чуть ниже ...
    взято из h11p://ancher.ru/content/19-02-2009/audioknigi-delaem-sami


    Всего записей: 135 | Зарегистр. 19-11-2001 | Отправлено: 08:09 28-09-2009 | Исправлено: Viewer, 08:15 28-09-2009
    VPK2

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Viewer
    спс.,изв.-не заметил ссылку

    Цитата:
    Ветка про Loquendo обновилась новым голосом - Дмитрий

    в комплекте Loquendo TTS 7.8 должен быть?Ссылка

    Всего записей: 1448 | Зарегистр. 12-05-2007 | Отправлено: 12:15 28-09-2009
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Прошу помощи, третий день никак не могу скачать демку Acapela US English voice package V2.220 (US_English_ID2220.exe) c _http://www.acapela-group.com/FDownload2.php?FId=286  
    Качает 5-10% и обрывает, докачки там нет Может кто-нибудь переложить этот файл на какой-нибудь вменяемый файлообменник?

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 00:18 06-10-2009 | Исправлено: Ajaja, 00:20 06-10-2009
    Decticus

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите где скачать русский голосовой движок Алена от акапелла без 30- дневного ограничения? По Http ссылке, Спасибо

    Всего записей: 18 | Зарегистр. 17-02-2009 | Отправлено: 00:50 06-10-2009
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ajaja
    Acapela US English voice package V2.220
    part1
    part2
    part3
     
     
    Добавлено:
    Decticus
    поиском пользуйся    
    http://forum.ru-board.com/topic.cgi?forum=35&topic=42527#1

    Всего записей: 5637 | Зарегистр. 19-12-2003 | Отправлено: 01:02 06-10-2009
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    maK
    Спасибо!

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 01:28 06-10-2009
    JITADORIN



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Знает ли кто где можно скачать ABoo 0.6.0?

    Всего записей: 240 | Зарегистр. 01-03-2009 | Отправлено: 20:14 09-10-2009
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    JITADORIN

    Цитата:
    Знает ли кто  

    знает ... и ты узнаешь, если воспользуешься поиском

    Всего записей: 5637 | Зарегистр. 19-12-2003 | Отправлено: 20:51 09-10-2009
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru