Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    LulumbaZ



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Где можно скачать агентов из галлереи http://desktopmates.com/ ?

    Всего записей: 1051 | Зарегистр. 12-09-2003 | Отправлено: 21:30 04-01-2010
    muromzevo

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А кто-нибудь в курсе, как обстоят дела с VitalVoice у Центра речевых технологий? Доделали они свои голоса, или не доделали, (вроде ещё в октябре обещали)? Продают ли? Есть ли где пробная версия?

    Всего записей: 2 | Зарегистр. 07-03-2008 | Отправлено: 06:59 06-01-2010
    NADIN415



    Newbie
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    Пользуюсь для записи книг- KooBAudio,  ABoo,  MP3book2005/v.415 (Голосовой движок-Алена). Очень ими довольна. Результат их работы примерно одинаков.  
    У меня совершенно противоположный вопрос, и нигде не видела ответа.
     
    А скажите мне пожалуйста, никто не знает, есть ли программа, конвертирующая MP3 в text?
    Ну просто необходимо с диктофона записанное, перевести в текст. Набирать много и долго.
    Может кто знает что-то подходящее? Я просто уверена, что такие программы есть, но мне не встречались.
    Я пробовала искать, но выкидывает ответ на запрос-программы записывающие голос.
    Буду очень благодарна за помощь.

    Всего записей: 5 | Зарегистр. 26-11-2008 | Отправлено: 09:18 16-01-2010 | Исправлено: NADIN415, 09:19 16-01-2010
    Seymour

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    NADIN415

    Цитата:
    А скажите мне пожалуйста, никто не знает, есть ли программа, конвертирующая MP3 в text?

    Это лучше здесь спрашивать, а еще лучше сразу скачать какую-нибудь программу для распознавания речи и попробовать подсунуть ей вместо голоса mp3, путем выбора в качестве источника звука "Wave/MP3" или "What U Hear", хотя сам не пробовал, поэтому гарантировать, что этот способ сработает не могу.

    Всего записей: 1089 | Зарегистр. 07-12-2006 | Отправлено: 12:19 16-01-2010 | Исправлено: Seymour, 12:24 16-01-2010
    PrivaterVTi

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Seymour
    Скормить mp3 можно конечно как угодно. Например, с помощью того же Virtual Audio Cable. Только вот качество распознавания русской речи за 15 лет ничуть не изменилось. Набрать, даже одним пальцем, быстрее получится чем с этим возиться.
     

    Всего записей: 334 | Зарегистр. 08-01-2005 | Отправлено: 05:48 31-01-2010
    Geist7

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Я тут надыбал в сети отрывки, по ходу, синтезированной речи. Не знаете, чей это голосовой движок? Вообще, качество по сравнению с остальными какое - норма, лучше, хуже?
    SYNT SPEECH.ZIP
    SYNT SPEECH.ZIP
    SYNT SPEECH.ZIP

    Всего записей: 36 | Зарегистр. 29-07-2009 | Отправлено: 17:08 03-03-2010
    turist96

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Пожалуйста подскажите может где можно скачать движок Loquendo Дмитрий ???
    Весь форум перелопатил не могу найти.
     
    Заранее благодарен.

    Всего записей: 100 | Зарегистр. 06-03-2009 | Отправлено: 02:44 11-03-2010
    canvass

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    turist96
    На сайте Loquendo в разделе Customer Service Area после авторизации.

    Всего записей: 200 | Зарегистр. 27-10-2006 | Отправлено: 07:51 12-03-2010
    ego9999

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А взломанного Loquendo Дмитрий нет?

    Всего записей: 22 | Зарегистр. 27-04-2007 | Отправлено: 20:39 12-03-2010
    Barlok86

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Народ, поделитесь в этой теме, как и чем форматируете неформатированный текст для прочтения через вашу любимую читалку. С книгами всё более менее понятно - открыл и запустил. А как к примеру с форумами и подобными нестандартными текстами? Предположим надо прочитать многостраничный топик форума. Во-первых не копировать же каждое сообщение отдельно. В идеале надо чтобы читалка говорила "сообщение такое то, написал такой-то" ну и т.п. Во-вторых могут встречаться полезные ссылки. Надо бы чтоб читалка говорила "ссылка" и какой нить идентификатор, чтобы позднее найти это место и посмотреть что там за ссылка была. Кроме ссылок могут быть всякие термины и необычные слова или что-либо труднопроизносимое для движка. Как с этим быть? Может у кого нить скрипты какие или способы самодельные? Прошу отписаться всем у кого есть полезная инфа.

    Всего записей: 10 | Зарегистр. 10-03-2010 | Отправлено: 06:59 14-03-2010
    Hmuryj_Mik



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Barlok86
    Ну так это форумы для слабовидящих наверное. Если нет, то это тяжкий труд - писать скриптовую поддержку для форума ... какого? Движков форумов и их модификвций ...

    Всего записей: 832 | Зарегистр. 22-08-2004 | Отправлено: 23:50 15-03-2010 | Исправлено: Hmuryj_Mik, 20:07 21-01-2011
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Geist7

    Цитата:
    SYNT SPEECH.ZIP  

    Это Speaking Mouse чтоли? 10-ней давности движок. в шапке читай там всё есть.

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 17:30 18-03-2010
    Niiks



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите где можно взять Adult Female #1 British English (L&H) и Adult Male #1 British English (L&H)

    Всего записей: 4006 | Зарегистр. 04-01-2003 | Отправлено: 16:54 23-03-2010 | Исправлено: Niiks, 17:00 23-03-2010
    Geraklit123

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите куда копировать файл с ударениями и как убедиться что он активен?
    Для нормальной работы нужно не более чем программа-читалка, николай, и словарь ударений?

    Всего записей: 27 | Зарегистр. 24-01-2010 | Отправлено: 20:32 29-03-2010
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Geraklit123

    Цитата:
    Подскажите куда копировать файл с ударениями

    зависит от движка

    Цитата:
    как убедиться что он активен

    пропишите в нём типа
    свинья==курица
    и если читалка прочитает вместо свинья курица, значит активен
    http://mytts.forum2x2.ru/forum.htm

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 11:33 01-04-2010
    ErikMAL



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    На Windows 7 64-bit столкнулся с непонятной проблемой.
    установил
    Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista
    + исправление для Windows 7 64-bit
    + голоса
    Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai  
    Алена Infovox Desktop PRO 2.2
    Катерина-2
    Loquendo Olga
     
    И все работает вроде в читалках типа CoolReader 2, в читалке плагине для Qip и т.п.
    Но
    В Пуск - Панель управления - Свойства речи Преобразование текста в речь - Выбор голоса
    голос только один - Microsoft ANNA - English! (хотя в программах - читалках можно выбрать любой)
    Вопрос - как такое может быть?
    И как сделать, чтобы в выборе голоса в Свойствах речи в панели управления появилисьустановленные голоса?

    Всего записей: 904 | Зарегистр. 07-11-2006 | Отправлено: 14:12 06-04-2010
    ooolts

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Поддерживаю вопрос. Аналогичная проблема.
    В Windows XP все работает. В Windows 7 не получается настроить.
    Помогите, пожалуйста, с решением.

    Всего записей: 1 | Зарегистр. 17-07-2009 | Отправлено: 18:12 08-04-2010
    lamer19

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А в варезнике есть что нибудь из голосов?

    Всего записей: 39 | Зарегистр. 02-08-2006 | Отправлено: 20:20 09-04-2010
    sdkeeper

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    И все работает вроде в читалках типа CoolReader 2, в читалке плагине для Qip и т.п.
    Но
    В Пуск - Панель управления - Свойства речи Преобразование текста в речь - Выбор голоса
    голос только один - Microsoft ANNA - English! (хотя в программах - читалках можно выбрать любой)
    Вопрос - как такое может быть?  

     
    Похоже, это болезнь не Виндовс 7, а именно платформ х64.
    У меня аналогичная проблема с Виндовс ХР х64:  в панели управления (речь) отображается только "родной" виндузёвый голос - Майкрософт Сэм.
    Николая в списке выбора нет, хотя в во всех программах-читалках голос "Николай" спокойно выбирается (как Сапи4 так и Сапи5) и "читается" 8)

    Всего записей: 9 | Зарегистр. 18-07-2008 | Отправлено: 16:32 14-04-2010
    BEERUS

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Добрый день
    Хочу потратить 50$ на программу читалку. Читаю в основном английские хелпы и книги
    Для меня главное что бы читала с экрана выделенные обзацы и продолжала с места остановки.
    Один голос достаточно
    Как всегда СПАСИБО ЗА КВАЛИФИЦИРОВАННУЮ ПОМОЩЬ
     
    И Ваше мнение о NaturalReader 9.0?  

    Всего записей: 26 | Зарегистр. 17-12-2009 | Отправлено: 16:07 16-04-2010 | Исправлено: BEERUS, 23:26 16-04-2010
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru