Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

    Цитата:
    Знает ли кто где можно скачать ABoo 0.6.0?

    Вообще-то, актуальная версия - 0.8.5, http://parovoz.com.ua/aboo/

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 21:15 09-10-2009
    JITADORIN



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Знаю, но мне нужна именно эта версия или более старые. Может осталась у кого?

    Всего записей: 240 | Зарегистр. 01-03-2009 | Отправлено: 21:22 09-10-2009
    svarog72

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    JITADORIN
    смотри здесь ifolder.ru/14421807

    Всего записей: 361 | Зарегистр. 18-01-2003 | Отправлено: 09:09 10-10-2009
    videoobzor

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вообще-то, самый качественный движок из имеющихся - Ольга.
     
    Алёна звучит хорошо (без акцента) но лишь в пределах 1 слова. С интонациями в простеньком предложении алёнка уже не справляется. Никакие словари этого не исправят - тут дело в примитивности движка.
     
    Ольга - разработка более высокого уровня, единственный недостаток - эстонский акцент (как у Николая). Зато по интонации, плавности речи, отсутствии вербальных искажений - 4 баллов из 5

    Всего записей: 1 | Зарегистр. 21-10-2009 | Отправлено: 10:12 21-10-2009
    djazair



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Так как насчет Дмитрия? Нигде еще не обнаружился?

    Всего записей: 1 | Зарегистр. 05-01-2007 | Отправлено: 13:20 22-10-2009
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    nuance milena
    Nuance представила новый голос для синтеза речи на русском языке
     
    Компания Nuance представила новый голос на русском языке для 5-ой версии программы Nuance Vocalizer. Созданный с применением последних разработок, новый женский голос Milena может использоваться для синтеза высококачественной и естественно звучащей речи в call-центрах и в различных сетевых речевых системах, а также в автомобильных, настольных и мобильных приложениях.
    http://www.cnews.ru/news/line/index.shtml?2009/10/09/365067

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 08:58 25-10-2009
    maK



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    lapidus2000
    давай ... "пеши исче" ( куда еще запостишь?    

    Всего записей: 5708 | Зарегистр. 19-12-2003 | Отправлено: 11:34 25-10-2009
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    maK
    Наверное в ООН

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 23:05 26-10-2009
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    lapidus2000
    Давай ссылку на образец голоса.

    Всего записей: 2232 | Зарегистр. 17-07-2006 | Отправлено: 20:34 28-10-2009
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    king_stiven
    Оценить качество голосов 5-й версии можно здесь:
    http://www.nuance.com/vocalizer5/languages/
    Русского там пока нет.
    Звучат очень качественно.

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 21:51 31-10-2009 | Исправлено: lapidus2000, 21:54 31-10-2009
    Gideon_Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    иностранные уже давно звучат качественно

    Всего записей: 8162 | Зарегистр. 02-02-2004 | Отправлено: 03:55 01-11-2009
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    48khz заявлены только в 5-й

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 18:57 01-11-2009
    Seymour

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Переименуйте кто-нибудь тему в "Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)" ("Голосовые движки для синтеза и распознавания речи"), чтоб все связанное со Speech API обсуждалось здесь, благо уже на 20 страниц наговорили...

    Всего записей: 1089 | Зарегистр. 07-12-2006 | Отправлено: 12:53 15-11-2009
    Lex161

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Пожалуйста подскажите может где-нибудь уже можно скачать движок Loquendo Дмитрий ???

    Всего записей: 57 | Зарегистр. 06-07-2007 | Отправлено: 11:06 18-11-2009
    Elfl

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Привет
     
    Такая проблема, у меня loquedo голоса на Text aloud , все голоса дают какое-то эхо.
    Это у меня звуковая карта плохая или Text aloud сменить на что-то другое?
    В самом начале такого не было, но через 10 минут началось, уж не знаю из-за чего.
    У кого так же?  
    Еще я скачивала ольгу из торрента, там дополнительные словари с окончанием .doc и .txt, куда их надо ставить не нахожу. Кто нибудь знает что делать?
    спасибо.

    Всего записей: 125 | Зарегистр. 16-01-2008 | Отправлено: 12:59 03-12-2009
    SerJantX



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А как на счет Nuance Vocalizer Milena???
     
    Компания «Nuance» представляет новый голос на русском языке для 5-ой версии программы «Nuance Vocalizer». Новый женский голос – Milena пополняет список готовых решений от компании «Nuance», мирового лидера на рынке речевых технологий. Созданный с применением последних разработок, новый голос на русском языке может использоваться для синтеза высококачественной и естественно звучащей речи в call-центрах и в различных сетевых речевых системах, а так же в автомобильных, настольных и мобильных приложениях.
     
    «Создание нового голоса на русском языке демонстрирует заинтересованность в постоянном расширении языкового и голосового портфолиo компании» - заявил Стив Миллер, вице-президент и генеральный менеджер компании «Nuance» по странам Европы, Ближнего Востока и Африки. «С разработкой Milena в нашем портфолио голосов появился голос с чистой, естественно звучащей речью на русском языке, используя который в различных речевых приложениях, компании смогут укрепить позиции своего бренда на рынке и имидж в глазах клиентов».
     
    Решения от компании «Nuance» упрощают использование услуг пользователям и расширяют бизнес-потенциал компаний. Миллионы клиентов используют продукты компании «Nuance» для звонков в справочные службы, запросов информации по счету, получения результатов анализов, поиска информации в мобильных сетях или работы с системами автомобильной навигации.
     
    «Nuance» постоянно расширяет и обновляет свои решения по синтезу речи, тем самым, удовлетворяя локальные потребности глобальной аудитории. Сегодня решения «Nuance» охватывают более 40 языков, с использованием 54 различных голосов, включая не только североамериканские и западноевропейские языки, но так же и словацкий, венгерский, румынский, чешский, польский, русский и турецкий языки. Большое количество азиатских языков: хинди, индийский и австралийский английский, индонезийский, тайский, китайский, японский и корейский.
     

    Всего записей: 941 | Зарегистр. 05-10-2009 | Отправлено: 11:41 04-12-2009
    Gideon_Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Порекомендуйте какой-нибудь движок для синтез английского, пожалуйста.

    Всего записей: 8162 | Зарегистр. 02-02-2004 | Отправлено: 07:51 08-12-2009
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Gideon_Vi
    посмотри
    http://mytts.forum2x2.ru/forum.htm

    Всего записей: 2232 | Зарегистр. 17-07-2006 | Отправлено: 22:34 11-12-2009
    Speecher

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Поздравляю всех с наступающим новым годом!
    http://vitalvoice.speechpro.com/index.php?id=12617473457141

    Всего записей: 8 | Зарегистр. 08-02-2007 | Отправлено: 11:17 28-12-2009
    Vital283



    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Gideon_Vi  
    посмотри  
    http://mytts.forum2x2.ru/forum.htm

     
    Спасибо!
    Понравился синтезатор Ольга с этого сайта.
    там и инструкция есть

    Всего записей: 149 | Зарегистр. 21-05-2007 | Отправлено: 11:53 28-12-2009
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru