Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    http://www.ispeech.org
    http://www.ispeech.org/text.to.speech.demo.php
    Русский мужской неплохо звучит. Нет, всё таки каша присутствует.

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 11:34 02-03-2012 | Исправлено: king_stiven, 11:37 02-03-2012
    Vladimir_02



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    что-то ты попутал, Сакрамент и близко по качеству НЕ на уровне Николая и Катерины. А про то, что написано в шапке (требующая диска), так эта совершенно другая версия Сакрамента.

    Некоторые голоса неплохо звучат... на уровне Николая.. это мое имхо... но я Николаем уже давно не пользуюсь - есть Алёна, даже Ольга для меня хуже звучит... Сакрамент выложил чисто для ознакомления, и размер не большой...

    Цитата:
    А про то, что написано в шапке (требующая диска), так эта совершенно другая версия Сакрамента.

    Извиняюсь... точно 3 версия с диском... А та 2 версия, которую я выложил - "Не требует диска"...

    Всего записей: 400 | Зарегистр. 14-11-2008 | Отправлено: 21:52 02-03-2012 | Исправлено: Vladimir_02, 21:57 02-03-2012
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Что нового в RussAcc 1.0.8 (12.12.2011)
     
    Добавлена возможность перевода компьютера после записи в спящий режим (Hibernate).
     
    Добавлен диалог предупреждения о выключении компьютера.
     
    Улучшена система регистрации под 32 разрядной Vista (касательно сохранения регистрационного номера).
     
    К индикации позиции в текстовом файле добавлены десятые процента.
     
    Исправлена ошибка в одном из правил расстановки ударений, которая, хоть и при редком сочетании слов, могла привести к серьезной ошибке программы.
     
    Обновлены базы и алгоритмы расстановки ударений.
     
    В английской версии добавлена возможность работать с русскими текстами, даже если в системе не установлен русский язык.
    ------
    На странице программы есть десяток 5-звездочных наград от приличных софт-каталогов.
    На расстановку ударений в 1 MB текста на современном компьютере требуется 2-3 секунды (в 15-30 раз быстрее ближайшего конкурента, использующего грамматические параметры).
    Имеет в базе грамматические параметры для более чем 3 миллионов форм слов (при размере дистрибутива < 2.5MB).

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 18:40 04-03-2012
    Futurism

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    замечательный движок Алена! Остальные, правда, какие то с "акцентом"
    Конечно, не идеал, но пока ждать 100% сходства с человеческим чтением не приходится, так что радоваться надо, что Алёнка старается лучше остальных.
    Ток. вопрос, почему при чтении она читает нормальным темпом, а иногда чуть-чуть ускоряется?
     
    Надеюсь тот кто юзал ,поймет о чем я говорю))

    Всего записей: 1200 | Зарегистр. 04-02-2011 | Отправлено: 19:47 10-05-2012
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.9.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    - Добавлен формат звукового файла AAC (Advanced Audio Coding) (расширение файла - mp4).
    - Убран формат звукового файла VMO, как устаревший.
    - Добавлено перемещение по тексту по сочетаниям клавиш Ctrl + стрелка (вверх/вниз) (как в Visual Studio).
    - Обновлены базы и алгоритмы расстановки ударений.
     
    Кстати, цитата из Википедии про AAC:
     
    "Изначально формат WMA рекламировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет  
     
    ему формат AAC (используется в популярном онлайновом музыкальном магазине iTunes)."

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 20:19 11-05-2012
    ruomyes

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Маленький косяк в описании к архиву MSAgent.rar:
     
    Цитата:
     
    "В Windows XP-2003 то же самое, только без Speech Control Panel т.к. она уже встроена в панель от SAPI 5.1"
     
    Оказалось, что не встроена (ошибся, потому что установка винды, на которой проверял, была не очень чистая, и видимо оставались какие-то следы от удаленной ранее панели, на чистой установке вкладка для доступа к настройкам SAPI 4.0 отсутствует и появляется только после установки Speech Control Panel), так что тоже надо ставить, как и на Висту.
     
    Посему перезаливаю архив с исправленным описанием. Старый архив удаляю. Ниже делаю перепост своего старого сообщения с обновленной ссылкой на архив. В шапке соответственно нужно изменить ссылку на этот перепост.

    Всего записей: 230 | Зарегистр. 06-06-2012 | Отправлено: 00:49 06-06-2012 | Исправлено: ruomyes, 21:31 15-03-2013
    fiebz

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Исходники acatts.exe я уже выкладывал на ru-board-e, с тех пор из изменений только добавление переменной среды ACATTS: http://ifolder.ru/7848560  

     
    Ни у кого не остались исходники этой проги писанной на Си Ajaja, использующей для подготовки текстов Алене  морфологический словарь?

    Всего записей: 3 | Зарегистр. 11-06-2012 | Отправлено: 17:16 11-06-2012
    ruomyes

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подробнее...

    Всего записей: 230 | Зарегистр. 06-06-2012 | Отправлено: 21:57 11-06-2012 | Исправлено: ruomyes, 19:56 16-03-2013
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    fiebz

    Цитата:
    Ни у кого не остались исходники этой проги писанной на Си Ajaja, использующей для подготовки текстов Алене  морфологический словарь?  

    Эта утилита (acatts.exe) просто перегоняет текст в wav, используя библиотеку acatts.dll напрямую, минуя костыли SAPI4/5. Исходники и саму программу перезалил сюда: http://ifolder.ru/31045806  
    Но там используется не морфологический словарь , а  обычный словарь Алены (тот что правится в Lexicon Manager).
     
    Морфологический словарь с AOT (http://www.aot.ru/) я использовал в другой утилите - AccentFixer. Которая прогоняет текст через движок Алены и выдает список потенциально проблемных слов (тех, в которых ударение расходится с ударением в AOT) и предлагает альтернативную транскрипцию. На выходе у нее получается  готовый к импорту в Lexicon Manager файл.  Залил ее исходники  вместе с самой библиотекой AOT сюда: http://ifolder.ru/31045991
     
    Откомпилированная AccentFixer с морфологическим словарем тут: http://ifolder.ru/31046265
     
    Честно скажу, последние годы сам я регулярно использую только acatts.exe, обновлять словарь с помощью AccentFixer мне надоело где-то после полугода использования этой утилиты.  
     
     
     

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 22:28 11-06-2012
    ruomyes

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Блин, не могу победить принудительную подстановку тэга more (очередное ограничение для новичков?), но может быть так даже лучше. Короче, надо изменить ссылку в шапке с:
     
    http://forum.ru-board.com/topic.cgi?forum=5&topic=21094&start=360#9
     
    на
     
    http://forum.ru-board.com/topic.cgi?forum=5&topic=21094&start=507&limit=1&m=1#1
     
    Заранее, спасибо!

    Всего записей: 230 | Зарегистр. 06-06-2012 | Отправлено: 22:54 11-06-2012
    ruomyes

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Еще обнаружил, что дистрибутив SAPI 4.0 (Spchapi.exe) уже включен в дистрибутив со Speech Control Panel (SpchCpl.exe), и запускается автоматически в тихом режиме после установки панели. Единственное отличие этого встроенного дистрибутива от автономного - нет цифровой подписи. Поэтому автономный дистрибутив SAPI 4.0 я из архива удаляю (хотя экономия при упаковке ничтожна, но зачем держать в архиве два одинаковых пакета, когда можно обойтись одним, универсальным).

    Всего записей: 230 | Зарегистр. 06-06-2012 | Отправлено: 20:10 12-06-2012 | Исправлено: ruomyes, 12:00 15-03-2013
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.10.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    - Самое большое пополнение баз расстановки ударений. Число форм слов с ударениями превысило 3,5 миллиона.
    - Обновлены алгоритмы расстановки ударений (тоже весьма существенно).
    - Добавлена функция установки верхнего/нижнего регистра выделенного текста по сочетаниям клавиш Ctrl + ("U"/"L").

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 14:23 20-07-2012
    king_stiven

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Народ, новый голос
    http://forum.ru-board.com/topic.cgi?forum=5&topic=38198

    Всего записей: 2229 | Зарегистр. 17-07-2006 | Отправлено: 00:56 28-08-2012
    Ache



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, если хоть какой-нибудь русский голос под Win7 x64 (для 64битных прог, а не для 32битных)? Основные из шапки перепробовал, все 32бит. Ими можно управлять из комманд-лайн
    %windir%\SysWOW64\speech\SpeechUX\sapi.cpl
    но это только для 32битных прог, и всё равно потом слетает в дефолтную Анну.

    Всего записей: 566 | Зарегистр. 05-02-2002 | Отправлено: 20:34 19-09-2012
    horoshval

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Попробовал RussAcc, не знаю как с другими голосами, но с Ольгой программа, на мой взгляд значительно уступает связке Балаболка плюс Книгодел ( Ударятель). К тому же обе программы полностью бесплатны, в отличие от  RussAcc. То есть непонятно, за что автор просит деньги - аналогичный функционал уже реализован в бесплатных программах.
     
    Добавлено:
    king_stiven - спасибо за ссылку, новый голос приятно удивил. Особенно Елена. Дребезжание и металл,конечно. есть, но вот интонации, по сравнению с Ольгой более человеческие и в омографах, на первый взгляд, меньше ошибок. Если учесть, что RHVoice -  бесплатный SAPI5-движок, к тому же сделан одни человеком - очень похвально
     
     

    Всего записей: 3 | Зарегистр. 25-11-2005 | Отправлено: 12:59 20-09-2012
    Mordavorot



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Сёння мама приезжает и надо дать ей прочитать книгу Легкий способ бросить курить Аллена Карра.
    А зрение плохое и с монитора она читать не станет.
    Надо поставить Text-to-speech.
     
    Посоветуйте плз с чего начать и что именно поставить?
    Самые новые и лучшие оболочки и движки - какие?
    Чтобы маме понравилось.
     
    Добавлено:
    В шапке только свежие проги?
    Что получше?
    Оболочка и 2 движка: М и Жо - какие лучшие?

    Всего записей: 1195 | Зарегистр. 01-09-2011 | Отправлено: 12:10 23-10-2012
    hiqmax



    Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    Mordavorot, сам использую Acapela Alyona и IceBookReader для чтения. А что лучше, это сами решайте, можно несколько движков поставить и сравнить.

    Всего записей: 362 | Зарегистр. 01-03-2009 | Отправлено: 19:25 23-10-2012
    Mordavorot



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    В Айс Бук Ридере у меня эти голоса:
    RealSpeak Katerina v2 (Russian).plugin
    Acapela Alyona (Russian).plugin
    Loquendo TTS Olga (Russian).plugin
    NewsAloud.plugin
    KMPlayer 2.9.4.1435 Codecs.plugin
    Microsoft Office Word 2007.plugin
     
     
    ИМХО маме нужен мужской язык. Николай самый хороший?
     
    Добавлено:
    где скачать свежего Николая?

    Всего записей: 1195 | Зарегистр. 01-09-2011 | Отправлено: 11:53 25-10-2012 | Исправлено: Mordavorot, 21:38 25-10-2012
    MaxMIsaev

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вышла новая версия RussAcc - 1.0.12.
    http://bzsoft.spb.ru/russacc.html
    Что нового:
     
    - Исправлено правило расстановки ударений, которое, хоть и в редком случае, но могло привести к ошибке программы. Все правила проверены на подобные ситуации.
    - Обновлены базы и алгоритмы расстановки ударений.
     
    Обновлена и английская версия RussAcc.
     
    Кто пользуется программами BZ Soft может попробовать также новую программу - ExploRex (от Explorer Rex). Запоминает папки, открывавшиеся в проводнике, позволяет быстро найти в списке папок нужные и открыть их заново. Ссылку на нее можно найти на той же странице.

    Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 11:24 18-12-2012
    EgorViktorovich

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ключика нет для RussAcc?

    Всего записей: 60 | Зарегистр. 08-02-2010 | Отправлено: 10:11 25-12-2012
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru