Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 747 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    А интересно, чей вообще это форум? Просто неизвестно, сколько ещё протянет бесплатный сервис для создания форумов, на котором он базируется. А так можно было бы Создать темы, по нормальному восстановить ссылки ну и так далее. Можно будет нормально его поддерживать, благо возможность есть.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 10:24 16-06-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Мы обсуждали это в привате на mytts - я предлагал практически тоже самое. Но как-то особого энтузиазма не возникло.
    С другой стороны, там реально только пара-тройка живых проектов осталось, но и там авторы просто постят ссылки, а хостятся в других местах.
    IMHO конечно...

    Всего записей: 1815 | Зарегистр. 09-02-2008 | Отправлено: 19:47 16-06-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    С одной стороны да, проектов живых мало уже, но с другой, основной материал то никуда не делся. Вот я и думал, восстановить что возможно хотя бы с нормальными ссылками, создать темы, ну как говориться, чтобы было. Просто фиг его знает, сколько там этот форум ещё продержится, ведь по факту, такой он один. Я думаю, что уж не всем прямо таки ну совсем пофиг на состояние tts. Конечно, постепенно и основную инфу можно будет перенести. Ведь многое из битого на том форуме у людей по оставалось. А лично мне, форум не в напряг поддерживать будет. Конечно, самому всё быстро не перенесёшь. Думаю уж в этой области найдётся хоть один человечек, который со ссылками сможет подсобить? Просто очень уж не хочется, чтобы всё это так просто загнулось, и приходилось потом только редкие ветки на различных компофорумах выисскивать. Повторюсь, что для меня использование технологий TTS является необходимым, и в итоге всё это брошено не будет.
     
    Добавлено:
    Интересно, а чей был изначально проект mytts.forum2x2.ru?

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 20:03 16-06-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ответил в ПМ.

    Всего записей: 1815 | Зарегистр. 09-02-2008 | Отправлено: 21:50 16-06-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Всем привет. Некоторое время назад, кто-то интересовался по поводу нового форума по Tts. Короче, вот. http://mytts.info. Пока там лиж сотая часть из того, что есть на старом форуме. Постепенно, будут создаваться темы, выкладываться инфа и файлы. Если чего не так, какие-либо ошибки, пожелания или проблемы, вдруг чего не хватает, пишите, будем разбираться.
     
    Добавлено:
    На старом форуме 90 процентов ссылок умерло. Да и даже нормально зарегаться там сейчас не вариант. К тому же, буквально недавно, он довольно продолжительное время лежал. Фиг его знает, что будет дальше. Люди, поделитесь плис кто что юзает. Ну из того, что актуально сейчас. Я имею ввиду словари, их редакторы, утилитки, в общем то, что выкладывалось на том форуме.
    Заранее, большое спасибо.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 16:29 13-07-2017
    vview

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    se97
    доброе дело! вот

    Всего записей: 1451 | Зарегистр. 28-05-2007 | Отправлено: 19:44 13-07-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    О, спасибо. Что-то я совсем про него забыл. Во:  
    http://mytts.info/viewtopic.php?id=218

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 20:25 13-07-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Так, тут объявилась трабла с регистрацией. Форум не мог отправить письмо подтверждения. Сейчас всё должно работать. Кто не мог зарегаться, пробуйте.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 03:05 14-07-2017
    mnicolae

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Нет защиты, выиграть 32 и нет.
    Возможно, более легкое понимание новой версии 4_100 acapela infovox
    Для других голосовых колибри или высокой четкости используйте браузер
    http://www.acapela-group.com/infovox/my-acapela/download-sdkevaluation/
    но вам нужна бесплатная учетная запись пользователя и пропуск.
     
    Оценочная версия позволит вам оценить продукт в течение 60 минут. Через 60 минут после того, как вы запустили infovox4, вы услышите сообщение, напоминающее вам, что вы используете оценочную версию. Чтобы получить новый пробный период в 60 минут, вам необходимо перезагрузить Windows.
    Оценочная версия будет читать только одно предложение для каждого текста. Это означает, что если вы попытаетесь прочитать текст, содержащий несколько предложений, вы услышите только первое предложение, а затем услышите звуковой сигнал. Чтобы прочитать более длинный текст с оценочной версией infovox4, вам нужно читать каждое предложение по одному.
    Лицензионная версия infovox4 не имеет каких-либо ограничений, ни во время выполнения, ни в том, сколько предложений вы можете прочитать в одном тексте.
     
    В более старой версии 60 минут можно удалить в infovox4demo.exe, который начинается с окон, и в этой версии однократное чтение фразы может быть обмануто с помощью речевого читателя.
     
    Или они могут быть протестированы / использованы в / вместе с сеткой 3
     
    http://www100.zippyshare.com/v/9aMeXYn7/file.html
     
    No protection, win 32 and net.
    Maybe new edition 4_100 of acapela infovox can be easier understood
    For other voice colibri or High Quallity use tor browser  
    http://www.acapela-group.com/infovox/my-acapela/download-sdkevaluation/
    but you needs free account with user and pass.
     
    The evaluation version will let you evaluate the product for 60 minutes. 60 minutes after you have started infovox4, you will hear a message reminding you that you are using an evaluation version. To get a new trial period of 60 minutes you need to restart Windows.
    The evaluation version will read only one sentence for each text. Which means that if you try to read a text that includes several sentences, you will only hear the first sentence and then you will hear a “beep” sound. To read longer text with the evaluation version of infovox4, you need to read each sentence one by one.
    The licensed version of infovox4 does not have any limitation, neither in running time nor in how many sentences you can read in one text.
     
    In older version 60 minutes can be removed in infovox4demo.exe that starts with windows and in this version one time phrase reading can be tricked with speech2go tts reader.
     
    Or they can be tested/used in/ together with grid 3
     
    grid exe can be fine seen in redgate reflector 9 and have 60 days trial limit.
     
    Softs works well in windows 10x64 too.
     
    https://thinksmartbox.com/downloads/iso/grid_3/
    https://downloads.sensorysoftware.com/public/Grid%203.exe
    or whatever
    http://downloads2.sensorysoftware.com/20170821_Grid3_en-US.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_en-GB.iso
    http://downloads2.sensorysoftware.com/20170519_ARASAAC_Grid_3.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_cs-CZ.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_de-DE.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_en-AU.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_en-CA.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_en-ZA.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_es-ES.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_fr-FR.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_el-GR.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_he-IL.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_it-IT.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_nl-NL.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_nb-NO.iso
    http://downloads2.sensorysoftware.com/20170523_Grid3_pl-PL.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_pt-PT.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_sk-SK.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_fi-FI.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_sv-SE.iso
    http://downloads2.sensorysoftware.com/20170821_Grid3_nl-BE.iso
     
    http://nitroflare.com/view/FC779E37507952F/Kruptos2.Professional.7.0.0.1.sanet.cd.rar
     
    Download ISO for Grid 3
    Grid 3
    ARASAAC Grid 3
    Grid 3 Czech
    Grid 3 Deutsch
    Grid 3 English (Australian)
    Grid 3 English (Canadian)
    Grid 3 English (South Africa)
    Grid 3 English (United Kingdom)
    Grid 3 English (United States)
    Grid 3 Español
    Grid 3 Français
    Grid 3 Greek
    Grid 3 Hebrew
    Grid 3 Italiano
    Grid 3 Nederland
    Grid 3 Norsk
    Grid 3 Polski
    Grid 3 Português (PT)
    Grid 3 Slovak
    Grid 3 Suomi
    Grid 3 Svenska
    Grid 3 Vlaams

    Всего записей: 86 | Зарегистр. 16-11-2014 | Отправлено: 19:49 18-10-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Нет защиты, выиграть 32 и нет.
    Ясен перец, Acapela Infovox4 лучше чем Infovox2.
    Но народ упорно сидит на Infovox2.
    Словари-то не совместимы, вот и ждут, когда кто-нибудь сделает. А сами и пальцем пошевелить не хотят...
     

    Всего записей: 1815 | Зарегистр. 09-02-2008 | Отправлено: 03:37 19-10-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    По поводу лучше, ну это ещё как сказать. С одной стороны да. По тоновым характеристикам он лучше двойки будет. Вспомнить хотя бы задранные высокие частоты у Алёнки из 2.2. Но в целом, лично моё мнение, голоса стали какими-то ватными. Причём как под Android, так и под Windows. Даже не знаю, как это описать, но новые голоса звучат гораздо грязнее старых. Лично для меня, самой нормальной версией, был Infovox 3. Там уже по частотам всё было нормально, но грязи ещё этой не было. В прочем, как и антижадина не было тоже. А по поводу того, что никто переделывать не хочет, так и некому уже особо. Из всех, кто именно постоянно этим занимается, осталось там три калеки. Хотя странно. Раньше столько людей было, и в один момент куда-то все разбежались.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 20:27 22-10-2017
    romby



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, пожалуйста, где можно взять для андроида русские/испанские движки/голоса?

    Всего записей: 1785 | Зарегистр. 09-02-2006 | Отправлено: 22:11 10-12-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Подскажите, пожалуйста, где можно взять для андроида русские/испанские движки/голоса?
    На 4pda не смотрели случайно?

    Всего записей: 1815 | Зарегистр. 09-02-2008 | Отправлено: 00:55 11-12-2017 | Исправлено: Apokrif, 00:55 11-12-2017
    vview

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    romby
    Русский RHVoice

    Всего записей: 1451 | Зарегистр. 28-05-2007 | Отправлено: 15:05 11-12-2017
    HENDELF

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Господа посоветуйте голосовой движок, сейчас слушаю Максима.Есть что нибудь лучше? спасибо.

    Всего записей: 416 | Зарегистр. 22-02-2006 | Отправлено: 02:48 21-12-2017
    se97

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ну тут для кого как, и смотря что считать лучшим. Смотрите на mytts.info, может что и понравится.

    Всего записей: 30 | Зарегистр. 14-12-2016 | Отправлено: 16:28 21-12-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Господа посоветуйте голосовой движок, сейчас слушаю Максима.Есть что нибудь лучше?
    На 4pda писали, что у мелкомягких был хороший TTS, но они его быстро убрали, остались только примеры...

    Всего записей: 1815 | Зарегистр. 09-02-2008 | Отправлено: 19:34 21-12-2017
    CompaEd



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Apokrif
    Я давно бы перешел на Windows 10, только из за того, что там есть встроенные голосовые движки и на x32 и на x64, но эти уроды туда столько дерьма понапихали, с невозможностью нормальной настройки системы, что пока только Алена х32-я на х64...

    Всего записей: 2233 | Зарегистр. 03-01-2006 | Отправлено: 19:47 21-12-2017
    HENDELF

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    В принципе Максим неплох, но такое ощущение что иностранец читает русский текст. Думал есть более правильные движки. Еще понравился Дмитрий но меня на сон клонит.

    Всего записей: 416 | Зарегистр. 22-02-2006 | Отправлено: 20:20 21-12-2017
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    пока только Алена х32-я на х64...
    Да уж. se97 про Алену чуть выше все точно написал... Тяжелый случай, понимаешь!
     
     

    Цитата:
    В принципе Максим неплох, но такое ощущение что иностранец читает русский текст. Думал есть более правильные движки.
    Отпишите производителю. Они все замечания собирают и правят по мере возможностей.
    У ЦРТ по идее, д.б. голоса без акцентов.
     
     

    Всего записей: 1815 | Зарегистр. 09-02-2008 | Отправлено: 00:26 22-12-2017 | Исправлено: Apokrif, 00:30 22-12-2017
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru