Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Программы для транскрибирования | Транскрайберы

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

slech



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Транскрибирование - Транскрайберы

 
Список программ
Slovomol
Цезарь
Нестор
LossPlay - плеер для расшифровщиков
Проект "Транскрайбер"
 
Обзоры программ
Расшифровка звукозаписей — печать на слух?
Расшифровщик/транскрибатор аудио- видео- в текст
 
Родственные темы
Распознавание речи (Speech Recognition) Горыныч / Диктограф

Всего записей: 4893 | Зарегистр. 10-11-2004 | Отправлено: 15:00 02-12-2013 | Исправлено: ndch, 20:26 24-02-2024
ULer



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

 
Какие есть варезные (не обязательно) решения для бесплатного транскрибирования (распознавания и записи) аудио-файлов в текст, на разных языках? Вообще желательно ещё и с таймингом.

----------
http://dc.ru-board.com/ — Anime, Books, Cartoons, Clips, Databases and Maps, Games, Misc, Music, Movies, Scripts and Templates, Series, Soft, Training Courses, XXX.

Всего записей: 7446 | Зарегистр. 18-10-2007 | Отправлено: 22:57 03-02-2022 | Исправлено: ULer, 22:57 03-02-2022
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В Adobe Premiere есть Speech to Text и всякие онлайл-сервисы (в частности автосоздание субтитров из звуковой дорожки на ютюбе).
А тут - будто всё застыло во времена Горыныча, глухо с этой темой на ру-борде.
 
Добавлено:
Не, я понимаю что результат бывает далёк от "нормального текста", но порой, даже такой результат интереснее чем прослушивание часового стрима.

Всего записей: 6529 | Зарегистр. 31-08-2008 | Отправлено: 11:10 13-02-2024
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В Adobe Premiere есть Speech to Text

И как он?
 

Цитата:
всякие онлайл-сервисы

Не впечатлили, ютубом не пользовался.
 

Цитата:
глухо с этой темой на ру-борде

Какой сайт такая и тема=)
 
Добавлено:
Нужно больше и рабочее решение? В личку велком

Всего записей: 1123 | Зарегистр. 29-03-2023 | Отправлено: 11:28 13-02-2024
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И как он?

Что-то умеет.  Меня вариант прочесть (хоть даже и не очень хорошо распознанный) текст вместо часового просмотра видео более-менее удовлетворяет.
 

Цитата:
Нужно больше и рабочее решение? В личку велком

Это не вконтакт всё же, пишите в топике.

Всего записей: 6529 | Зарегистр. 31-08-2008 | Отправлено: 17:40 15-02-2024 | Исправлено: ndch, 17:47 15-02-2024
greeple

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch
Цитата:
Это не вконтакт всё же, пишите в топике.

он везде так пишет, в любой теме
зачем? загадка даже для учёных
по транскрайберам вот что выдал

Цитата:
если бы не было не писал
 
тут всё https://www.linux.org.ru/forum/general/17262001?cid=17280116
если непонятно как ставить - есть туторы на ютабе

кароче он просит обращаться в личку, а он будет гуглить
 
Добавлено:
в чем проблема написать это всем, хз

Всего записей: 4257 | Зарегистр. 11-02-2020 | Отправлено: 13:48 16-02-2024
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
greeple
в очередной раз ты доказал какие люди твари
персональный БАН тебе везде




Оскорбления. Запрет на пост

Всего записей: 1123 | Зарегистр. 29-03-2023 | Отправлено: 15:37 16-02-2024 | Исправлено: Maz, 19:25 16-02-2024
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал whisper от openai. Работает.
О качестве перевода речи в текст  - не сказал бы что заметил колоссальную разницу между whisper и premiere.
whisper делит субтитры на предложения. Вот это понравилось.
Не понравилось: whisper неуверенно распознанное - не выделяет никак (при этом порой распознало и написало полный бред), а premiere отображает (подчёркнутой линией).
 
Какой-либо обратной связи со спеллчекерами ни в том, ни в том не замечено (как минимум в явном виде). Вот это реально недоработка (на мой взгяд).
 
Добавлено:
Ну, а так, по теме существует табличка на вики:
https://en.wikipedia.org/wiki/List_of_speech_recognition_software
Впрочем, там пустовато как-то.

Всего записей: 6529 | Зарегистр. 31-08-2008 | Отправлено: 16:18 16-02-2024 | Исправлено: ndch, 16:33 16-02-2024
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
при этом порой распознало и написало полный бред

очень редко такое у меня было
нужна просто речь внятная, я на курсах тестил где у некоторых жуткая речь

Всего записей: 1123 | Зарегистр. 29-03-2023 | Отправлено: 18:32 16-02-2024
greeple

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
pressF
Цитата:
в очередной раз ты доказал какие люди твари
персональный БАН тебе везде

чё?

Всего записей: 4257 | Зарегистр. 11-02-2020 | Отправлено: 18:35 16-02-2024
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а вот vosk за год  активного юзанья мне понравился больше
 

Всего записей: 1123 | Зарегистр. 29-03-2023 | Отправлено: 18:41 16-02-2024
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
субтитры сделал DimaTorzok

Всего записей: 6529 | Зарегистр. 31-08-2008 | Отправлено: 20:24 24-02-2024
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Существует публичная модель распознавания речи Whisper от OpenAI.
Если кто-то хочет быстренько попробовать что к чему, то можно сделать так:
 
Со страницы https://github.com/Const-me/Whisper/releases скачиваем WhisperDesktop.zip ~1 МБ. Упрощённо - "движок".
Со страницы https://huggingface.co/ggerganov/whisper.cpp/tree/main скачиваем ggml-medium.bin ~1,6 ГБ (русский понимает, вроде бы мультиязычная). Упрощённо - база данных/модель.
Со страницы https://learn.microsoft.com/en-us/cpp/windows/latest-supported-vc-redist?view=msvc-170#visual-studio-2015-2017-2019-and-2022 скачиваем/устанавливаем vc redist 2015 ("2015, 2017, 2019, and 2022") - один файл.
 
Системные требования (тут очень неточно): windows x64 8.1+, при работе потребляет ~ 1,2 ГБ RAM компа, ~1,43 Гб "на диске" (для хранения модели); видеокарта с DirectCompute 11 (в подробностях не разбирался, но вполне работало на бюджетных gt1030 и 5600g). Возможно примерно такие
CPU с AVX1 и F16C: intel примерно Ivy Bridge/3*** и новее / AMD не понял какие.
Подробности тут
 
Результат от "неплохо" до "неудовлетворительно" (местами галлюцинирует - "субтитры сделал DimaTorzok" и генерация прочего текста при фоновой музыке).
 
PS. Использование меньших (чем medium) моделей сомнительно

Всего записей: 6529 | Зарегистр. 31-08-2008 | Отправлено: 11:53 26-02-2024 | Исправлено: ndch, 23:32 11-03-2024
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По ощущениям получасовую тишину тишину распознаёт (а не пропускает) с такой же скоростью, как и речь. Вообще в недоумении от такого.
 
Добавлено:
Ну и на тишине галлюцинирует (и бесконечно выводит  какой-то текст).
https://github.com/Const-me/Whisper/issues/26

Всего записей: 6529 | Зарегистр. 31-08-2008 | Отправлено: 09:56 14-03-2024
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Программы для транскрибирования | Транскрайберы


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru