Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » GoldenDict (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущее обсуждение: Часть 1




 
Актуальная версия 1.5.0:
Windоws Qt 4.8.6 или Qt 5.12.3, последний EXE-файл: 1.5.0-18-g59363bc9.
Плагин dsengine.dll для Qt 5.6-based версии на Windows XP: dsengine_5.6.1_for_XP.7z
как собрать актуальный рабочий комплект для windows (без словарей)
MacOSX 1.5.0-18-g59363bc9 Intel; архив прежних версий: на github (09.2012–04.2019), на sourceforge (06.2016–04.2019)
 
Расширенная настройка интерфейса
 
GoldenDict — новая словарная программа, обладающая следующими особенностями:  
 
  • Графический интерфейс на основе табов, для создания которого использована библиотека Qt;
  • Интеграция с html-движком WebKit для корректного представления материалов в html-формате;
  • Поддержка подключения словарей в форматах: Babylon (.bgl/.gls), StarDict (.ifo/.dict./.idx/.syn), Dictd (.index/.dict), ABBYY Lingvo (.dsl тексты и аудиоматериалы .lsa/.dat, .lsd - только в Android), XDXF, AARD, SLOB, ZIM, MDX/MDD, EPWING;
  • Система морфологии, которая находит основы слов при поиске, улучшая его результаты, а также дает рекомендации по правильному написанию слов. Используются обычные словари Hunspell/Myspell;
  • Поддержка индексации звуковых файлов в директориях, формируя из них словари аудио-произношений;
  • Поддержка отправки запросов в Wikipedia, Wiktionary и другие MediaWiki сайты;
  • Режим работы в роли глобальной для всего десктопа всплывающей подсказки, позволяющий выводить информацию для выделенного или помещенного в буфер обмена слова из любого текста внешней программы;
  • Для загрузки доступна версия, имеющая в комплекте набор англо-русско-английских словарей, словарей морфологии и примеры произношения слов на английском языке.  
     
    Программа позиционируется как функциональная замена StarDict, поддерживающая большее количество форматов файлов и более качественное их отображение. Программа умышленно не вводит собственного формата файлов, ставя вместо этого задачу наиболее полно поддержать все популярные существующие.
     
    Официальные Early Access билды для Windоws :: для MacOSX :: для Linux.
    Официальные Development билды для Windоws.
    Официальный форум поддержки GoldenDict.
    Официальный баг-трэкер.
     
    Параллельные топики:
    GoldenDict - New Level - Разработка новых форматов словарей для GD: DSLGD, HTMLGD; подключение речевых движков; режим закладок; варианты полнотекстового поиска.
     
    Как сжимать словари в формат .dz для использования в GoldenDict :: DictZip 1.12.1 (latest) :: Оболочка DictUI
     
    Ссылки на готовые сборки
     
    Ссылки на словари для GoldenDict

  • Всего записей: 38758 | Зарегистр. 26-02-2002 | Отправлено: 11:50 23-02-2017 | Исправлено: yozhic, 22:10 16-03-2024
    softes

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Svirepov

    Цитата:
    А из какой версии Лингво происходят эти проблемные словари?

    из х5 (сборка plus v.4). Но на замену взял из х6, которые и подчистил. Думаю, между х6 и х5 изменений в этих конкретных словарях нет (но не проверял, если честно)

    Всего записей: 864 | Зарегистр. 22-10-2003 | Отправлено: 21:42 05-02-2021 | Исправлено: softes, 21:44 05-02-2021
    Svirepov

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    softes
    Вот X5 и X6 как раз примерно одинаково "хороши". Я давно стараюсь держаться от них подальше, если есть другие варианты.
    Ага, только теперь я понял, в чём именно была проблема в PhraseBookRuEs.dsl.
     
    Abs62
    Раз декомпилятор выдаёт такое внутри тэга /S/, то, наверное, не будет большого вреда, если бэкслэши удалять?
    Cada\ uno\ se\ paga\ lo\ suyo..wav

    Всего записей: 355 | Зарегистр. 04-11-2013 | Отправлено: 22:15 05-02-2021
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    softes
    Svirepov
    Писал ещё пол года назад Abs62 в ЛС об этом баге.

    Цитата:
    Системный словарь x5 GermanyDeRu. Хотя, подобная проблема присутствует и в некоторых других. Ссылки на файлы ресурсов в нём прописаны в следующем виде:
    Path\ to\ my\ Picture.jpg
    При конвертировании в HTML такие пробелы преобразуются в НЕРАЗРЫВНЫЕ. Затем это всё конвертируется в процентную кодировку и, закономерно, ресурс не находится. Надо пофиксить. Просто не менять обычный пробел на неразрывный.

    Видимо, у него пока не было времени/возможности внести коррективы в код.

    Всего записей: 1326 | Зарегистр. 03-03-2008 | Отправлено: 16:49 07-02-2021
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81

    Цитата:
    При конвертировании в HTML такие пробелы преобразуются в НЕРАЗРЫВНЫЕ.

    Это происходит в самом начале работы с DSL, при чтении строки. И явно сделано специально. Вот здесь. До парсинга тегов, так что там не разобраться, имя файла это или просто текст.
     
    Впрочем, можно потом и обратную операцию проводить, конвертировать неразрывный пробел в обычный. Но вы уверены, что при этом не могут пострадать другие ссылки, где нужен именно неразрывный пробел?

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6077 | Зарегистр. 22-10-2005 | Отправлено: 19:00 07-02-2021 | Исправлено: Abs62, 19:31 07-02-2021
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62 (Пост)

    Цитата:
    Но вы уверены, что при этом не могут пострадать другие ссылки, где нужен именно неразрывный пробел?

    Пострадают однозначно.
    Но на практике не уверен, что таковые имеются. Зачем в имени файла ресурса делать неразрывный пробел, если визуально он отображается только иконкой - ссылкой на этот самый файл?
    В то время, как ситуация с экранированным пробелом имеет место быть в системных словарях Лингво, и не в одном.
    Проблема тут в интерпретации на программном уровне. Отбивка слэшем нужна для того, чтобы Лингво не производил построчный тримминг и сведения к минимуму пробелов между словами. Вот и всё. Не уверен на 100%, но мне кажется, что такие пробелы он не заменяет на неразрывные. Он просто их не удаляет и выводит "как есть".
    GD же изменяет в этом случае код символа и это приводит вот к таким вот последствиям.
    Для правильной интерпретации нужно ещё более усложнять логику парсинга DSL, которая и так уже наворочена донельзя.
    Ну или прикрутить костыль обратной замены в ссылках.
    Вам виднее как лучше сделать.
     
     
     
    Добавлено:
    P.S. Может стоит попробовать прикрутить такую же логику как у Лингво?
    Сначала построчная нормализация whitespace а потом дальнейший парсинг.
    Убить экранированный пробел не позволит слэш, который будет интерпретирован регуляркой литерально.

    Всего записей: 1326 | Зарегистр. 03-03-2008 | Отправлено: 21:06 07-02-2021
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81

    Цитата:
    Пострадают однозначно.
    Но на практике не уверен, что таковые имеются. Зачем в имени файла ресурса делать неразрывный пробел, если визуально он отображается только иконкой - ссылкой на этот самый файл?

    Не знаю, зачем. Равно как и не знаю, зачем лепить экранированные пробелы в имена файлов.

    Цитата:
    P.S. Может стоит попробовать прикрутить такую же логику как у Лингво?
    Сначала построчная нормализация whitespace а потом дальнейший парсинг.
    Убить экранированный пробел не позволит слэш, который будет интерпретирован регуляркой литерально.

    GD не нормализует пробелы. Из нормализует веб-движок, который получает готовый html.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6077 | Зарегистр. 22-10-2005 | Отправлено: 21:41 07-02-2021
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62 (Пост)

    Цитата:
    GD не нормализует пробелы. Из нормализует веб-движок, который получает готовый html.

    Тогда тем более не понятно, для чего преобразуется код символа. Лингво поступает также в этих случаях?
     
    Добавлено:
    Abs62 (Пост)

    Цитата:
    Равно как и не знаю, зачем лепить экранированные пробелы в имена файлов.

    Ключевой момент тут в том, что это происходит в системных словарях.

    Всего записей: 1326 | Зарегистр. 03-03-2008 | Отправлено: 22:49 07-02-2021
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81

    Цитата:
    Тогда тем более не понятно, для чего преобразуется код символа.

    Неразрывные пробелы в html, в отличие от обычных, не нормализуются.

    Цитата:
    Лингво поступает также в этих случаях?

    Понятия не имею.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6077 | Зарегистр. 22-10-2005 | Отправлено: 23:03 07-02-2021
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62 (Пост)

    Цитата:
    Неразрывные пробелы в html, в отличие от обычных, не нормализуются.

     

    Код:
    .dsl_article {white-space: break-spaces;}

    должен решить проблему. Но надо тогда нормализовывать ручками, как это делает Лингво.

    Всего записей: 1326 | Зарегистр. 03-03-2008 | Отправлено: 00:34 08-02-2021
    data man



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62
     
    Кто о чём, а я всё о Больших словарях...
     
    Такая идея: добавить опцию "Не подсчитывать количество слов" по аналогии с полнотекстовым поиском - по типам словарей.
     
    Не знаю, как для кого, но для меня эта информация не важна.
    Предполагаю, что это основная причина такого медленного индексирования гигантских zim-словарей.

    ----------
    Любой достаточно развитый тролль неотличим от подлинно помешанного на какой-либо идее.
    Кекс. Антибиотики. Ламбада.

    Всего записей: 1696 | Зарегистр. 13-10-2005 | Отправлено: 18:43 09-02-2021
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    data man

    Цитата:
    Предполагаю, что это основная причина такого медленного индексирования гигантских zim-словарей.

    Это вы зря предполагаете. Время на подсчёт количества статей и заголовков по сравнению с прочими операциями - это даже меньше, чем дельта-плешь.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6077 | Зарегистр. 22-10-2005 | Отправлено: 23:53 09-02-2021
    data man



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62

    Цитата:
    Время на подсчёт количества статей и заголовков по сравнению с прочими операциями

    Дело не во времени, а в памяти.
    Для подсчёта слов распаковываются гигабайты статей, а для построения индекса нужны только их заголовки.

    ----------
    Любой достаточно развитый тролль неотличим от подлинно помешанного на какой-либо идее.
    Кекс. Антибиотики. Ламбада.

    Всего записей: 1696 | Зарегистр. 13-10-2005 | Отправлено: 16:40 10-02-2021
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    data man
    Нет никакой распаковки гигабайтов статей. Считается только количество статей и количество заголовков. Количество слов - это количество заголовков. Слова в статьях никто не считает за ненадобностью.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6077 | Зарегистр. 22-10-2005 | Отправлено: 17:40 10-02-2021
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81
    Вот, пробуйте - goldendict-1.5.0-RC2-474-g7db077b(EXE only).7z. Убрал преобразование пробелов внутри тега [s]. И кое-что ещё поправил.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6077 | Зарегистр. 22-10-2005 | Отправлено: 12:13 13-02-2021
    softes

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, как настраивать шрифты для отображения в GoldenDict (Windows)?
    Правка кода в Article-style.css изменяет только отображение европейских букв (русский, английский), иероглифы ему не "подчиняются".  
     
    Нужно настроить отображение всего, чего возможно, при помощи шрифта DengXian либо Segoe UI (они и иероги нормально отображают, и латиницу с кириллицей).
     
    В qt-style.css (который за внешний вид журнала, поиска и избранного отвечает) добавил блок с указанием шрифта - эффекта не произошло, все равно умолчальным шрифтом отображает  

    Всего записей: 864 | Зарегистр. 22-10-2003 | Отправлено: 18:34 13-02-2021
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62 (Пост)

    Цитата:
    Вот, пробуйте

    Спасибо большое!
    Посмотрел по коду - всё-таки решили делать подобием парсинга, вычисляя находится ли экранированный пробел внутри тега [s] или нет.

    Пусть коллеги  
    Svirepov
    softes
    тоже отпишут - у них вроде были проблемные файлы.
     
    Добавлено:
    softes (Пост)

    Цитата:
    Подскажите, как настраивать шрифты для отображения в GoldenDict (Windows)?

    Всё ох как непросто.
    Можете глянуть подробнее этот пост.

    Всего записей: 1326 | Зарегистр. 03-03-2008 | Отправлено: 19:03 13-02-2021 | Исправлено: Romul81, 19:03 13-02-2021
    Svirepov

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81
    Да, пресловутый PhraseBookRuEs.dsl из X6 заработал.
     
    softes
    Если что-нибудь выкопаете - поделитесь рецептами, пожалуйста.
    У меня как раз прописан Segoe UI:

    Код:
     
    body {
        font-family: "Segoe UI";
    }
     

    но на деле частенько получаю кашу из Segoe UI и Simsun

    Всего записей: 355 | Зарегистр. 04-11-2013 | Отправлено: 20:44 13-02-2021
    softes

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81

    Цитата:
    Пусть коллеги тоже отпишут - у них вроде были проблемные файлы

    Исходный (проблемный) вариант русско-испанского разговорника из Лингво х6 на новом .ехе х64 заработал. Спасибо за обновление!
    С CompactVerlagEsDe.dsl проблемы были только на Android - там помог перевод имен wav файлов (в тексте .dsl) в нижний регистр.
     
    Svirepov
    Возьмите лучше DengXian, выглядит приличнее.  
    Ещё в Article-style.css размер шрифта сделал меньше (12рх), а потом в окне увеличил масштаб - получилось неплохо (название словаря и его иконка только чересчур большие из-за этого). Заглавие статьи стало крупнее, а текст статьи - остался примерно таким же в итоге этих манипуляций. При том, что DengXian, если меня зрение не подводит, применился только к тексту статьи, но не к её заголовку.
    Правда, при переводе с евроязыков стало неказисто - заголовок статьи неуместно велик.
    Буду разбираться с настройкой только направления перевода с китайского (тут описано, как это сделать).
    С видом окон поиска и журнала смирился, не гладко и мелковато, но разобрать вполне можно.
    На случай сложных иерогов взял программку ZZoom (аналог виндовой лупы) и пристроил её на место окна избранного (у меня справа внизу) - просто загляденье, навёл на историю - увидел увеличенный вдвое участок экрана в нужном месте. Попробуйте, может, тоже понравится.
    А в остальном, с учётом результатов проведённого уважаемым Romul81 расследования, видимо, остаётся терпеливо ожидать в будущем перехода с webkit на enginе, для более простой настройки отображаемых шрифтов в программе.
     
    Upd:
    Сделал вот так, вроде нормально смотрится

    Всего записей: 864 | Зарегистр. 22-10-2003 | Отправлено: 01:38 14-02-2021 | Исправлено: softes, 15:19 14-02-2021
    Svirepov

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    softes
    Большое спасибо за советы, особенно за DengXian и за наводку на FAQ. Я не знал, что там можно делать такую тонкую настройку. Применил некоторые рекомендации оттуда - стало намного лучше
     
    Улучшился даже вид SLOB- и ZIM-словарей, а я и не думал, что на них хоть как-то можно извне влиять. Для всего некитайского оставил Segoe, т.к. тут DengXian тонковат. Немного надеялся на выдранный из андроида "Droid Sans Fallback.ttf", но именно для китайского он похуже DX. Noto CJK из новых андроидов вроде содержит только иероглифы, т.е. без нормального fallback-механизма для шрифтов его использовать нельзя.
     
    А шрифт окна поиска / строки поиска у вас не получилось изменить? У меня вышло, причём именно для китайской группы, а все остальные остались нетронутыми. Вот historyList не сумел увеличить для отдельной группы - только глобально, но и на том спасибо.

    Всего записей: 355 | Зарегистр. 04-11-2013 | Отправлено: 20:50 14-02-2021 | Исправлено: Svirepov, 21:02 14-02-2021
    softes

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Svirepov
    На здоровье! И Вам спасибо за наводку на шрифты и текстовку css-файлов . Воспользовался Вашей настройкой - получилось регулировать отображение шрифта в "Журнале".
    В панелях поиска и избранного (и в строке ввода) шрифты не поменялись. Возможно, из-за того, что у меня портабельная версия?  
     
    Теперь действительно всё выглядит намного симпатичнее, за исключением транскрипции английских слов (там, где статья - на китайском, если перевод на какой-л. из некитайских языков - всё ОК).
     
    Кстати, попробовал и NoteCJK - тоже няшный шрифт, кириллица/латиница присутствует, транскрипция - загляденье, но опять новый "несходняк" - диакритика уродливо смотрится (а это испанский, французский, западно- и южнославянские варианты латиницы и т.д.). Причем (пробовал в Лингве) в списке главного окна - уродство, а в строке ввода - всё ок! А шрифт внешне и там и там - Note. Странно. Так что пока DengXian - наиболее близкий к идеалу вариант (пока fallback не заработает), остаёмся на нём ))

    Всего записей: 864 | Зарегистр. 22-10-2003 | Отправлено: 17:46 15-02-2021 | Исправлено: softes, 17:47 15-02-2021
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175

    Компьютерный форум Ru.Board » Компьютеры » Программы » GoldenDict (часть 2)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru