Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » GoldenDict (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущее обсуждение: Часть 1




 
Актуальная версия 1.5.0:
Windоws Qt 4.8.6 или Qt 5.12.3, последний EXE-файл: 1.5.0-18-g59363bc9.
Плагин dsengine.dll для Qt 5.6-based версии на Windows XP: dsengine_5.6.1_for_XP.7z
как собрать актуальный рабочий комплект для windows (без словарей)
MacOSX 1.5.0-18-g59363bc9 Intel; архив прежних версий: на github (09.2012–04.2019), на sourceforge (06.2016–04.2019)
 
Расширенная настройка интерфейса
 
GoldenDict — новая словарная программа, обладающая следующими особенностями:  
 
  • Графический интерфейс на основе табов, для создания которого использована библиотека Qt;
  • Интеграция с html-движком WebKit для корректного представления материалов в html-формате;
  • Поддержка подключения словарей в форматах: Babylon (.bgl/.gls), StarDict (.ifo/.dict./.idx/.syn), Dictd (.index/.dict), ABBYY Lingvo (.dsl тексты и аудиоматериалы .lsa/.dat, .lsd - только в Android), XDXF, AARD, SLOB, ZIM, MDX/MDD, EPWING;
  • Система морфологии, которая находит основы слов при поиске, улучшая его результаты, а также дает рекомендации по правильному написанию слов. Используются обычные словари Hunspell/Myspell;
  • Поддержка индексации звуковых файлов в директориях, формируя из них словари аудио-произношений;
  • Поддержка отправки запросов в Wikipedia, Wiktionary и другие MediaWiki сайты;
  • Режим работы в роли глобальной для всего десктопа всплывающей подсказки, позволяющий выводить информацию для выделенного или помещенного в буфер обмена слова из любого текста внешней программы;
  • Для загрузки доступна версия, имеющая в комплекте набор англо-русско-английских словарей, словарей морфологии и примеры произношения слов на английском языке.  
     
    Программа позиционируется как функциональная замена StarDict, поддерживающая большее количество форматов файлов и более качественное их отображение. Программа умышленно не вводит собственного формата файлов, ставя вместо этого задачу наиболее полно поддержать все популярные существующие.
     
    Официальные Early Access билды для Windоws :: для MacOSX :: для Linux.
    Официальные Development билды для Windоws.
    Официальный форум поддержки GoldenDict.
    Официальный баг-трэкер.
     
    Параллельные топики:
    GoldenDict - New Level - Разработка новых форматов словарей для GD: DSLGD, HTMLGD; подключение речевых движков; режим закладок; варианты полнотекстового поиска.
     
    Как сжимать словари в формат .dz для использования в GoldenDict :: DictZip 1.12.1 (latest) :: Оболочка DictUI
     
    Ссылки на готовые сборки
     
    Ссылки на словари для GoldenDict

  • Всего записей: 38814 | Зарегистр. 26-02-2002 | Отправлено: 11:50 23-02-2017 | Исправлено: yozhic, 22:10 16-03-2024
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81

    Цитата:
    А если код не используется в нативном виде во враппере, а полностью переписывается на Java, но наследуя общую концепцию и алгоритмы? Как в этом случае обстоят дела с лиценцией?

    Это лучше у автора уточнять. Просто в своё время подобные вопросы ему задавали, и ответил он именно так, как я пересказал.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 12:28 04-06-2017
    toti794

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Выплывающее окно заголовок
     
    Ряботая клавиатурой. Я пробовал для заголовок и получается следующее. Нужны три шага.
    1. Контр + Д (английская раскладка) чтобы перейти (задать фокус) в окно заголовок (цвет от серый становится темносиним).
    2. Използуя стрелками перейти на следующее слово.
    3. Нажаты Ентер чтобы статья показалась. Фокус уходит от окно заголовок в окно статьи.
    Тоест, чтобы перейти на следующее слово в списке заголовок и посмотреть следующую статью в словаре нужно опять пройти новые три шага.
    А нужно стоя в списке заголовок(тоест фокус, оставался в окне списка и не уходил в главном окне), нажать опять стрелочку, перейти на следующее слово, статья соответно появилась в главном окне, посмотрел, проверил и т.д. Потом опять на стрелочку нажал, перешел на следующее слово в списке, опять посмотрел, проверил и т.д.
    Ежели ето в мире сего существует?
    Спасибо за ответ!
    То, что я здесь описал, можно делать ЛКМ мыши. На каждое слово нажатие (на каждое слово нужна смотреть и туды и сюды).
    Опять спасибо и прошу ответа!

    Всего записей: 7 | Зарегистр. 30-04-2017 | Отправлено: 02:24 05-06-2017 | Исправлено: toti794, 14:22 05-06-2017
    gerxer

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите а есть вариант какой-нибудь чтобы карточки для запоминания создавать из программы.

    Всего записей: 565 | Зарегистр. 19-06-2014 | Отправлено: 18:16 05-06-2017
    AndreyNansky

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, как вывести в текстовый файл все формы слов? Например есть норвежский словарь отсюда Ссылка и, например, слово hus, которое имеет несколько форм, см фото.
     
       
       
     
    Где хранятся эти формы и как их выгрузить в текстовый файл?
     
     

    Всего записей: 1 | Зарегистр. 28-11-2014 | Отправлено: 19:41 05-06-2017 | Исправлено: AndreyNansky, 19:57 05-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    AndreyNansky
    В текстовый файл выгрузить нельзя. Но можно выгрузить статью в html и попробовать что-нибудь с этим html сделать.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 20:09 05-06-2017
    toti794

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    gerxer
     
    Пробуйте GoldenDict - New Level [?] - Разработка новых форм.
    Там есть слайд шоу. Я знаю что там очень старая версия, но у меня на Уиндоус ХР работает.
     
    Добавлено:
    gerxer
     
    Попробуйте GoldenDict - New Level [?] - Разработка новых форматов.
    Там есть слайдшоу.
    У меня на Уиндоус ХР работает.
     
    Добавлено:
    Глубоко прошу прощения, но у меня возник такой вопрос.
     
    Можно ли сделать так что у самом словаре были два режима показа словарной статье.  
    1. Словарьный режим.
    2. Режим редакции словарной статьи, где текст можно было редактировать как в текстовом редакторе.
    Потом нажал кнопку, вернулся опять в словарный режим и посмотрел что вышло.

    Всего записей: 7 | Зарегистр. 30-04-2017 | Отправлено: 21:33 05-06-2017
    gerxer

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    toti794
     
    Я почему-то на 99% уверен что нельзя)

    Всего записей: 565 | Зарегистр. 19-06-2014 | Отправлено: 10:09 06-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    toti794

    Цитата:
    Можно ли сделать так что у самом словаре были два режима показа словарной статье.  
    1. Словарьный режим.
    2. Режим редакции словарной статьи, где текст можно было редактировать как в текстовом редакторе.
    Потом нажал кнопку, вернулся опять в словарный режим и посмотрел что вышло.

    Нельзя. GD - не редактор, для этого другие программы имеются.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 11:41 06-06-2017
    Itkind

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62
     
    I don't know if this issue was already adressed. I have 2 headwords in the .dsl file, but GD shows only one of them. Look at this picture:
     
       
     
    How can I enable that GD shows me also the other headword in the arcticle?
     
    Добавлено:
    Here is the universal dictionary app for IOS. It shows both headwords:  
     
     

    Всего записей: 177 | Зарегистр. 03-09-2012 | Отправлено: 17:54 06-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Itkind
    Headwords and articles are different entities for GD, it show only one headword found in index and its article. If synonims are significant then ones should be listed inside article.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 18:50 06-06-2017
    ramanuki



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62
    В настоящее время FTS игнорирует все теги на таких вот участках:
     
    language</span></span><span style="display:block;"><img src="text-to-speech_files/a7c5ef090476010e2b8e80fec8dce85b/symbols/xsym.png"><span style="padding-left:2mm;font-style:italic;">text-to-speech providing a variety of voices and accents</span></span><span style="display:block;"><img src="text-to-speech_files/a7c5ef090476010e2b8e80fec8dce85b/symbols/xsym.png"><span style="padding-left:2mm;font-style:italic;">text
     
    С игнором в отношении спана в данном случае можно согласиться. Но вот картинку, может, лучше воспринять как сигнал разбивания? А то получается, что начало цитируемой строки (language) соединяется с концом строки (text) и воспринимается как одно слово (несуществующее), которое и заносится в индекс как languagetext - при том, что карточка выглядит как:
     
       
     
    При этом правильный вариант "language" + "text" в индекс не попадает.
     
    Искажения FTS есть и дальше, включая в индекс accentstext и пр. (Oxford Advanced American Dictionary; Oxford Advanced American Dictionary for learners of English)

    Всего записей: 805 | Зарегистр. 07-08-2013 | Отправлено: 20:46 06-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ramanuki
    Хм. Какое-то очень нетривиальное разбиение на абзацы через <span style="display:block;">. Тег <img>, конечно можно добавить, если есть уверенность, что внутри слов он встретиться не может в принципе. Хотя это потянет за собой полнотекстовую переиндексацию большинства форматов...

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 21:17 06-06-2017
    gerxer

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Нельзя. GD - не редактор, для этого другие программы имеются.

     
    А есть такие которые позволяли бы делать это грубо говоря "на лету"?

    Всего записей: 565 | Зарегистр. 19-06-2014 | Отправлено: 21:25 06-06-2017
    ramanuki



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62
    У меня тоже есть "подозрение", что некоторые словари составлены некорректно, но я с этим форматом mdx не знаком. Может, и не стоит трогать FTS, но бог знает, сколько таких "ошибочных" mdx-словарей. Я только на два наткнулся случайно.
     
    Может, их можно перекомпилировать с устранением ошибок? Авось тов. Romul81 сделает это? Давайте подождем, что он скажет.
     

    Цитата:
    Тег <img>, конечно можно добавить, если есть уверенность, что внутри слов он встретиться не может в принципе.

    Встречается изредка в некоторых, где картинка заменяет символ, который не смогли набрать текстом. Но такие слова "с картинками" нет смысла включать в индекс.
     
     
    Еще один вопрос:  
    Я правильно понимаю, что слова длиной до 3 букв включительно в индекс FTS вообще не попадают? То есть, смысл обрамлять тегами исключения [!trs] есть только для слов длиной от 4 букв?

    Всего записей: 805 | Зарегистр. 07-08-2013 | Отправлено: 21:27 06-06-2017 | Исправлено: ramanuki, 21:31 06-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    gerxer
    Поспрошайте лучше в темах по созданию словарей. Думаю, там не откажутся поделиться опытом.
     
    ramanuki

    Цитата:
    Я правильно понимаю, что слова длиной до 3 букв включительно в индекс FTS вообще не попадают?

    Да.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 21:40 06-06-2017
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Abs62

    Цитата:
    Какое-то очень нетривиальное разбиение на абзацы через <span style="display:block;">

    В LDOCE6 вообще div-ов нет. Причём в оригинале на сайте так же. В принципе, вполне валидная разметка, если внутри нет других блочных тегов. При этом, вроде как, при большом кол-ве таких элеметов браузер быстрее рендерит страницу, чем если бы тот же контент был в div-ах.
     
    ramanuki

    Цитата:
    Может, их можно перекомпилировать с устранением ошибок? Авось тов. Romul81 сделает это? Давайте подождем, что он скажет.  

    Судя по всему, это какой-то из Оксфордов. Какой именно, уж не знаю. У меня в подключенном OALD9 разметка другая, похожа на оригинальную с веба. Этой пресловутой картинки в данном месте вообще нет, а есть "точка", заданная в CSS-свойстве content. При этом да, вокруг спаны с дисплей-блок, но заданные в CSS, а не инлайн.
     
    З.Ы. Да, пересобирать большинство словарей формата mdict можно, и, наверное, нужно, т.к. из всех сборщиков только два толковых. Остальное творчество, в большинстве случаев, откровенная халтура/любительщина. Но это не отменяет ценность контента, конечно же. Просто его оформление надо переделывать.  
    Вы не хуже меня знаете, что даже в таком проcтом формате, как DSL совершенству нет предела - теги можно оптимизировать ещё и ещё (см. к примеру, Апресяна от ramix-a). Что уж говорить о HTML, да ещё с поддержкой ресурсов, JS, CSS... Вопрос только в том, кто этим будет заниматься?..
     
    Если у кого есть желание, могу дать наводку, чем удобнее всего это делать - Nodereplacer от ув. andreyefgs + плагин Cheerio (уже включён в поставку). Но надо курить синтаксис последнего, который идентичен JQuery. Ну и наличие общего представления о Javascript подразумевается.

    Всего записей: 1327 | Зарегистр. 03-03-2008 | Отправлено: 22:27 06-06-2017 | Исправлено: Romul81, 22:28 06-06-2017
    ramanuki



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81
    Такая разметка была обнаружена мною случайно в Oxford Advanced American Dictionary (автора под забавным именем mimihuhu) и Oxford Advanced American Dictionary for learners of English (Langheping).
     
    Цитата кода с тегами сделана мною из сохраненной через F2 статьи. Как там в оригинале - не знаю.
     
    А посредством изменения CSS разбить практически можно?

    Всего записей: 805 | Зарегистр. 07-08-2013 | Отправлено: 22:38 06-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81
    Вопрос в том, что с этим делать в плане перевода html в текст, особенно с учётом варианта "вокруг спаны с дисплей-блок, но заданные в CSS, а не инлайн". И есть ли резон вообще в это лезть.

    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 22:45 06-06-2017
    Romul81



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ramanuki

    Цитата:
    Цитата кода с тегами сделана мною из сохраненной через F2 статьи. Как там в оригинале - не знаю.

    По идее там то же самое. GD в эти теги не лезет.

    Цитата:
    А посредством изменения CSS разбить практически можно?

    Я не знаю, как устроен FTS модуль, скорее всего ему на DOM и тем более на Computed Style вообще фиолетово. Вероятно он просто парсит контент регулярками (Abs62 поправит, если что не так).
    Решить проблему можно просто поставив перед <span style="padding-left:2mm;font-style:italic;"> пробел (в исходнике, разумеется) и перекомпилировать словарь. Конечно, речь идёт о всех подобных местах. Это можно сделать и регулярками.
     
     
    Добавлено:
    Abs62
     
    Это можно узнать только из javascript - getComputedStyle, поэтому, чтоб безошибочно трактовать такие ситуации, нужно полноценно парсить DOM, причём из под браузера и только с помощью javascript. Как потом это всё передать в FTS уж не знаю. Других вариантов отличить нет.

    Всего записей: 1327 | Зарегистр. 03-03-2008 | Отправлено: 22:47 06-06-2017
    Abs62



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Romul81

    Цитата:
    Вероятно он просто парсит контент регулярками (Abs62 поправит, если что не так).

    Теги - да. Конкретно, вот как они убираются:

    Цитата:
          tmp.replace( QRegExp( "<(?:\\s*(?:div|p(?![alr])|br|li(?![ns])|td|blockquote|/ol))[^>]{0,}>",
                                Qt::CaseInsensitive, QRegExp::RegExp2 ), " " );
          tmp.remove( QRegExp( "<[^>]*>", Qt::CaseSensitive, QRegExp::RegExp2 ) );


    ----------
    0 программистов ругал сердитый шеф
    Потом уволил одного, и стало их FF

    Всего записей: 6080 | Зарегистр. 22-10-2005 | Отправлено: 22:51 06-06-2017
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175

    Компьютерный форум Ru.Board » Компьютеры » Программы » GoldenDict (часть 2)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru