egor23
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору CTACKo Цитата: что-то я пыталсо за мыслью следить и нить эту потерял. ну, по логам судя, во всех случаях применялся метод лзма | применяется lzma, только в FreeArc для lzma есть параметр - ht4 (Match finder - средство поиска соответствия для LZMA), в результате lzma может работать с большими словарями. Цитата: это параметры алгоритма lzma можно прочитать в документации раздел Параметры алгоритмов сжатия (про ht4 там не написано, т.к. документация старая), а также в Help-е к 7-zip ( http://gora.7zsfx.info/7-ziphelpru/7-Zip_Help_ru_4.65.7z ). Цитата: Так при каких же ключах можно получить обратно такое же сжатие? | при таких же настройках и на тех же наборах данных. для data1.arc: -mlzma:559mb:a2:128:mc2 Цитата: мы просто гадали на кофейней гуще, что и как. обычно rep используется, для быстрого поиска повторов, перед основным алгоритмом, почему здесь его не использовали, я незаню. Возьмём для простого примера данные из data3.arc видео (вроде без звука), сами файлы могут минимально упаковываться, часть файлов байт в байт (по размеру данных будет ~50%), другая не байт в байт, но если сжать два файла, которые по содержимому полностью отличаются но по размеру одинаковы, сжатие будет ~50%. 1. можно использовать настройки которые были Arc.exe a a movies\ -mlzma:650mb:a2:128:mc1 -di -di+$% но будьте внимательны FreeArc может уменьшить словарь, если будет "недостаточно памяти". 2. можно настройки минимизировать: зная что за данные, и что файлы будут засортированы по размеру, то выставим размер словаря 75МБ, т.к. размер самого большого файла 74.5МБ (чтобы lzma нашёл два одинаковых файла идущих подряд достаточно, чтобы размер словаря был = размеру файла). Arc.exe a a movies\ -mlzma:75mb:a2:128:mc1 -di -di+$% lzma:75mb:a2:128:mc1: 432.038.869 bytes in 423.734 seconds Compression time: cpu 2.53 secs, real 563.72 secs. Speed 1.498 kB/s получим архив 412МБ (432 040 641) 3. Добавим в цепочку алгоритмов rep, зная что за данные, и что файлы будут засортированы по размеру, то выставим размер словаря для rep 100МБ, т.к. размер самого большого файла 74.5МБ (чтобы rep нашёл два одинаковых файла идущих подряд достаточно, чтобы размер словаря был =1.25*размеру файла). для lzma возьмём словарь 20МБ (значение с потолка, т.к. данные имеют небольшое сжатие в начале файла) Arc.exe a a movies\ -mrep:100m+lzma:20mb:a2:128:mc1 -di -di+$% rep:100mb: 466.630.647 bytes in 13.438 seconds lzma:20mb:a2:128:mc1: 431.695.498 bytes in 321.984 seconds Compression time: real 404.00 secs. Speed 2.090 kB/s получим архив 411.7МБ (431 697 277) + упаковка прошла быстрее, чем в п.2. Добавлено: Bulat_Ziganshin Цитата: кстати a2 это как воспринимать? Добавлено: CTACKo Цитата: Основная причина разницы в доступной памяти лежит в видеокартах, вернее их памяти: 2.8Гб видяха с 512Мб, на 3Гб - 256Мб. | а какие видеокарты интегрированные или нет? | Всего записей: 3832 | Зарегистр. 03-11-2003 | Отправлено: 23:13 03-02-2009 | Исправлено: egor23, 23:30 03-02-2009 |
|