WinRAR (часть 3) - [63] :: Программы :: Компьютерный форум Ru.Board

Bulat_Ziganshin

Цитата:

А RAR неплохо защищает метаинформацию, но в нём не реализован такой изощрённый поиск сохранившихся данных. Хотя я не знаю, может без переставновок он справится?

Раз об этом зашла речь, я решил этот момент доделать. Добавил уникальный ID к ECC секторам, а в старых версиях RR за уникальный ID сойдет размер защищаемой области. Сделал поиск секторов данных и ECC по всему файлу.

Bloom filter для поиска CRC64 оказался полезен и экономен к памяти, спасибо за совет. Я пока использовал 16 бит фильтра на одну CRC64, а в качестве хэш-функций саму CRC64 и CRC64>>30. Пробовал больше функций или более сложные - выигрыша по сравнению с этим вариантом не получил. Еще для ускорения поиска можно не искать данные с текущим ID в уже найденных блоках с этим же ID при условии, что блок не начинается с нуля. ID надо учитывать, так как в ситуации "архив в архиве", если оба архива с -rr и внешний с -m0, границы блоков данных могут пересекаться. Еще при поиске данных можно пропускать найденные ECC блоки с текущим ID.

Сейчас тестировал черновую версию. Взял 10 архивов от 2 мб до 1 гб с 20% RR, порезал на блоки по 1 мб, перемешал в случайном порядке, записал в файл 7.7 гб размером, запустил его восстановление. RAR возился с ним 15 минут, но вытащил из него все исходные архивы в целости, починив места склеек. Изнутри это выглядит как один проход для сбора ECC, а потом 10 проходов поиска данных и починки каждый с новым ID. Добавил к этому файлу 100 erasures, 10 insertions и 10 deletions, RAR починил его за те же 15 минут.

Если в архиве все сектора с одним ID, восстановление идет быстрее, так как в блоках данных и ECC можно не искать CRC64. Я упаковал те же исходные файлы в 1 RAR архив 7.7 гб с 20% RR, и аналогично перемешал его содержимое 1 мб блоками. RAR починил его за 200 секунд.

Правда теперь расход памяти при восстановлении зависит от размера архива. По первым оценкам примерно как 0.001 от размера. С архивами на десятки TB отъест немало. Но тут или продвинутое восстановление, или постоянный расход памяти.

Если не обнаружатся какие-нибудь проблемы, включу это в 5.60. Правда насколько восстановление перемешанных данных употребимо на практике - вопрос. Твой комментарий по упавшей файловой системе я видел. В любом случае пусть эта возможность будет хотя бы ради эстетики

Кстати, получился интересный побочный эффект. Если чиним архив c -m0 и -rr со вложенным архивом с -rr, теперь Repair вытаскивает оба архива по отдельности.

Модерирует : gyra, Maz
Maz (27-08-2020 19:31): WinRAR (часть 4)	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199