Командная строка, батники, сценарии (bat, cmd) - [80] :: Программы

У меня такая задача. Если не по адресу, просьба указать, в какой теме это лучше спросить.

Подскажите пожалуйста как сделать, чтобы из группы текстовых файлов, разложенных по папкам, выделять отдельные блоки текста, если в этом блоке текста скажем первая строка определённая. И помещать эти блоки текста, разделённые тремя пустыми строками в новый текстовый файл, один за другим. Т.е. должна получиться выборка блоков текста с определённой первой строкой.

Конкретно:

Имеем 1000 текстовых файлов. Общим размером около 5мб. Некоторые файлы по 250кб, но таких мало, меньшинство, всего штук 5-10. Самый распространённый размер файла думаю около 20кб. Каждый файл построен следующим образом. В каждом файле идут блоки текста по одной или по несколько строк. Если строк в блоке несколько, то они могут быть либо не разделены пустыми строками, либо разделены одной пустой строкой, либо разделены двумя пустыми строками. Если разделены тремя и больше пустыми строками, то это уже граница блока, т.е. блок закончился и дальше идёт следующий блок.

Что за текст? Это заметки. Т.е. это не спецсимволы и прочее, не ini-файл, а просто обычный текст, предложения на русском языке. Кодировка во многих файлах разная, в некоторых ANSI, в некоторых URF-8, в некоторых ещё хрен знает что, причём параметры, которые показывает Notepad++ в статусной строке рядом с кодировкой, а именно порядок байт или строк или как там, не помню, короче CLRF или что-то такое, вот это параметр тоже у многих файлов разный. Если нужно привести все файлы к одной кодировке и одному этому CRLF или как там, а может и к одному ещё чему-то, то придётся сделать, сделаю, хотя от совета как это сделать тоже не откажусь.

Что за первая строка в блоке, по которой нужно искать блоки и выписывать в отдельный текстовый файл. Это повторяющаяся строка, т.е. во многих блоках она одна и та же. А точнее даже не вся первая строка там повторяется, а только её часть, выглядящая так:
#СловоИлиФраза
Вся же первая строка может выглядеть так:
#СловоИлиФраза
А может и так:
#СловоИлиФраза #ДругоеСловоИлиДругаяФраза #СловоИлиДругаяФраза
Вот по этой части первой строки и нужно искать блоки и выписывать их в отдельный файл. В итоге если ищем #СловоИлиФраза, то будет новый файл, в котором будут все блоки текста со всех файлов, в первой строке которых присутствует #СловоИлиФраза.

Модерирует : gyra, Maz
Maz (19-09-2020 13:36): Командная строка, батники, сценарии (bat, cmd) Часть 6	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199