VadKomarov
Junior Member | Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору Здравствуйте. Уже есть много алгоритмов по работе с текстами. Но всё же уважаемые знатоки мне требуется ваши советы и рекомендации. Перейду сразу к задаче. Есть какой то текст и не известно какого объема, может быть и абзац а может и не одна книга. необходимо в максимально короткие сроки обрабатывать этот текст согласно неких шаблонов которые будут создавать пользователи. и так ТЕКСТ и N-шаблонов. что может представлять из себя шаблон: шаблон 1 Код: жестко заданный текст {переменная} жестко заданный текст -2 {переменная 2} жестко заданный текст-3 {переменная 3} жестко заданный текст -4 {переменная 4} | шаблон 2 Код: {определенной длины переменная} жестко заданный текс {переменная} жестко заданный текс {переменная} жестко заданный текс-2 {переменная 2} | шаблон 3 Код: жестко заданный текст {переменная} жестко заданный текст -2 {переменная 2} жестко заданный текст-3 {переменная 3} жестко заданный текст -4 {переменная 4} жестко заданный текст -5 {переменная 5} | шаблон 4 Код: жестко заданный текст {переменная} жестко заданный текст -2 {переменная 2} | теперь что точно нам известно... если шаблон стостоит из нескольких абзацев то и в тексте сравнивать надо с несколькими абзацами. подводные камни.... шаблон может быть частью одного из шаблонов и соответственно надо выбрать наиболее подходящий к примеру шаблон 4 это часть шаблона 1 и шаблона 2 если делить по абзацам, но если в тексте нет явного совпадения с шаблонами 1,2 то использовать шаблон 4 именно для этого участка текста. какие могут быт проблемы: обрабатываемый текст создается людьми и может содержать к примеру двойной пробел или какой нибудь непечатываемый и не видимый символ и собственно при "наложении" жестко заданного текста из шаблона будет не соответствие. Пример - шаблон [объединенная корпорация {НАЗВАНИЕ} занимается {ДЕЙСТВИЕ}{ПРОДУКЦИЯ} с {ДАТА}]
- часть обрабатываемого текста с двойным пробелом [...объединенная корпорация "ЛЕСНИК" занимается выращиванием сосны с 1950 года.....]
необходимо обработать текст и исходя из всех существующих и подходящих шаблонов а собранные результаты уже обрабатывать. к примеру Код: объединенных корпораций - 4 магазинов - 100 реализуют продукцию (виноград, горох, .....) по выбранным вами параметрам фирмы находящиеся на рынке более 5 лет | но это не обязательно что шаблоны будут про фирмы, могут быть библиотеки, книги, тематики, полки, авторы..... в общем подскажите и предложите какие алгоритмы смотреть, может часть кода подкините Добавлено: Да забыл пишу на Delphi если вдруг код кто какой подкинет |