ankar84
Junior Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Доброго времени суток, уважаемы коллеги! Появилась следующая проблема. Ежедневно примерно в 20 часов 20 минут останавливаются все агенты и программы сервера Lotus Domino 8.5 Притом ни в каких логах особых ошибок в это время не видно, кроме log.nsf, где можно наблюдать (выдержки из лога за последние два дня) 20.06.2012 20:17:17 Starting replication with server Name2/of/Server 20.06.2012 20:17:17 Finished replication with server Name2/of/Server 20.06.2012 20:17:53 Error connecting to server Name/of/Server: Remote system no longer responding 20.06.2012 20:18:27 Starting replication with server Name3/of/Server 20.06.2012 20:18:27 Finished replication with server Name3/of/Server 19.06.2012 20:07:39 Compacting log.nsf (Orion's Log) ~~~~ 19.06.2012 20:21:18 Starting replication with server Name2/of/Server 19.06.2012 20:21:18 Finished replication with server Name2/of/Server 19.06.2012 20:21:18 -0.730: passed(not Spam) 19.06.2012 20:21:18 -1.742: passed(not Spam) 19.06.2012 20:21:18 Error connecting to server Name/of/Server: Remote system no longer responding 19.06.2012 20:21:18 Starting replication with server Name3/of/Server 19.06.2012 20:21:18 Unable to replicate Name3/of/Server OtherNABs\names_nov.nsf: Replication cannot proceed because cannot maintain uniform access control list on replicas 19.06.2012 20:21:18 Finished replication with server Name3/of/Server Из лога видно, что до получения ошибки подключения сервер спокойно реплицируется с другими серверами и вообще выполняем свои обычные процессы. Но вдруг на секунду оказывается зависшим. Такое наблюдается ежедневно, за исключением пятницы (кажется), субботы и воскресенье. Кажется мне потому, что наблюдать за сервером стал лишь с прошлой недели (когда появилось обращение от пользователей о недоступности почты в это время на протяжении уже долгого периода) и не уверен была ли ошибка в пятницу, а административного клиента, в котором я мониторю сервер мне пришлось перезагрузить, поэтому наглядную картинку я упустил. Еще из важного хочу отметить, что ежедневно по будням ровно в 20 часов запускается программа compact. У меня есть подозрение, что возможно именно этот процесс, а точнее сжатие какой-то большой базы (например log.nsf, которая у нас уже весит 3 гигабайта) может вызывать это подвисание. Поэтому из лога за 19 июня я скопировал момент запуска compact на базе log.nsf Эти программы я никак редактировать не могу (видимо у меня нет прав, так как они заданы вышестоящим администратором), но если будет решено, что именно из-за процесса compact вызывается зависание, то будем обращаться, чтобы сдвинули время начала компакта. А вопрос мой в следующем: как по-Вашему, что может являться причиной такого зависания. Как и что мониторить (внутри Lotus\в OS)? Может ли процесс compact вызывать такое поведении сервера? По поводу как и что мониторить, хотелось бы подробно и на русском почитать. | Всего записей: 74 | Зарегистр. 29-11-2006 | Отправлено: 07:08 21-06-2012 | Исправлено: ankar84, 07:10 21-06-2012 |
|