Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » В помощь системному администратору » Сервер перезагружается
без видимых на то причин

Модерирует : lynx, Crash_Master, dg, emx, ShriEkeR

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

AgelNick



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Конфигурация сервера (железо):
проц: Celeron D 2,8 Ghz
память: 1 Gb (2 планки)
винт: WDC WD 1600JS-00MHB 2 шт. Стояли в RAID1. После сбоя.
видео: интегрированное
сеть: 2 сетевых интерфейса (LAN + WAN)
ИБП: Back-UPS ES 525
 
Конфигурация сервера (ПО):
Win2003 EE SP2
Сервер выполняет несколько функций:
Контролер домена
Файловый сервер
Прокси сервер (ISA 2004 SP2)
Почтовый сервер MDaemon
FTP-сервер.
 
Сервер установлен и сконфигурирован в середине 2006 года. Работает в течении этого периода круглосуточно.
 
Около полугода назад был установлен еще 1 HDD на 400 Gb. Проработав около недели начали появляться ошибки, после которых машина не грузилась:
Источник события: m5287
Категория события: Отсутствует
Код события: 11
Дата: 12.09.2008
Время: 20:18:44
Пользователь: Н/Д
Компьютер: STORAGE
Описание: Драйвер обнаружил ошибку контроллера \Device\Scsi\m52871.
 
Удалив этот HDD все стало нормально. Перед этим пришлось рассинхронизировать RAID1. Потом я опять построил RAID1 и все было в порядке.
 
Перед новым годом сервер стал без видимых на то причин перегружаться.
 
Т.е. все работает нормально, потом пик в системнике и пошла перезагрузка. Может проработать какое-то время и опять в перезагрузку.
 
Замечено, что когда нет нагрузок в нерабочее время (суббота) перезагрузок нет.
 
Я точно знаю, что-то не так с RAID-контролером на матери. Но с этими глюками сервер проработал несколько месяцев. В журналах бы фиксировались какие-то ошибки, если бы контролер HDD "разлюбил" этот винт. Нет ничего. Как-будто RESET'ом перегружен. Но у меня есть подозрение на HDD. Возможно с ним, что-то не так. Или с БП. Сегодня собираюсь заменить БП.  
 
Произвести замену HDD не выйдет, потому что такой точно модели я не найду.
 
Полная переустановка пока не рассматривается.
 
Какие есть идеи? Что и как диагностировать?

Всего записей: 36 | Зарегистр. 24-11-2005 | Отправлено: 15:37 19-01-2009 | Исправлено: AgelNick, 15:42 19-01-2009
RootMain2

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А зачем искать точно такую же модель HDD? Достаточно на новом винте создать аналогичный по размеру системный раздел, а потом акронисом перебросить. Перегрева проца нет?

Всего записей: 32 | Зарегистр. 16-09-2008 | Отправлено: 15:57 19-01-2009
vu1tur



Moderator-Saaber
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
AgelNick
Это действительно перезагрузка или BSOD с автоматическим ребутом? Если бсод — смотреть минидамп. Иначе пробовать менять:
1. БП.
2. Память.
3. Визуально осмотреть конденсаторы в цепи питания на материнке (какая, кстати?)

----------
I am free of all prejudice. I hate everyone equally.

Всего записей: 3690 | Зарегистр. 01-02-2003 | Отправлено: 16:03 19-01-2009 | Исправлено: vu1tur, 16:04 19-01-2009
oler2



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
возможные причины:
1. вирусы - проверяй kaspersky\symantec, лучше вторым иные не отловят
2. скорее всего проблема в жёстком диске, как вариант отформатируй его, хотя скорее всего это всё на жилезном уровне
3. проблема в контролёре\шлейфе, возможно где то что-то пробивает, попробуй переставить его в другой комп

Всего записей: 1205 | Зарегистр. 14-03-2006 | Отправлено: 16:18 19-01-2009
ipmanyak



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AgelNick Проанализируй для начала  минидамп винды в помощь прога  Debugging Tools for Windows 32-bit Version http://www.microsoft.com/whdc/devtools/debugging/installx86.mspx


----------
В сортире лучше быть юзером, чем админом...

Всего записей: 12348 | Зарегистр. 10-12-2003 | Отправлено: 18:12 19-01-2009
FIZIK



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Такая же фигня сейчас у меня, причем на Intel мамке. 2 винта WD тоже по 160G только винты Raid Edition. Отнес в сервис. Спец с сервиса звонил, говорит на полусофтовых рейдах стандартная проблема и лечится только установкой аппаратного рейда. Даж не знаю что делать. Причем винты поодиночке работают вообще великолепно. SMART тоже говорит что все норм. А рейд рассыпается через час, максимум через сутки.

Всего записей: 193 | Зарегистр. 09-08-2004 | Отправлено: 19:28 19-01-2009
AgelNick



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
на новом винте создать аналогичный по размеру системный раздел

система может не принять этот HDD.
 

Цитата:
Если бсод — смотреть минидамп

1. где смотреть?
спасибо, ipmanyak за подсказку. качаю Debugging Tools.
 
2. что смотреть?
 

Цитата:
цепи питания на материнке (какая, кстати?)

мать: ASUS P5RD1-V
 
 

Цитата:
возможные причины:  
1. вирусы - проверяй kaspersky\symantec, лучше вторым иные не отловят  
2. скорее всего проблема в жёстком диске, как вариант отформатируй его, хотя скорее всего это всё на жилезном уровне  
3. проблема в контролёре\шлейфе, возможно где то что-то пробивает, попробуй переставить его в другой комп

 
1. у меня как раз стоит symantec. Завтра прогоню.
2. я смогу сделать это только на выходные. Сервер используется в течении рабочего дня все время.
3. возможен и такой вариант. заменю SATA-шлейфы.
 
 

Цитата:
Такая же фигня сейчас у меня, причем на Intel мамке. 2 винта WD тоже по 160G только винты Raid Edition. Отнес в сервис. Спец с сервиса звонил, говорит на полусофтовых рейдах стандартная проблема и лечится только установкой аппаратного рейда. Даж не знаю что делать. Причем винты поодиночке работают вообще великолепно. SMART тоже говорит что все норм. А рейд рассыпается через час, максимум через сутки.

 
Дело в том, что у меня raid (зеркало) работал стабильно все время. Но с встроенным raid действительно какой-то глюк. Система отказывается работать с дополнительным HDD в обычном режиме.

Всего записей: 36 | Зарегистр. 24-11-2005 | Отправлено: 20:00 19-01-2009 | Исправлено: AgelNick, 20:04 19-01-2009
tankistua

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1) лов-эндовая логика не лучший выбор для построения сервера.
2) нет смысла ставить систему на софтовый рейд - лучше просто делать бекапы нужных данных. На основном винте у меня хранится актуальная копия, на бекапном - архив по дням. Зато я не завишу от глюков винды

Всего записей: 9572 | Зарегистр. 15-01-2002 | Отправлено: 20:08 19-01-2009
AgelNick



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1) лов-эндовая логика не лучший выбор для построения сервера.

"лов-эндовая логика" это как?
 

Цитата:
2) нет смысла ставить систему на софтовый рейд - лучше просто делать бекапы нужных данных. На основном винте у меня хранится актуальная копия, на бекапном - архив по дням. Зато я не завишу от глюков винды

1. у меня стоит (стоял) НЕ софтовый raid. Обычный контролер для обычной мамки. Понятно, что он не серверный и не внешний.
2. ежедневный бекап по сети:
а) системного диска сервера на другую машину
б) важных данных с сервера на другую машину
в) удаленные данные на сервере бекапятся в режиме реального времени. часто пользователи ошибочно удаляют не тот файл, а еще хуже папку. Для нас это критично.
 
Я беспокоюсь не за потерю данных, а за стабильную работу сервера, которая сейчас у меня нарушена.
 
итак:
как я и говорил, у меня стоит 2 одинаковых винта (WDC WD 1600JS-00MHB) по 160 Гб.
 
1-й винт сейчас установлен в сервере.
2-й я снял и проверил на ошибки с помощью HD Tune PRO 3.50. Триальная версия на 15 дней. Ошибок нет. Температура винта 42 градуса.

Код:
 
HD Tune Pro: WDC WD1600JS-00MHB1 Health
ID                               Current  Worst    ThresholdData     Status    
(01) Raw Read Error Rate         200      200      51       0        Ok        
(03) Spin Up Time                212      208      21       2358     Ok        
(04) Start/Stop Count            100      100      0        84       Ok        
(05) Reallocated Sector Count    200      200      140      0        Ok        
(07) Seek Error Rate             200      200      51       0        Ok        
(09) Power On Hours Count        65       65       0        25580    Ok        
(0A) Spin Retry Count            100      253      51       0        Ok        
(0B) Calibration Retry Count     100      253      51       0        Ok        
(0C) Power Cycle Count           100      100      0        84       Ok        
(BE) Airflow Temperature         60       41       45       40       Ok        
(C2) Temperature                 107      88       0        40       Ok        
(C4) Reallocated Event Count     200      200      0        0        Ok        
(C5) Current Pending Sector      200      200      0        0        Ok        
(C6) Offline Uncorrectable       200      200      0        0        Ok        
(C7) Ultra DMA CRC Error Count   200      200      0        0        Ok        
(C8) Write Error Rate            200      200      51       0        Ok        
 
Power On Time         : 25580
Health Status         : Ok
 

 
Вирусов нет. Точнее есть 2 трояна, которые лежали в кряках прог.
 
На сервере я заменил БП. Поставил более мощный.
 
Поменял SATA-кабели. Я доверяю больше ASUS (родным), но поставил другие. временно.
 
Сегодня поставил на проверку сервер на вирусы. Завтра выясню, что есть.
 
После загрузки сервера в логах увидел ошибку:

Код:
Тип события:    Ошибка
Источник события:    m5287
Категория события:    Отсутствует
Код события:    11
Дата:        19.01.2009
Время:        20:20:26
Пользователь:        Н/Д
Компьютер:    STORAGE
Описание:
Драйвер обнаружил ошибку контроллера \Device\Scsi\m52871.

 
пока все. у пацента пока симптомы не проявлялись. ждем до завтра.

Всего записей: 36 | Зарегистр. 24-11-2005 | Отправлено: 20:16 19-01-2009 | Исправлено: AgelNick, 15:49 20-01-2009
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » В помощь системному администратору » Сервер перезагружается


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

LiteCoin: LgY72v35StJhV2xbt8CpxbQ9gFY6jwZ67r

Рейтинг.ru