加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

服务器12种基本故障及排查方法

发布时间:2019-06-04 01:39:32 所属栏目:外闻 来源:Linux学习俱乐部
导读:第一章 加电类故障 一、定义举例 从上电(或复位)到自检完成这一段过程中电脑所发生的故障。 二、可能的故障现象 1、 主机不能加电(如:电源风扇不转或转一下即停等)、有时不能加电、开机掉闸、机箱金属部分带电等; 2、 开机无显,开机报警; 3、 自检报错或

解决方案:工程师上门后,经过检测,确实存在用户反应的问题。然后尝试将安装文件拷贝到硬盘上安装和换一张安装盘安装,故障依旧。接着检查BIOS发现,系统日期是2075年。将日期改回后,故障排除。问题虽小,影响却大。在此,提醒各位同仁,做事要细心,不要忽略每个细节。

案例二:

问题描述:逐日2000机器,一次突然死机,不能启动,重装系统能成功,但在设备管理里有很多问号,如打印口,COM口等都没有驱动。

解决方案:在站内又重装系统,驱动主板不能解决问题,看来只有更换主机才行了。打开机箱,发现有很多灰尘,取出主板,进行大扫除,抱着试一试的心里,重装一切OK。

案例三:

问题描述:一用户奔月4000机器/PIII 1G,他是单位技术员,说此机不能重装系统,每次重装都死机,要求上门维修。

解决方案:到达用户处,发现重装到检测硬件时无反应,打开机器进行检查时,发现CPU风扇不是联想。客户说这是刚从市场上拿来的,新的,应没有问题。依次替代硬盘与内存没有用,经用户同意带回站内烤机,再换下主板与CPU还是不行,后经多次重试发现每次死时间越来越短,怀疑还是CPU风扇有问题。换其它联想机器上的风扇竟解决问题。引起故障原因是客户的CPU风扇转速不够,引起温度过高死机。

第六章 操作与应用类故障

一、定义举例

这类故障主要是指启动完毕后到关机前所发生的应用方面及系统方面的故障。

二、可能的故障现象

1、 休眠后无法正常唤醒;

2、 系统运行中出现蓝屏、死机、非法操作等故障现象;

3、 系统运行速度慢;

4、 运行某应用程序,导致硬件功能失效;

5、 游戏无法正常运行;

6、 应用程序不能正常使用。

三、可能涉及的部件

主板、CPU、内存、电源、磁盘、键盘、接插的板卡等

四、判断要点/顺序

1、 维修前的准备

1) 干净的可用硬盘;

2) 杀毒软件;

3) 尽可能新的驱动程序、若干版本的BIOS;

4) 磁盘连接的数据线等。

2、 环境检查

1) 市电及连接检查:

A. 检查市电是否正常,连接是否牵伤心;是否有接地;

B. 设备间的连接线是否接错或漏接。

2) 周边及外观检查:

A. 检查与主机连接的其他外设工作是否正常;

B. 驱动器工作时是否有异响,CPU风扇的转速是否过慢或不稳定;

C. 观察机箱内灰尘是否太多,而导致各插接件间接触不良。先除尘后可用橡皮等擦拭金手指,去除氧化层或灰尘。然后重新插上;

D. 观察系统是否有异味,元器件的温升是否过高或过快。

3) 显示与设置检查:

A. 详细记录报错信息,判断可能造成故障的部位;

B. 注意CMOS中对于硬盘、系统时间、CPU温度的设置,注意在自检时显示的硬件信息和机器配置是否相符;

C. 仔细阅读软件的使用指南,注意软件运行的环境要求。

4) 充分与用户沟通:

A. 了解用户的使用情况;

B. 出故障前的现象;

C. 做过什么操作才出现目前的故障。

根据以上了解的情况,来初步判断可能的故障原因。

3、 故障判断要点

1) 检查是否由于用户误操作引起

A. 机器出现死机、蓝屏或无故重启时,首先要考虑到用户的操作是否符合操作规范和要求,要仔细询问、观察用户的操作方法是否符合常理,并由工程师用正确的方法操作、应用用户的机器,查看是否出现用户所报修的故障。若不出现,则可认为是用户操作不当引起的,由工程师向用户解释并演示正确的操作方法。

B. 若经过上述操作故障依然存在,可用系统文件检查器检查用户的机器系统是否有丢失的DLL文件,并尝试恢复。

C. 注意观察用户的机器在死机、蓝屏或无故重启时有没有规律,并找出可能引起机器故障的原因(如机器在运行某一程序时或机器开机在一定时间内死机)。

D. 通过与另一台软硬件相同且无故障的机器进行比较,查看故障机的文件大小是否相同或相差不大,主程序的版本是否一致。

2) 检查是否由于病毒或防病毒程序引起故障

A. 检查用户的机器是否被病毒感染,使用杀毒软件杀毒;

B. 检查用户是否安装了两个或两个以上的防毒软件,建议用户使用其中一个,并卸载其他的防毒软件;

C. 检查是否有木马程序,用最新版的杀毒程序可以查出木马程序。可以通过安装补丁来弥补程序中的安全漏洞,或者安装防火墙。

3) 检查是否由于操作系统问题引起故障

A. 检查硬盘是否有足够的剩余空间,并检查临时文件是否太多。整理硬盘空间,删除不需要的文件;

B. 对于系统文件损坏或丢失,可以使用系统文件检查器进行检查和修复;

C. 检查操作系统是否安装了合适的系统补丁(对于Winnt可在启动时观察service pack的版本,推荐使用SP6;Win2k和Winxp可以在系统属性中查看,Win2k推荐使用SP3,Winxp推荐使用SP1。);

D. 检查DirectX驱动是否正常,升级DirectX的版本;

E. 检查是否正确安装了设备的驱动程序,并且驱动的版本是否合适。检查驱动安装的顺序是否正确(例如:首先安装主板驱动)。

4) 检查是否由软件冲突、兼容引起故障

A. 检查用户应用软件的运行环境是否与现有的操作系统(NT/98/2K/XP)相兼容,可通过查看软件说明书或到应用软件网页上查找相关资料,并查看网页上有没有对于此软件的升级程序或补丁可安装。

B. 可用任务管理器观察故障机器的后台是否有不正常的程序在运行,并尝试关闭程序只保留最基本的后台程序。

C. 注意查看故障机内是否有共用的DLL文件,可通过改变安装顺序或安装目录来解决问题。

5) 检查硬件设置是否不正确

A. 首先,检查CMOS设置是否正确,可恢复默认值;

B. 在设备管理器中检查硬件是否正常,中断是否有冲突,如有冲突,调整系统资源(对于某些硬件,要阅读说明书,按照说明正确设置硬件);

C. 在设备管理器中将硬件驱动删除,重新安装驱动程序(最好安装版本正确的驱动程序),查看硬件驱动是否恢复正常;

D. 运行硬件检测程序,如AMI等检测硬件是否有故障;

E. 在软件最小系统情况下, 重新更新硬件驱动,观察故障是否消失。

6) 检查是否为兼容问题

A. 遇到兼容性问题时,应检查硬件的规格和标准(如同时使用多条内存时检查内存是否为同一厂家、同一规格、同一容量、内存颗粒同一批次),是否允许在一起使用。

B. 阅读说明书或到网页上查找相关资料,检查用户的硬件正常使用所需的软件要求,现在的软件环境是否符合要求,软硬件之间是否相互支持。

C. 在设备管理器中检查用户的系统资源是否有冲突,如有冲突,手动调整系统源。

D. 在设备管理器中检查用户机器的硬件的驱动是否安装正确,更新合适版本的设备驱动(如某些显卡用WIN2000或WINXP自带的公版驱动,会造成某些大型3D游戏无法运行);

E. 检查维修BOM,去除非联想的硬件,检查系统是否可正常工作,如可正常工作,建议用户更换自行添加的硬件或查找硬件相关资料进行解决。

7) 检查是否由于网络故障引起

A. 碰到机器连接在网络上,出现死机、运行慢、蓝屏等故障时,应首先关闭网络,与网络环境隔离,观察故障是否消失,如故障消失,则为网络问题引起故障。

B. 确为网络问题引起的故障,其判断与解决步骤参考网络部分。

8) 检查是否由于硬件性能不佳或损坏引起

A. 使用相应的硬件检测程序,检查硬件是否有故障,如果有,利用替换法排除相应的硬件;

B. 用替换法检查检测程序无法判断的硬件故障。

第七章 局域网类故障

一、定义举例

这类故障主要涉及局域网宽带网等网络环境中的故障。

二、可能的故障现象

1、 网卡不工作,指示灯状态不正确;

2、 网络连不通或只有几台机器不能上网、能Ping通但不能连网、网络传输速度慢;

3、 数据传输错误、网络应用出错或死机等;

4、 网络工作正常,但某一应用下不能使用网络;

5、 只能看见自己或个别计算机;

6、 无盘站不能上网或启动报错;

7、 网络设备安装异常。

8、 网络时通时不通。

三、可能涉及的部件

网卡、交换机(包括HUB、路由器等)、网线、主板、硬盘、电源等相关部件。

四、判断要点/顺序

1. 维修前的准备

1) 可用的网线(直连线和普通网线,线序符合国际标准);

2) 如有条件,带上网线连接检查器。

2. 环境检查

1) 电源连接检查:

A. 市电的接线定义是否正确;

B. 是否有地线;

C. 网络上的各设备(如:HUB、交换机等)是否均已上电工作。

2) 网线连接检查:

A. 网线连接线序是否与网络连接的要求匹配(如直连和普通网线);

B. 网线的连通性是否正常,要查看网线有无破损、过度扭曲;

C. 网线长度是否过长(如5类双绞线长度超过技术规格要求的100米);

D. 网线接头——水晶头是否完好、是否氧化;

E. 网卡接口是否完好。重新插拨网线检查网线与网卡连接是否松动;

F. 根据电缆要求是否有终结器,终结器是否正常。

3) 网络设备外观及周边检查:

A. 加电启动后,网卡指示灯是否亮等;

B. HUB等设备的网线接口,在与终端或服务器连接后,如果终端或服务器启动及配置正常,其指示灯会亮(注意指示灯颜色是否正常,参考设备说明书),如果指示灯不亮,说明设备有故障;

C. 网卡部件是否接插到位无翘起,网卡上金手指是否氧化;

D. 网线或交换机等设备周围是否有干扰。

4) 主机外观检查:

A. 检查机箱内是否有异物造成短路;

B. 机箱内的灰尘是否过多,如果是,应清理灰尘;

C. 主板与网卡上元器件是否有变形、变色现象;

D. 加电后,注意部件、元器件及其它设备是否有异味、温度异常等现象发生。

5) 其它方面:

A. 在UNIX下,要分清是终端死机还是服务器死机

3. 故障判断要点

1) 寻求用户网管的配合。

首先应尽可能与网管联系,以得到网管合作。

2) 网络环境检查:

A. 对于掉线、丢包等故障,要注意检查网卡与交换机间的兼容性;

B. 网络连接正常,但不能进行域登录,要从以下几点检查:

a) 指明的域名是否存在或已工作;

b) 是否已按服务器、操作系统的要求(如在服务器端启用了WINS解析服务、DNS服务等,WINXP HOME版不能登录到域中。),设置终端允许登录到域中,计算机名是否已注册到域中;

c) 检查使用的协议是否正确;

C. 检查是否安装了防火墙,是否被授权访问;

D. 在必要时,使用直连线只连接两台机器在对等网环境下检查是否可连网(这样做可排除网络上诸环境因素的影响)。

3) 网络适配器驱动与属性检查:

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读