常见告警故障处理及分析
- 格式:doc
- 大小:56.00 KB
- 文档页数:5
SDH常见告警及处理方法
一、SDH常见告警
1、AIS(Alarm Indication Signal):系统发生严重故障,但故障定位困难时发出的报警信号,其特征是所有光纤信道的信号都变为8kHz的正弦波。
2、RDI 告警:Remote Defect Indication,用来标识由网络其中一端的故障引起的报警信号,其特征是只有发送方端口发出的信号变为
8kHz 正弦波,接收端口不发生改变。
3、LOS(Loss of Signal): 信号丢失告警,当根据多模解调器的输出结果发现收发光纤的质量有问题时,就发出此类报警。
4、LOF (Loss Of Frame):帧丢失告警,当多模解调器未能正确解调出SDH/SONET信号帧,只能解调出时隙时,就发出此类报警。
5、LOFL(Loss Of Frame Lock):解调锁定丢失告警,当多模解调器未能正确解调SDH/SONET信号帧,会给发出此类报警。
6、TIM(Trace Identify Mismatch):诊断路径标识错误报警,当多模解调器识别进入端口的信号的诊断路径标识,与设置的诊断路径标识不一致时,就发出此报警。
7、STU(Signal Fail):发射信号失效报警,当多模解调器发射板信号失效时,就发出此报警。
二、SDH常见告警的处理原则
1、首先仔细考察AIS信号,是否处纤芯断纤等原因导致的。
2、考察RDI信号,区分是单向报警还是双向报警,以及是否真的是本段线路出现问题还是根据RDI反向传输到下一个站点的问题。
常见告警故障处理及案例分析常见告警故障处理及案例分析1.基站的告警按故障设备可分为三类:设备告警、内部告警、外部MOTOROLA 告警。
一、设备常见告警设备告警是硬件告警最常见也是最重要的告警,告警设备一般为基站的主要器件,它的告警类型就是它的设备类型。
Expired]TimerFailure-Watchdog[FrontDRI29:End Processor1.前端处理器故障可能会反复自启,可能会退服,应先DRIDRI硬件故障,出现此告警时。
TCU RESET处理,若告警未消失,更换DRIins应进行INS或reset or时隙信0-7-7)Failure]([Channel Coder Timeslot02.DRI40-47:道编码器失败。
处理,不行再更换RESET或M-CELL基站经常出现此类告警,应进行INS可能会消失。
GSR5时出现,升级到TCU900。
此告警在GSR4链路错误。
基带跳频TDMHopping TDM LinkError]3.DRI51:[Baseband可能有问题。
KSW此告警有几种可能性:TDM-Highway BUS或可能有问题。
,CCDSPDRIM的FEP此告警须在现场具体测试分析。
测试后判定故障点。
可能会消失GSR5GSR4时出现,升级到此告警在的呼BTS Multiplexing时分复用:该总线用于把来自TimeTDM——Division,反之亦然。
可分为两个独立的部分:交换机公共通MSC叫与信令数据传送到出局公共通路。
路&接口)E1/T1交换机公共通路:处理路由到交换机的数据,数据来自外部信源(通过内部产生。
或由GPROC)E1/T1接口BSC/RXCDR(通过出局公共通路:这是一个被交换的数据,现在被路由出。
GPROC 或通向内部收发单元故障SynthesizerFailure]81:[Transmitter DRI4.故障,故障原因有可能为:TCU此告警为收发单元频点丢失Calibration-接收故障信道盘的CEB-射频电缆连接失败-TCU告警消失并监测;若告警未消失,更换或reset TCU,处理方法:远程ins退出服务。
告警分析及处理一、动环1、网管1)帐号登陆提示连接失败或鉴权失败:可分为两个原因,一是网络中断,无连接到服务器,二是服务器程序未运行,需要联系网管人员进行程序启动。
提示用户被锁定:因用户多次密码输入错误,导致用户被锁定,需要联系系统管理员进行帐号解锁设臵。
2)网络连接网络连接故障:本地连接断开,检查电脑网口网线是否连接正常,检查交换机端网口网线连接是否正常,其次检查电脑网卡是否存在故障。
3)基站中断基站中断分三个方面:一是模拟站或者干节点站的站点全部中断,导致原因应该是模拟站的前臵台或者干节点的前臵台程序未运行或者连接中断;二是模拟站的多个站点同时中断,这种现象一般是中断站点传输在同一传输设备ETN上,如果该ETN与交换机之间传输出现问题,就会出现这种故障,检查ETN与交换机之间网管连接情况;三是个别站点出现监控中断,导致原因可分两方面:一是该基站传输出现故障,二是底端EISU设备出现故障或者基站为EISU提供48V电源出现故障。
2、基站1)动力设备A、开关电源监控中断:分为四方面,一是从施工一直未正常监控的,为电源监控模块故障,需要更换电源监控模块;二是检查是否因为更换电源模块后所致,是否更换了电源监控模块型号,或者更换监控模块后,电源监控模块后的RS232通信口的连接线是否连接正常。
三是开关电源监控模块故障,需要更换电源监控模块;四是电源其它告警(欠压、防雷故障之类的),检查现场电源监控模块内告警内容,如果也存在相应告警,则是电源实际告警,如果不一致请联系厂家进行数据处理。
B、空调空调控制:因基站都做有相应的空调节能系统,网管进行控制后不能产生效果。
空调电流及空调状态:如果空调电流出现值无效之类的告警,一般为基站空调电流监测设备出现接线错误,检查该基站是否更换空调,而导致电流监测设备被拆除,如果设备正常,请检查设备接线情况。
C、蓄电池监控原理:对两组蓄电池的总电压进行测量,测点一般设在开头电源柜内的电极排上,如果出现电压数值不付或者故障,检查现场电极排上测点之间电压是否正常,接线是否正常;电流监测在蓄电池电源线上有个直流电流互感器进行监测,如果出现电流数据为-45,一般为直流电流互感器接线故障,检查接线是否有松动。
华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。
告警产生原因:1、断纤;2、线路衰耗过大;3、本板接收方向故障;4、对端站发送部分故障,线路发送失效;5、对端站交叉时钟板故障或不在位。
告警处理方法:1、现场用光功率计检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤8。
2、检查光缆是否有故障,排除光缆故障后,查看告警是否排除。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
5、用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。
6、如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。
7、检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
8、更换本站上报告警的线路板,查看告警是否排除。
9、更换对端站的线路板,查看告警是否排除。
1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。
告警产生原因:1、接收信号衰减过大;2、对端站发送信号无帧结构;3、本板接收方向故障。
告警处理方法:1、在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。
2、检测告警单板的接收光功率是否正常。
如果接收光功率正常,请转至步骤9。
如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。
3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。
4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。
正确使用法兰盘和光衰减器后,查看告警是否排除。
常见故障告警处理一. 硬件设备告警1、CP FAULTDPWSP;看CP状态。
REPCI;测试出错部件(排第一个是最可能出错的部件)。
REMCI:MAG=XX,PCB=XX;换板(可以再REMCI第二个部件)。
RECCI;测试并复位。
若修时出FC301说明交换机自己在修,此时CP状态为SE-FM(分离),无法人工修,只要等片刻就会发现CP状态变为UPDATING,再等就应该WORKING了。
2、RP FAULTEXRPP:RP=XX;看RP状态REPRI;测试出错部件(排第一个是最可能出错的部件)REMRI:RP=XX,PCB=XX;(也可以换第二个部件)RECRI;测试并复位闭解RP BLRPI/E:RP=XX;3、EMRP FAULT(emrp:Extension Module Regional Processor )REPEI:EMG=XX,EMRP=XX;REMEI:EMG=XX,MAG=XX,PCB=XX;RECEI:EMG=XX,PCB=XX;4、EM FAULTEXEMP:RP=X,EM=XX;看EM状态若无RPT时:REPRI:RP=XX,EM=XX;REMRI:RP=XX,EM=XX,PCB=XX;RECCI:RP=XX,EM=XX;若有RPT时:EXEMP:RP=XX,EM=XX;BLEMI:RP=XX,EM=XX,RPT=XX;BLEME:RP=XX,EM=XX,RPT=XX;若与TSM相关时:GSBLI: TSM=XX;进行(2)或(3)闭解EMGSBLE: TSM=XX;5、SWITCHING NETWORK TERMINAL FAULTNTSTP:SNT=XX;看SNT状态(常见FC38可闭解修好)NTCOP:SNT=XX;查DEV号对MSC:EXDRP:DEV=XX;查控制设备的RP号和EM号对BSC:RADAP:DEV=XX;查控制设备的RP号和EM号EXRPP:RP=XX;NTBLI:SNT=XX;闭NTTEI:SNT=XX;测NTBLE:SNT=XX;解若解不开,可试以下方法:EXEGP:EMG=XXXXX;查CICEXCLP:EQM=CLC-9;查对应的DEV,记下相关数据BLCLI:EQM=XX;闭CICEXCLE:EQM=XX;拆数据NTBLI:SNT=XX;闭NTBLE:SNT=XX;解EXCLI:EQM=XX,SPEED=XX,DEV=XX;重新定义原来的数据BLCLE:EQM=XX;解CIC6、GROUP SWITCH FAULT(TSM FAULT)(或GROUP SWITCH RESTRICTIONS)GSSTP:CLM/SPM/TSM=ALL;找出错部位(或用GSREP;列出故障的设备)。
SDH常见告警和性能故障分析1.LOS信号丧失告警.LOS告警的根本含义是信号丧失或劣化,使BER劣于10-3。
对于光路,〔出现RLOS 告警〕表示没有光信号输入,对于光板可能的原因是:#对端设备问题〔线路发送失效、发送方向无系统时钟等〕#断纤#线路衰耗过大,导致收光功率超出灵敏度值.对支路2M信号〔出现T_ALOS告警〕,表示2M端口无输入。
对于2M支路板,可能的原因是:#对端输出端口有故障〔脱落或松动〕#本站输入端口有故障〔脱落或松动〕#本站2M支路板问题#电缆有故障告警产生的原因:断纤;线路损耗过大,导致收光功率超出灵敏度值;对端站发送方向无系统时钟;对端站激光器损坏,线路发送失效;对端站穿插板没有时钟输出;对端站时钟板工作不正常.告警处理步骤:测试告警单板的接收光功率,假设光功率正常那么检查板上接头有无松动,假设接头良好那么更换告警单板;假设光功率很小或接近0mW,检查对端至本站的光缆是否松动;假设光缆线路正常,检查对端站光发送板接头是否松动,假设接头良好那么更换对端站光发送板。
2.LOF帧丧失告警假设帧失步连续3ms以上,那么出现LOF告警。
可能的原因是:#线路问题,接收信号衰减过大#对方设备问题,光发送信号无帧或无时钟#本端设备问题,接收方向有故障告警产生的原因:光损耗过大;对端站发送信号无帧构造;本端接收方向有故障。
告警处理步骤:检查告警单板接收光功率,假设光功率正常那么检查告警单板是否存在问题;假设光功率超出正常范围,那么检查对端站至本站光纤及其接口是否损坏;假设光纤及告警单板都正常,那么检查对端站光发送板设法存在问题。
3.告警名称:帧失步〔R-OOF〕告警产生的原因:接收信号损耗偏大;传输过程误码过大;接收方向器件有故障;对端站发送有故障。
告警处理步骤:检查告警单板接收光功率,光功率正常那么检查告警单板是否存在问题;如光功率超出正常范围,那么检查对端站至本站光纤及其接口是否损坏;如光纤及告警单板都正常,那么检查对端站光发送板是否存在问题。
目录第4章告警处理ALM_CHCSALM_E1AISALM_GFP_dLFDALM_IMA_LIFALM_IMA_LINK_LCDALM_IMA_LODSALM_IMA_RFIALM_IMA_RE_RX_UNUSABLEALM_IMA_RE_TX_UNUSABLEALM_LCDALM_MSALM_OCDALM_SUBCARD_ABNALM_UHCSAPS_IS_STOPPEDAPS_FAILAPS_INDIAPS_PARA_ERRAPS_TYPE_ERRA_LOCA_LO_J1AU_AISAU_AIS_CAU_CMMAU_LOPAU_LOP_CB1B_OVERB1_OVERB2_OVERB3_EXC_VC3B3_EXC_VC4B3_OVERB1_SDB2_SDB3_SDB3_SD_VC3B3_SD_VC4BD_BUS_COREBD_STATUSBIP_OVERBIP_SDBUS_LOCC4_R_LAISDC4_T_LAISDCC_LOCCFG_OVFLOWCFG_PARA_APPLY COMMUN_FAILCOOL_CUR_OVERCFG_DATA_DIFFER CTSDBMS_ERRORDBMS_PROTECT_MODE DCDDDN_AISDDN_ALOSDDN_LFADDN_LMFADDN_LOOP_ALMDDN_RFADDN_RMFAD_LO_J1DOWN_E1_AISDSRDTRETH_LOSEXER_FAILEXT_LOSEXT_SYNC_LOSFAN_FAILFCS_ERRFI_FAILFPGA_ABNHARD_BADHARD_ NOSUPHCSHPAD_CROSSTRHP_CROSSTRHP_D_J1_LOSHP_LOM_CHP_LOMHP_J1_LOLHP_RDIHP_REIHP_R_LOPHP_SLMHP_TIMHP_UATEVENTHP_UNEQILL_MFIILL_MFI_VC12ILL_MFI_VC3ILL_MFI_VC4ILL_SQILL_SQ_VC12ILL_SQ_VC3ILL_SQ_VC4IN_PWR_ABNIN_PWR_FAILJ0_MMK1_K2_MK2_MLASER_MOD_ERR_EX LASER_SHUTLCAS_FOPTLCAS_FOPRLCAS_PLCTLCAS_TLCTLCAS_PLCRLCAS_TLCRLFALMFALOCK_CUR_FAIL LOOP_ALMLP_AISLP_CROSSTRLP_RDILP_RDI_VC12LP_RDI_VC3LP_REILP_REI_VC12LP_REI_VC3LP_RFILP_R_FIFOLP_SIZE_ERRLP_SLMLP_SLM_VC12LP_SLM_VC3LP_TIMLP_TIM_VC12LP_TIM_VC3LP_T_FIFOLP_UATEVENTLP_UNEQLP_UNEQ_VC12LP_UNEQ_VC3LSR_NO_FITEDLSR_WILL_DIELTIMAIL_ERRMEM_ERRMP_LOOP_ALMMP_PSMSAD_CROSSTRMSP_INFO_LOSSMS_AISMS_CROSSTRMS_RDIMS_REIMS_UATEVENTN1_AISNESTATE_INSTALLNE_SF_LOSTNO_BD_PARANO_BD_SOFTOUT_PWR_ABN PASSTHROUGH_REPORT PATH_MON_FAILPDU_ALMPOWER_ALMPOWER_FAIL PROTOCOL_MMPSPWR_MAJ_ALMPWR_MIN_ALMP_AISP_LOSRECEIVE_ERRRELAY_ALARMRFARMFARP_LOCRR_LOCRS_CROSSTRRS_UATEVENTRTSR_FIFO_ER_F_RSTR_LOFR_LOSR_LOSYNCR_OOFS1_CHANGES1_SYN_CHANGESECU_ALMSTM_ERRSUBCARD_ABN SYNC_C_LOSSYN_BADTEMP_ALARM TEMP_OVERTEM_HATEM_LATFTHUNDER_ALMTP_LOCTPS_ALMTR_LOCTU_AISTU_AIS_VC12TU_AIS_VC3TU_LOPTU_LOP_VC12TU_LOP_VC3TX_E1LOCT_ALOST_FIFO_ET_LOCT_LOST_LOTCT_TDMUP_E1_AISVC_AISVC_DELAY_TLVC_RDIVCG_MM_EX VCXO_LOCVER_MISMATCH VP_AISVP_RDIVPG_MM_EX WORK_CUR_OVER WRG_BD_TYPEW_R_FAIL第4章告警处理在OptiX 2500+(Metro3000)设备维护工作中,会遇到很多告警,对告警的有效分析,是解决问题的关键。
常用告警说明诺西诺西是一款广泛使用的告警系统,帮助企业实时监控和管理各种运行时异常和故障。
本文将介绍一些常见的告警类型以及相应的解决方案,以帮助用户更好地理解和处理诺西告警。
一、服务器宕机告警当服务器宕机时,会触发服务器宕机告警。
这可能是由于硬件故障、网络故障或者服务器过载等原因导致的。
处理服务器宕机告警的解决方案如下:1. 检查服务器硬件:首先需要确认服务器是否存在硬件故障。
可以检查服务器的电源、硬盘、内存等组件是否正常。
2. 检查网络连接:如果服务器宕机是由于网络故障导致的,需要检查网络连接是否正常。
可以尝试重新连接网络或者检查网络设备是否工作正常。
3. 调整服务器负载:如果服务器宕机是由于过载导致的,可以尝试通过减少服务器负载来解决。
例如,优化代码、增加服务器资源等。
二、磁盘空间告警磁盘空间告警是指服务器磁盘空间不足导致的告警。
这可能是由于长时间未清理无用文件、磁盘写入速度过快等原因导致的。
处理磁盘空间告警的解决方案如下:1. 清理无用文件:可以通过删除无用的日志文件、临时文件等来释放磁盘空间。
2. 增加磁盘容量:如果磁盘空间经常不足,可以考虑增加服务器的磁盘容量。
3. 优化磁盘写入速度:如果磁盘空间告警是由于磁盘写入速度过快导致的,可以尝试优化代码,减少磁盘写入次数。
三、CPU负载告警CPU负载告警是指服务器CPU负载过高导致的告警。
这可能是由于程序运行过多、代码不优化等原因导致的。
处理CPU负载告警的解决方案如下:1. 优化代码:可以通过优化代码、减少CPU消耗来降低CPU负载。
例如,减少循环次数、合并重复代码等。
2. 增加服务器资源:如果CPU负载经常超过服务器承受范围,可以考虑增加服务器资源。
例如,增加CPU核心数、内存容量等。
3. 分离任务:如果程序运行过多导致CPU负载过高,可以尝试将任务分离到多台服务器上进行处理,从而分担负载。
四、网络连接异常告警网络连接异常告警是指服务器与外部网络连接不稳定或者中断导致的告警。
常见告警、性能及处理在我们日常使用各种设备和系统的过程中,经常会遇到各种各样的告警信息和性能问题。
这些问题如果不及时处理,可能会影响到我们的工作效率、甚至导致严重的后果。
下面,让我们来了解一些常见的告警、性能问题以及相应的处理方法。
首先,来说说网络方面的常见告警和性能问题。
网络连接中断是一个让人十分头疼的问题。
当我们突然无法访问网页、无法收发邮件或者与他人的在线交流中断时,很可能就是网络连接出现了故障。
这时候,我们首先要检查自己的网络设备,比如路由器、交换机等,看看指示灯是否正常。
如果指示灯显示异常,可能是设备出现了硬件故障,需要进行维修或更换。
另外,网络延迟过高也是常见的问题。
当我们在玩网络游戏或者进行视频通话时,如果出现卡顿、画面不流畅的情况,很可能就是网络延迟导致的。
造成网络延迟的原因可能是网络拥堵、服务器负载过高或者本地网络设置问题。
解决这个问题,可以尝试关闭其他占用网络带宽的程序,或者更换网络连接方式,比如从无线网络切换到有线网络。
还有一种常见的网络告警是 IP 冲突。
当多个设备被分配了相同的IP 地址时,就会出现这种情况。
这会导致网络连接不稳定,甚至无法正常上网。
解决方法是手动为每个设备设置不同的静态 IP 地址,或者通过路由器的 DHCP 功能自动分配 IP 地址。
接下来,我们谈谈计算机系统方面的常见告警和性能问题。
系统死机是很多人都遇到过的情况。
电脑突然停止响应,鼠标和键盘都无法操作,这可能是由于系统资源耗尽、软件冲突或者硬件故障引起的。
如果是系统资源耗尽,可以尝试关闭一些占用大量内存和 CPU 资源的程序。
如果是软件冲突,可以卸载最近安装的可疑软件。
如果是硬件故障,可能需要检查硬件设备是否正常工作,或者寻求专业的维修服务。
系统运行缓慢也是一个常见的问题。
当我们打开一个程序需要很长时间,或者在操作过程中经常出现卡顿,这可能是由于系统垃圾文件过多、硬盘空间不足、病毒感染等原因造成的。
传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。
也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。
一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。
四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。
这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。
五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。
系统异常告警与故障排除1 交流输入异常告警1.1 交流停电,交流高压/低压告警(1) 交流停电:交流电源中断告警。
蓄电池处在放电状态。
告警在交流电源恢复后自行恢复。
(2) 交流高压:交流输入过电压告警。
表示交流输入电压高于系统的交流输入电压过高告警设定值。
告警在电源电压下降后自行恢复。
(3) 交流低压:交流输入低电压告警。
表示交流输入电压低于系统的交流输入低电压告警设定值。
告警在电源电压回升后自行恢复。
1.2 交流停电故障排除(1) 整流模块全部停机,监控单元由电池供电,注意蓄电池放电电流,并启动备用发电机。
(2) 停机后复电,注意电池充电电流,必要时降低电流抑制以限制充电电流在安全范围内。
1.3 交流高压/低压故障排除(1) 检视CSU中的交流电压显示值是否超过设定值。
如显示电压值正常(在规格订定的范围内) ,则令系统继续运转,并通知维修人员处理。
(2) 若电压确实超过设定值,则关掉交流电源,待电网恢复正常再行开机。
否则可能造成对整流模块的伤害。
2 输出电压告警直流高压/低压告警(1) 直流高压:输出电压过高告警。
表示输出电压高于输出高电压告警值。
告警在输出电压下降后自行恢复。
(2) 直流低压:输出电压过低告警。
表示输出电压低于输出低电压告警值。
告警在输出电压回升后自行恢复。
输出低电压告警发生时,应注意蓄电池的放电情形,以免基站退服,蓄电池因过度放电而损毁。
应及时发电.3 熔丝熔断告警3.1 熔丝熔断告警当系统中的任一电池分路及负载分路开路时,监控单元会发出告警,按下「返回」键,然后再查看哪一个位置的熔丝烧断(使用电表去量测有无电压)。
告警在熔断器更换后自行恢复。
1. 熔断器熔断后应查明原因,不可盲目的更换新熔断器。
2. 所更换的熔断器应与原来熔断器的规格相同。
3.2 熔丝熔断故障排除(1) 检查该分路负载是否过大或短路,并设法降低至该容量范围内。
(2) 首先将该路负载的开关切断,再更换相同规格的熔丝。
基站动环常见告警及处理一、FSU离线告警(一)原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)流量卡被盗、欠费或故障。
(二)处理办法:1、第一步检查供电:1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电;2)现场检查FSU指示灯不亮设备没有供电。
3)原因分析: FSU供电异常。
2、解决方案:1)检查整个基站是否停电,如停电则通知相关人员取电;2)检查FSU供电空开是否跳闸及通电线路是否正常。
3、第二步检查无线模块:检查无线模块指示灯都不亮或都常亮。
原因分析:无线模块供电异常或无线模块故障。
4、解决方案:1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。
2)确认供电正常,则更换无线模块进行测试。
5、第三步FSU检查登陆FSU设备,点击设备诊断管理,若信号强度小于15,表明由信号弱引起。
解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部)二、开关电源告警1、交流输入频率过低1)原因分析:交流输入多为市电引入,出告警即市电频率超越门限告警,低于48Hz。
2)处理方法:将数字型万用表测试档位置于Hz档,再将两根表笔分别接入信号源两端,测量信号源频率值是否低于48Hz。
2、电池充电过流告警1)原因分析:当充电电流超过0.1C时可认为是过电流充电。
3、电池熔丝故障告警1)原因分析:蓄电池熔丝未连接牢固或检测线未检测到蓄电池熔丝2)处理方法:(1)检查蓄电池熔丝是否连接牢固(2)检查检测线是否和蓄电池熔丝良好接触(3)开关电源显示屏是否有熔丝告警提示(如果没有,可能是平台数据不更新导致,或者开关电源协议解析不正确)。
4、防雷器故障告警1)原因分析:防雷器本身出现破损等故障或防雷器未插紧2)处理方法:(1)防雷器本身出现破损等故障则需要更换防雷器(2)将防雷器插紧,保证接触良好(3)核实是否在交维测试时做的告警一直未消除。
常见告警、性能及处理一:告警处理1.LOS:信号丢失告警。
表示本端接收不到光信号。
主要引起的原因是①光纤断;②对端发送光信号没有;③本端光收模块坏。
处理方法:①先将本端用一根光纤自环,若告警消失,表示本端是好的,问题在对端。
若对端自环也好,则可以肯定两端间光纤的断了;若对端自环不好,也是LOS告警,用光功率计测量其光发功率,若功率过小(-50dB或更低)则可断定光发坏了;若功率正常,则是由于没有时钟引起的,换掉时钟板,告警消失。
②若本端自环还是LOS告警,则是由于光收模块坏了,更换后告警消失。
2.LOF/OOF:帧丢失、帧失步告警。
原因和处理同1。
帧失步:连续5帧以上,找不到正确的A1、A2,则进入帧失步状态。
帧丢失:如果OOF状态持续一段时间,则进入帧丢失状态。
3.MS-AIS:该告警是伴随着远端LOS/LOF出现而出现的,或者从网管上插入该告警。
处理方法:①若本端自环也有该告警,则更换光板。
②本端自环是好的,对端又没有LOS告警,则可能是网管上插入了AIS告警,从网管上将插入AIS操作取消,若此处理不消除告警,则更换远端光板。
③若远端有LOS告警,则按1将LOS告警消除。
4.MS-FERF/RDI:复用段远端接收故障。
产生原因是由于远端有LOS、LOF、MS-AIS告警引起的。
处理方法:按1、2、3方法消除远端告警则可。
实际工程中,我们经常遇到这样的情况:5.B1、B2、B3信号劣化告警。
原因:光板接收光功率过强或过弱,或系统本身所有。
处理方法:将本端自环,适当调节光纤插入深度,若告警消失,则是由于光功率过强或过弱引起,过强加衰减,过弱将光纤洗干净,法兰盘连接处拧紧或换光发功率强的光模块;若不是光功率引起的,则是光板或时钟板所致,更换光板或时钟板则可(误码性能的参数意义见后面详细介绍)。
6.LOM:复帧丢失。
原因:通常由对端交叉板引起。
处理方法:①更换对端交叉板则可。
②检查背板是否断针。
③交叉板是否插好。
NODE_B常见告警分析及处理建议告警分析及处理建议1、Additional 2 E1/T1 licences missing告警分析:NB上缺少增加E1/T1容量的licence key。
处理建议:将licence容量补全。
通常BBU单元上默认开放2个E1端口,licence容量每增加1即多开放一个E1,以此类推。
采用local打入或者远端(DCN通的情况下)打入均可。
该告警在5分钟左右会自动cancel。
2、AIS on unit 1, interface 1告警分析:入局2M信号AIS告警,是指传输未分配业务。
处理建议:通知传输机房,告知告警内容,申请分配传输业务。
3、Antenna line device failure告警分析:天线设备故障。
处理建议:目前该告警暂无有效的处理手段,现阶段只能通过更换发生告警的RRU单元来解决该告警。
TIER3已将此告警作为NB重点关注的几个告警之一。
4、Antenna line failure告警分析:天线故障。
处理建议:处理该告警的步骤是:Site Manager --->Antenna--->antennaline management,在弹出的对话窗中将3GPP/AISG Commumication下的3个选项全部disabled,同时将DC voltage下6个选项全部disabled,然后send parameter,同时重启site。
即可清除该告警。
5、Baseband bus failure告警分析:基带总线故障。
处理建议:首先断电重启NODE_B设备,升级软件包至WN5.0 12.4_102版本,观察基站工作状态约15分钟,如果告警再次出现,更换BBU单元。
6、BTS master clock tuning failure告警分析:基站主时钟调谐错误。
处理建议:处理该告警的步骤:Configuration--->BTS Configuration--->Fast Tune BTS Clock,同时检查基站的同步设置、以及传输设置和传输是否有误码等。
GPS常见告警的原因和处理方法深大莲塘局最近频繁出现G PS告警,由于深大规定告警都要得到及时处理,大量GPS 告警的出现使得维护人员焦头烂额,多次打电话向我寻求处理方法,我也意识到G P S 对整个基站的重要性,决心对GPS告警来个集中处理,避免再出现G P S的故障。
经过对7.1日到7.20日对已恢复告警的查询,发现GPS的告警主要集中在3类:BSC0 基站号持续时间原因GPS的输出失败10 7.2-7.20GPS的10MHz频率输出失败GPS的1P PS时钟故障,误差超过800ns34、70、21、17、2 7.3-7.16GPS天馈故障70、27、21、2、28 7.6-7.1824日叫来了硬件负责G P S研发的彭家银,他对告警的原因都进行了解释,我觉得受益非浅,把当中有用的信息整理成文档,希望对大家也有所帮助。
GPS...输出.失败..:这个告警在15.4.20及以后版本才有,15以前的版本都没有,原因是现在的后台经过修改才决定显示这个告警,以前的版本并不愿意显示这个告警,这个告警设计的初衷并不是用在告警管理中,而是用在诊断测试中的,现在对GPS 10M频率的检测有两条路径,一条是通过诊断测试的路径进行检测,这个检测的要求高比如正负2dB,一条是通过自检测的路径进行检测,这个检测的要求低比如正负10dB,能满足10M频率的最低要求就可以了,但是现在15.4.20版本却把诊断测试进行的检测也告在了告警管理中,为什么要这样做的具体原因不清楚。
因此就可能出现10M频率满足自检测要求基站还能正常工作,却不满足诊断要求的现象,这个时候出现告警10M频率异常告警,可以检查TR X是否有频钟异常告警,如果有,则说明确实出现了10M频率异常,需要更换GP S板,或者天线出现故障,如果没有TR X的频钟异常告警,则不需要处理,下面深大10号基站的10M异常并没有伴随出现TRX频钟异常,因此不需要处理。
设备常见告警及处理思路1.设备类告警:1.1 物理端口告警一般是接口未连接或者链路断开造成的这个是2M接口未连接的告警。
输入光功率越限告警1.2网元断链这个是网管上报的告警,存在于网管不能ping通网元管理IP情况1.3 单板告警常见是单板脱位,原因有可能是单板在重启或者已经与主控板通信失败2.隧道类告警2.1 隧道BFD down隧道检测依赖BFD,检测周期是10毫秒,超时周期30毫秒。
如果超过30毫秒未收到对端的BFD报文,认为隧道主用路径故障,在存在备用路径的情况下立即触发隧道路径倒换,出现2.2的告警。
查看命令show mpls traff tunnels tunnel-id X2.2隧道hsb切换隧道HSB路径是一个暂时存在的路径,5分钟后会撤销,隧道在5分钟内重新计算路径,如仍无法计算出路径,隧道将会down,如告警2.3查看命令show mpls traff tunnels tunnel-id X hot-standby2.3 隧道down该告警指隧道A到Z点无法计算出可达路径,隧道失效。
隧道建立依靠IGP以及RSVP-TE协议,可沿隧道路径检查IGP协议是否正常,路由是否正常,接口的RSVP-TE协议是否以及打开,协议运行是否正常。
查看命令show mpls traff tunnels tunnel-id X3.伪线类告警3.1 伪线BFD down该告警依靠伪线上的BFD检查,检侧周期50毫秒,如连续3次未收到对端发来的BFD报文,认为主用伪线故障,在配置了伪线保护组情况并且备用伪线正常情况下触发伪线倒换。
查看命令show mpls l2transport vc pw X3.2 伪线保护组倒换该告警说明伪线正在处于倒换状态,业务流量从备用伪线转发,如主用伪线恢复,在5分钟后会自动回切,该告警消失。
查看命令show l2vpn pw-redundancy-group X detail这个是PEER-BFD会话告警,目前每台汇聚到核心之间都配置了PEER-BFD,出现该告警,原因一般是链路质量了劣化。
告警与故障处理经验总结告警是反应设备一段时间的运行情况,告警作为网优日常必不可少的工作,同时告警对小区的指标有着重要的影响。
以下内容主要列举了工作中几个特殊的故障和处理方法,以及对小区指标的影响情况分集接收告警告警类型:CF2A33影响情况:用户投诉反应是在56090C附近,出现电话困难,就算接通了,对方无法听清楚。
根据此情况,首先提取了小区一段时间的指标做分析,发现指标方面并没有异常,指标一切良好。
该基站B、C小区共架,查看了该小区的实时告警,并没有告警出现,后再查小区的历史告警出现告警的时间是前段时间,而且出现告警的载频是B对应的载频,并不是C对应的载频。
对测试现场做MTR分析,发现上行确实是非常弱。
后派单代维检查设备,但没有实时的告警,对检查设备带来一定的困难。
根据经验,会不会是CXU的连线出现故障,后来建议设备代维重点检查CDU的RX端的接线。
解决方案:检查CDU连线,重现拧紧后,上行弱信号得到解决,检查设备之前TF时隙同步告警告警类型:TF ECL 0影响情况:该故障的处理对小区的掉话、指配成功率、信令接通率等指标几乎没有影响,但对小区的切换成功率影响较大。
由于之前未碰到TF方面的告警,而且单独影响小区的切换指标,刚开始分析以为是DXU方面的原因导致,但后来将传输更换后,指标开始恢复解决方案:更换传输指标变化文件掉失告警做小区的MRR、FAS及其他的测量功能定义时又或者话务统计定义时,有时候容易出现A1、A2较严重的告警,特别在文件的输送过程容易出现。
该告警出现时主要由于文件的定义不全、定义错误、路径错误导致,从而导致在输送过程中出现告警。
以上告警时表示STS文件掉失、停止,导致的A2级告警,根据经验,处理该类型的告警,我们采取从新定义其文件来消除告警。
总结: 告警是处理的网优中一个日常而又重要的的工作,告警不但包括小区级、而且还有网元级方面的告警,而且告警的类型和解决方法有各有所不同,本文主要列举了日常中几个少见但同时影响又较严重的例子,希望对大家处理同类故障有一定的帮助。
常见FSU告警及解决方法一、a. FSU离线:流量卡、网络状态、基站断电及设备故障均可能造成此故障,故障处理工作应常态化,及时发现、及时处理;我们将全天候的做好技术支撑及备件维护工作;b. 交流输入停电告警:此告警为无市电造成,请及时排除线路故障和发电工作(新版本已经按照铁塔要求调整为二级告警);c. 二级低压脱离告警:重要告警基站已经断站,请及时上站排除故障和发电工作;d. 电池熔丝故障告警:开关电源跟蓄电池连接熔丝故障,请及时上站检查更换以免对续航能力造成影响;e. 负载熔丝故障告警:开关电源负载断路,及时上站检查以免运营商设备断电造成影响;f. 烟雾告警:此告警为基站出现大量烟雾或大量灰尘后告警,请及时上站排查;水浸告警:为水浸传感器告警,传感器一般位于空调下方出现积水后短路产生,请及时上站检查排除以免出现大量积水造成影响;二、a. 交流输入停电告警:此告警为无市电造成,请及时排除线路故障和发电工作;b. 直流输出电压过高告警:此为基站浮充电压设置较高,蓄电池过冲后产生;远程或开关电源显示屏调整浮充电压到正常值(53.5)即可解决;c. 直流输出电压过低告警:机房直流电压低于47V后产生,一般为基站停电或整流模块故障后蓄电池放电到告警阈值后才生,请上站检查排除故障恢复正常电压;d. 一级低压脱离告警:重要告警,基站已经退服,请及时上站排除故障和发电工作;e. 电池供电告警:开关电源给蓄电池充不上电,请检查熔丝、开关电源设置、蓄电池;f. 电池熔丝故障告警:开关电源跟蓄电池连接熔丝出现故障,请上站检查更换;g. 电池组实际总容量:电池放电后出现告警充满后即可恢复,或开关电源设置蓄电池参数不对修改即可解决;h. 交流电压超高告警:市电电压高于265V后出现告警,请上站检查市电;i. 油机发电状态:此为断电传感上传告警,标识是否正在发电;j. 总电压过低:蓄电池放电到阈值47V,充电后即可恢复;k. 非法进入告警:基站有人进入,请联系代维是否有人上站来决定是否上站排查;l. 温度超高:机房环境温度高于35度,请检查温湿度传感器,如无问题请打开基站空调为制冷保证基站恒温;m. 电池维护更换告警:开关电源蓄电池设置问题或蓄电池已经报废,请检查后决定;三、a. 整流模块故障告警、整流模块风扇告警、整流模块过压关机告警、整流模块通信状态告警:均为开关电源整理模块出现故障,因问题点较多需上站核实进行解决或更换;b. 交流输入缺相告警、交流电压过低告警、交流电压过高告警:为基站市电的各种故障点,需上站核实解决;c. 单体电池电压过高告警、电池充电过流告警、电池温度高告警、电池温度过高告警:此类告警为蓄电池各种状态告警,根据各种情况请检查蓄电池或开关电源蓄电池设置;d. 温度过高:环境维度过高,请检查温湿度传感器,及时打开基站空调进行降温;e. 总电压过高:蓄电池过冲,请检查开关电源浮充、均充电压设定阈值;f. 门磁开关状态、门锁开关状态、长时间门开告警:基站有人进入或门磁没有贴合到一起,请核实是否有人上站,如无请及时上站排查;g. 电池组中间点电压不平衡:蓄电池采集器中间点连接线接错位置或单体蓄电池出现问题造成,请上站检查线路或单体蓄电池电压解决;h. 红外告警:红外传感器位于门口位置有人晃动或温度区域变化时产生,告警发现后及时核实如非维护人员上站,请及时上站排查以防基站东西丢失i. 工作异常告警:通过如下集团的告警规则(停机时电流值>50mA、运行时电流值≤50mA时出现告警)分析及现场的检测,个别空调在现实工作环境中不确定因素很多,而空调控制器的精度较高为0.01,范围是1-100A;在停机时电流值有大于50mA,或者空调运行时小于50mA,而控制器的量程最小是1A,当电流值很小的时候控制器检查出来的值也会跳变,就会造成总体的频繁告警;目前只能通过重新开机或者关机后解决,后期可通过修改协议解析,提高电流值的临界值来解决;j. 开关电源通信状态告警、智能电表通信中断告警告警、蓄电池采集器通信状态告警、非智能设备采集器通信状态告警、一体化设备采集器通信状态告警、智能门禁通信状态告:此告警为各种智能或非智能设置取信异常造成,需上站检查接线、协议与设备重新调试或者更换后解决;四、a. 防雷器故障告警:基站防雷模块出现故障,请及时上站更换;b. 温度过低:机房温度过低,请检查基站密封情况,打开空调制热保证机房恒温环境;a. 长时间门开告警、门锁开关状态:基站有人进入或门磁没有贴合到一起,请核实是否有人上站,如无请及时上站排查;c. 电池组剩余容量百分比:请检查开关电源蓄电池设置,如无问题蓄电池充满恢复;d. 整流模块温度过高告警:机房环境温度过高或负载过大整流模块超负荷工作造成,请上站核实解决;e. 交流输入电压过高告警、交流输入异常告警、交流输入电压过低告警:机房市电问题请根据情况排查解决;b. 电池放电不平衡告警:蓄电池组中某块单体电池出现亏损,请上站检查更换调整;f. 湿度过低:机房过于干燥,请检查机房温度及通风情况;g. 普通空调通信状态告警、通风/换热设备通信状态告警:为基站空调取信异常,请根据基站情况,安排合适的方案进行更换调整,确保基站空调可远程控制。
···常见告警故障处理及分析MOTOROLA基站的告警按故障设备可分为三类:设备告警、内部告警、外部告警。
一、设备常见告警设备告警是硬件告警最常见也是最重要的告警,告警设备一般为基站的主要器件,它的告警类型就是它的设备类型。
1. DRI 29:[Front End Processor Failure - Watchdog Timer Expired] 前端处理器故障DRI硬件故障,出现此告警时DRI可能会反复自启,可能会退服,应先reset or ins DRI应进行INS或RESET处理,若告警未消失,更换TCU。
2. DRI 40-47 :[Channel Coder Timeslot 0(-7) Failure] 0-7时隙信道编码器失败。
M-CELL基站经常出现此类告警,应进行INS或RESET处理,不行再更换TCU900。
此告警在GSR4时出现,升级到GSR5可能会消失。
3. DRI 51 :[Baseband Hopping TDM Link Error]基带跳频TDM链路错误。
此告警有几种可能性:TDM-Highway BUS或KSW可能有问题。
DRIM的FEP,CCDSP可能有问题。
此告警须在现场具体测试分析。
测试后判定故障点。
此告警在GSR4时出现,升级到GSR5可能会消失TDM——Time Division Multiplexing时分复用:该总线用于把来自BTS的呼叫与信令数据传送到MSC,反之亦然。
可分为两个独立的部分:交换机公共通路&出局公共通路。
交换机公共通路:处理路由到交换机的数据,数据来自外部信源 (通过E1/T1接口)或由GPROC内部产生。
出局公共通路:这是一个被交换的数据,现在被路由出BSC/RXCDR (通过E1/T1接口)或通向内部GPROC。
4. DRI 81:[Transmitter Synthesizer Failure]收发单元故障此告警为收发单元TCU故障,故障原因有可能为:-接收Calibration频点丢失-信道盘的CEB故障-射频电缆连接失败处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU 5. DRI 86 :[Transmitter Failure]输出功率失败,引起DRI退出服务。
状态:D-U此告警是信道盘的功率放大器失败。
应更换信道盘。
6. DRI 91 :[Power Amplifier Power Low But Functioning]信道盘的功率放大器输出功率低于门限,状态B-U。
此告警有可能由于高温等原因引发,有些站经常性出现DRI[91]的盘则需要更换,以免因小区功率不平造成掉话。
有时侯在现场看不见此告警,须从OMC 的事件窗口检查。
7. DRI 92 :[Power Amplifier Temperature High But Funncioning]信道盘的功率放大器高温告警,但可以工作。
信道盘的功率放大器的高温多数是因机房高温,或机箱内的风扇故障造成的。
在出现此告警后,信道盘的性能会下降。
如温度过高,信道盘会自动闭塞。
因此常出现此告警的信道盘应于以更换。
8. DRI 112 (114)[Receiver Synthesizer Failure]接收单元合成器故障此告警为收发单元内部故障,其主要原因大概有:-收发信单元内部直流供电故障-收发信单元内部硬件故障处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU9. DRI 150: [ Receive Matrix Branch 1 control Link Failure]接收矩阵支路控制失败,状态: B-U此告警M-CELL和Horizon中均有出现,伴随切换掉话,切换成功率低,呼叫建立成功率低导致的话务量减少。
有时也会导致信道盘的path_balance值偏高。
其主要原因有:-有故障的接收矩阵即SURF-收发信单元与接收矩阵之间的同轴电缆断路-收发信单元与接收矩阵之间的同轴电缆短路-信道盘中的均衡器板控制电路出现故障-SURF内部前-后端接口短路-SURF内部前-后端接口断路根据现场判断具体情况更换硬件。
10. DRI 152: [Control Processor to Power Amplifier Communication Failure] 处理器与功率放大器的通信失败此告警是信道盘中的CEB及对PA的控制失败。
首先对信道盘进行INS或RESET处理,不行再更换信道盘。
11. DRI 209 : [Timeslot Configuration Failure]信道分配失败 D-U 小区资源管理器CRM为MS分配无线信道时在射频硬件上分配时隙失败。
产生的原因有:-收发信单元TCU故障-DRI软件故障处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU12. DRI 218 :[Timeslot Configuration Failure]不健全的信道接收校验数值此告警的出现时用指令:disp_cal_data <location> <device_name> <dev_id> <dev_id> <dev_id> 可看到基站接收数据校准值中出现80(错误的校准数据),还找到根本的原因,远程对硬件reset或ins均无作用,现场人员有时需更换新硬件设备而有时只需对信道盘开关电即可恢复,初步判断为硬件TCU(Horizon目前还未发现)接收单元问题。
13. DRI 234 :[Active Link Connection Failure]主用链路与BTP的链接失败。
状态:D-U此告警主要发生在M-CELL上,是主用BTP到DRI/TCU900的链接失败。
其原因主要分为:* FOX/FMUX/BTP之间的连接和使用的光纤类型的问题。
*TCU900/FOX/FMUX/BTP本身的问题。
*还有则是由于某种原因,使处理机运行过程出现问题,使其与TCU900失去联系。
这类情况可用LOCK-UNLOCK恢复。
14. DRI 235 :[Standby Link Connection Failure]备用链路与BTP的链接失败,对网络不造成影响。
但如果出现整个机柜告警应当引起重视。
以免基站主用出现故障倒换到备边时,出现整个机柜不能工作。
此告警只出现在M-CELL,是备用BTP到DRI/TCU900的链接失败。
其原因主要分为:* FOX/FMUX/BTP之间的连接和使用的光纤类型的问题。
*TCU900/FOX/FMUX/BTP本身的问题。
*有时侯如有大部分DRI出现此告警,有可能是没将BTP做成冗余形式。
DRI 239 :[Process Safe Test Audit Failure]有可能是因为机房内高温造成,若不及时进行处理,会继续出现92#告警15. DRI 243 :[Unlocked Device Not In Service]信道盘退服 D-U 此告警出现在没有主告警的情况下信道盘退服可能的原因是:系统错误导致的信道盘退服处理方法:发现告警后,RESET THE DRI观察,如果告警仍然存在这更换信道盘。
16. GCLK 2 :[Clock Reference Failure]时钟参考失败此告警为基站MSI板的时钟提取丢失其主要原因有:-E1/T1链路故障-没有MSI/NIU的时钟信号-没有XCDR的时钟信号-GCLK 时钟提取电路失败处理方法:更换MCU或NIU,若仍然出现告警则需通过传输处理17. GCLK 4 : [ Phase Lock Lost]时钟参考信号锁相丢失此告警有时会引起切换掉话或切换成功率低,有时没有影响,大多数是因为传输大网与移动网对时钟要求相距较大引起。
其主要原因有:-大多数情况是在E1/T1链路上偏移或不稳定的时钟超过所允许的极限而引起的时钟失锁。
-不正确的时钟源或-GCLK硬件故障-GCLK 晶体振荡器由于老化不能长时间对信号源进行锁相处理方法:一般情况下先进行时钟重新校准或SWAP BTP到备边,若无作用则请传输中心处理。
18. GCLK [8] :主备时钟频差过大。
此告警是由BTS的本振时钟主备频率偏差过大,应及时对时钟进行校准。
M-CELL: 8000HZ.19. GCLK 14 : [Phase Lock Failure]时钟参考信号锁相失败此告警有大多数时间会引起切换掉话或切换成功率低其主要原因有:-GCLK硬件故障-有问题的前时钟源-规范问题20. GCLK 18: [Not Operational]主时钟不工作此告警是由于基站主控板MCU不能建立正常的同步时钟初始化。
出现的原因:可能是由于固件故障,或是硬件老化。
出现此问题时应reset MCU,若告警未消失则需更换MCU;若告警消失,则不需在作进一步的观察。
GCLK 24[Bad Clock Source or OCXO (oscillator) ]:不精准的时钟源或有故障的时钟振荡器。
出现此告警时先reset site 或主控倒到备边,若还存在告警则需传输帮助解决。
21. GCLK 26: [GCLK Calibration Request] GCLK校准失败此告警有大多数时间会引起切换掉话或切换成功率低其主要原因有:-GCLK 校准超出要求范围(即不能进行校准)-有问题的GCLK时钟源或时钟源超出传输要求规范-在MCU第一次加电时不能进行校准,因此不能计算LTA值-GCLK长时间不能进行锁相,超出允许时间-GCLK 硬件故障处理方法:更换MCU另:LTA——Long Term Average.长期平均值。
BTS的GCLK频率寄存器为产生一个16.384MHz的时钟所需的值。
22.BTP [39]: 软件故障此告警出现时会引起BTP D-U Code Load Failure或反复code load .其主要原因有:-下载的软件故障-主控GPROC故障处理方法:1.进emon reset site,并观察2.更换MCU(或SWAP BTP)二、内部告警内部告警的告警设备一般为基站的辅助设备如风扇、保险、开关、电源模块等。
1. IAS 86#[cabinet fan failure]:基站风扇故障2. IAS [81] :PSU供电单元输出失败。
通过计算机检测电源模块,判定故障及时更换。
3. IAS [95] :低噪音放大器保险坏。
M-CELL对于GSM900的选件中没有采用低噪音放大器。
所以此告警对DCS1800基站有影响。