原 Oracle rac排查故障时不生成日志的情况排查(npohasd文件)
Tags: Oracle原创故障处理rac集群npohasd文件不能生成日志文件
简介
在启动rac的过程中,目前碰到过2种不生成日志的情况,下边分别介绍。
情况1:软件目录权限被修改
例如,不小心将目录$GRID_HOME/log
的权限修改了,或删除了该文件夹,则在此情况下的修复可以参考:https://dbaup.com/ruguogrid_homehuogrid_basehuo-u01muluxiadesuoyouwenjianquanxianbeirenweiwucaozuoxiugailenaai.html
情况2:bug所致
情况1:11.2.0.1 在RHEL6上安装
启动has进程:
1 2 | [root@lhrdb2 ~]# /u01/app/11.2.0/grid/bin/crsctl start has ......... 卡在这里 |
在启动has进程的时候,不生成日志,但在/var/log/messages文件中有如下输出:
1 2 3 4 | Apr 3 19:27:57 lhrdb1 root: exec /u01/app/11.2.0/grid/perl/bin/perl -I/u01/app/11.2.0/grid/perl/lib /u01/app/11.2.0/grid/bin/crswrapexece.pl /u01/app/11.2.0/grid/crs/install/s_crsconfig_lhrdb1_env.txt /u01/app/11.2.0/grid/bin/ohasd.bin "reboot" Apr 3 19:27:57 lhrdb1 /u01/app/11.2.0/grid/bin/crswrapexece.pl[24193]: executing "/u01/app/11.2.0/grid/bin/ohasd.bin reboot" |
通过strace进行跟踪,看到在open /var/tmp/.oracle/npohasd文件:
1 2 3 4 5 6 7 | [root@lhrdb2 lhrdb4]# ll /var/tmp/.oracle/npohasd prw-r--r-- 1 root root 0 Nov 9 04:12 /var/tmp/.oracle/npohasd [root@lhrdb2 lhrdb4]# strace -p 13380 Process 13380 attached open("/var/tmp/.oracle/npohasd", O_WRONLY |
解决 :需要执行如下的dd命令
1 | dd if=/var/tmp/.oracle/npohasd of=/dev/null bs=1024 count=1 |