产品版本 10.2.0.4
操作系统 Oracle Solaris on SPARC (64-bit) 5.10
一、alert日志如下:
主库alert log
---------------------
Tue Mar 11 14:30:47 2014
LNS: Standby redo logfile selected for thread 2 sequence 192246 for destination LOG_ARCHIVE_DEST_2
Tue Mar 11 14:37:00 2014
Errors in file /oracle/admin/dbrac/bdump/dbrac2_arc9_6512.trc:
ORA-16146: standby destination control file enqueue unavailable
Tue Mar 11 14:37:00 2014
Master background archival failure: 16146
Tue Mar 11 14:40:07 2014
Errors in file /oracle/admin/dbrac/bdump/dbrac2_arc9_6512.trc:
ORA-16146: standby destination control file enqueue unavailable
--------------------------------------分割线 --------------------------------------
相关参考:
Oracle Data Guard 重要配置参数
基于同一主机配置 Oracle 11g Data Guard
探索Oracle之11g DataGuard
Oracle Data Guard (RAC+DG) 归档删除策略及脚本
Oracle Data Guard 的角色转换
Oracle Data Guard的日志FAL gap问题
Oracle 11g Data Guard Error 16143 Heartbeat failed to connect to standby 处理方法
--------------------------------------分割线 --------------------------------------
备库alert log
---------------------
Tue Mar 11 14:29:44 2014
Primary database is in MAXIMUM PERFORMANCE mode
RFS[19]: Successfully opened standby log 8: '+DATA/dbrac_standby/onlinelog/group_8.473.823623967'
Tue Mar 11 14:32:12 2014
Primary database is in MAXIMUM PERFORMANCE mode
RFS[13]: Successfully opened standby log 12: '+DATA/dbrac_standby/onlinelog/group_12.1879.823705847'
Tue Mar 11 14:34:26 2014
Media Recovery Log +DATA/dbrac_standby/archivelog/2014_03_11/thread_2_seq_192246.509.841933921
Tue Mar 11 14:34:48 2014
Media Recovery Log +DATA/dbrac_standby/archivelog/2014_03_11/thread_1_seq_193463.1784.841933765
Tue Mar 11 14:35:44 2014
Primary database is in MAXIMUM PERFORMANCE mode
RFS[19]: Successfully opened standby log 7: '+DATA/dbrac_standby/onlinelog/group_7.492.823623957'
Tue Mar 11 14:37:37 2014
Media Recovery Waiting for thread 1 sequence 193464 (in transit)
Tue Mar 11 14:38:47 2014
Media Recovery Log +DATA/dbrac_standby/archivelog/2014_03_11/thread_1_seq_193464.2163.841934073
Tue Mar 11 14:40:01 2014
Media Recovery Waiting for thread 2 sequence 192247 (in transit)
二、分析及处理
分析思路:
ORA-16146错误说明有进程持有CF enqueue(控制文件锁) 超过900秒没有释放,导致其他进程无法获得CF enqueue,
其实这个错误信息有些不够准确,不单单是等待备库的CF enqueue,等待主库的CF enqueue时也会报这个错误。
导致ORA-16146错误的原因可能有:
1. IO性能慢,导致IO操作时间过长。
2. 某个持有CF enqueue(控制文件锁) 超过900秒没有释放。
3. 控制文件中的信息过多,导致查询控制文件时间过长。
4. 如果只是单纯出现ORA-16146,而没有其他问题,那么这个错误是可以忽略的。
进一步检查:
1. OSW 或者其他OS资源监控数据
2. 主库和备库分别查询:
SQL>select count(*) from v$archived_log;
SQL>select count(*) from v$log_history;
SQL> select count(*) from v$archived_log;
SQL> select count(*) from v$log_history;
SQL> show parameter CONTROL_FILE_RECORD_KEEP_TIME;
查询如下:
主库 备库
select count(*) from v$archived_log; 18956 18956
select count(*) from v$log_history; 36272 36272
select count(*) from v$archived_log; 18956 18956
select count(*) from v$log_history; 36272 36272
show parameter CONTROL_FILE_RECORD_KEEP_TIME; 7 10
3. Sun: /var/adm/messages(主库和备库)
分析解决
通过查询试图 v$archived_log 和 v$log_history,发现大量历史日志信息,因此很有可能是由于控制文件中记录的日志数量是非常多的,
查询时会消耗比较多的时间。
修改参数如下:
alter system set CONTROL_FILE_RECORD_KEEP_TIME=3 scope=BOTH;
通过几个星期的观察,没再出现ORA-16146,问题解决!
: