2018年终总结

每年都习惯性的记录当年的“足迹”, 今年是开BLOG的第10个年头, 显然我已到了喝水都要放枸杞的年纪,没有了 […]

Troubleshooting “latch: row cache objects” case and Event 10089 to do.

“row cache objects”是序列化latch,用于保护对SGA中dictionary cache的访问。 只要是参考dictionary cache中的元数据对象,就会获取此latch。 Row Cache Objects Latch 是 shared pool latch 相关。”row cache objects”是序列化latch,用于保护对SGA中dictionary cache的访问。 只要是参考dictionary cache中的元数据对象,就会获取此latch。 Row Cache Objects Latch 是 shared pool latch 相关

,

Troubleshooting high “gc current grant 2-way” and “gc cr grant 2-way” 案例(二)

如何分析RAC中的GC 问题,结合案例分析11.2.0.3 RAC中异常高的gc cr grant 2-way等待事件, bug 的解决方法”_max_cr_rollbacks” …

, ,

Troubleshooting ORA-600 issue related to memory curruted when using DBLINK

前段时间的一个案例,突然好几个数据库出现了ora-600 坏块相关的错误, 但是幸运的是使用rman, dbv, analyze table validate structure 都没有实际的坏块, 也就是说很可能只是出现在memroy 中,目标和源都是11.2.0.3.7 2nodes RAC, 最终是确认了为Procedure中使用了DBLINK触发

,

ORACLE SCN issue Best Practice (最佳实践)

Recently, we have faced a very serious problem with Oracle SCN. The SCN with a production env ORACLE RDBMS grows very fast, the SCN rate is more than 30k per second . In theory, there should not be such a high transaction volume. The environment is a 11.2.0.3 2-nodes RAC ON AIX 6.1 platform, and have applied PSU11.2.0.3.7 .

,

Oracle12c R2注意事项: 因BUG生成大量的trace file 包含KRB: (rman module)

升级了Oracle 12cR2的同学,尤其是安装了2018 4月RU的版本(12.2.0.1.180417), 遇好检查下你的trace目录下是否生成了超大量的trace file,或单个超大的trace file文件,因为在这个版本下有两个原因很可能生成这些trace:
1. Trace files generation with message “AUTO SGA: kmgs_parameter_update_timeout gen0 0 mmon alive 1”.
2. Trace files generated from RMAN module with KRB messages.

,

Oracle12c R2注意事项:DB password file in ASM (DataGuard环境重建PWD)

2C中为了在不同实例间统一的密码管理, 支持把DB密码(ASM password same)存储到ASM DISKGROUP中,这样在维护DG环境时,当同步密码文件时就要先确认一下密码的位置, 同样DG端也可以把密码存储到ASM中,然后使用srvctl modify database修改pwd路径. 这个案例通过在标准化DG配置中因密码不一致产生了各种错误

,

How to delete SYS.KUPC$ service after kill datapump job

本11.2.0.4 2-nodes RAC, 现象是service_name 参数出现了一些SYS.KUPC$ 的service, 监听上同样有,且停节点1 ,service会漂到节点2, 重启双实例后同样存在, 手动修改service_name可以临时解决,但是重启实例还是会存在,虽然是新增service, 监听上看着乱,其它没什么影响, 这类服务常见于datapump 自动增加的…

, ,

Troubleshooting ora-600[ktecgsc:kcbz_objdchk]&ora-600[qesmaGetTblSeg1] when inserting and ora-7445 [kss_first_child] when granting

又近年末,各种事情忙的不可开交, 但最近的BUG又突然接二连三, 争取把在2018年的最后几天习惯性简单的总结 […]

, , , ,

Troubleshooting many session waiting ‘latch free'(transaction branch allocation) 11gR2

前日有套11.2.0.3 RAC on HPUX数据库环境突然出现较高的latch: free wait event, 该event在10G以后的版本较为少见(已经细化为具体latch) , 通过p1 or p2值可以确认具体latch. transaction branch allocation占用较高的db time

,

Troubleshooting ORA-27300 ‘fork failed with status: 11’ on SLES12 (SUSE /Linux 7)

建议在SLSE 12或以后的版本,或LINUX 7等以后的版本时,先了解一下系统变化,至少在安装RAC时, 把DefaultTasksMax修改加入到安装方档中去, 可能Oracle 在以后的安装文档或最佳实践中会增加该内容。

, , ,

oracle 12cR2 新的权限组sysdg, sysbackup, sysrac, syskm

在许多公司中,各种与Oracle数据库相关的任务(如管理ASM和备份/恢复Oracle数据库)都有明确的职责分离。在过去都是使用sysdba管理所有权限如asm\DG\备份, 从Oracle Database 12c R1开始,可以使用SYSBACKUP,SYSDG和SYSKM管理权限。从Oracle Database 12cR2开始,新增加了SYSRAC管理权限..

, , , ,

Troubleshooting ORA-21780 during SMON to clean transient type

This issue happens on Oracle RAC environment 11.2.0.3 , […]

, ,

Oracle 12.2 Flex ASM安装RU后ASM、GIMR等资源未启动, 手动启动提示CRS-2549“it is not a valid candidate as per the placement policy”

今天遇到的一个案例,一套ORACLE 12.2 FLEX CLUSTER, 在安装了RU(20180417)后节点2的CRS启动正常,但是其它如ASM、DB、GIMR 等资源都未启动, GI alert log并未发现错误,手动使用srvctl启动ASM资源提示:
CRS-2549: Resource ‘ora.asm’ cannot be placed on ‘anbob02’ as it is not a valid candidate as per the placement policy

,

浅谈ORACLE免费数据库Oracle Database XE版

Oracle database XE发布过10G、 11G, 最近XE 18C 发布,而且是18.4版, 注意这里的版本不等同于ORACLE DATABASE EE的版本号。

ORACLE DATABASE XE 18C IS FREE For Me, FREE For You, FREE For Everyone! and Free to Download , Free to Use, Free to Deploy!
看到FREE无比的激动,她不只免费,而且较比之前的版本,是一个Full OPTION ON的版本

,

Oracle Database 18C (18.3) RPMs 安装方式

近日oracle发布了传说已久的RPMs安装版本18.3, 但不是oracle database core m […]

Troubleshooting Connected to an idle instance, But Instance is running

Connected to an idle instance.
Errors in file /s01/oracle/app/oracle/diag/rdbms/anbob/ANBOB1/trace/ANBOB1_cjq0_14004.trc:
Process J000 died, see its trace file
kkjcre1p: unable to spawn jobq slave process

event “library cache: mutex X” caused by Long time dynamic sampling of large tables

一日数据库多个会话出现较长时间的等待, 等待event是”library cache: mutex X”, 关于这个等待事件以前在post记录过,发生在SQL的解析阶段,在申请libary cache的锁时产生的等待,当时是部分应用session 被一些监控会话堵塞,这些会话正在执行v$sql ,v$sqlarea的收集统计,同时又被一个应用UPDATE会话堵塞,该会话当前是ON CPU,且已经执行了有近2万秒,正在执行动态采样的SQL…

, ,

安全加固导致的CRS启动失败(CRS-1612:Network communication xxx timeout ,but “PING” was fine)

本次故障是因为前期主机配置了白名单,安全扫描导致CRS 2节点crash, 在CRS自动重启中又因为白名单,网络通信异常,无法启动CRS进程。此时手动启动2节点甚至会导致1节点crash. 因为目前没有找到官方文档描述对123端口的描述…

, , ,

OGG-01022 Unknown N bytes message received & OGG-01223 Connection reset by peer

最近查看OGG (12.2)的ggserr.log里出现了下面的信息,但是OGG进程还能正常工作, 相同时间段好几台DB ogg出现了想同的日志。

,