Troubleshooting many session waiting ‘latch free'(transaction branch allocation) 11gR2

前日有套11.2.0.3 RAC on HPUX数据库环境突然出现较高的latch: free wait event, 该event在10G以后的版本较为少见(已经细化为具体latch) , 通过p1 or p2值可以确认具体latch. transaction branch allocation占用较高的db time

,

oracle 12cR2 新的权限组sysdg, sysbackup, sysrac, syskm

在许多公司中,各种与Oracle数据库相关的任务(如管理ASM和备份/恢复Oracle数据库)都有明确的职责分离。在过去都是使用sysdba管理所有权限如asm\DG\备份, 从Oracle Database 12c R1开始,可以使用SYSBACKUP,SYSDG和SYSKM管理权限。从Oracle Database 12cR2开始,新增加了SYSRAC管理权限..

, , , ,

Troubleshooting ORA-21780 during SMON to clean transient type

This issue happens on Oracle RAC environment 11.2.0.3 , […]

, ,

浅谈ORACLE免费数据库Oracle Database XE版

Oracle database XE发布过10G、 11G, 最近XE 18C 发布,而且是18.4版, 注意这里的版本不等同于ORACLE DATABASE EE的版本号。

ORACLE DATABASE XE 18C IS FREE For Me, FREE For You, FREE For Everyone! and Free to Download , Free to Use, Free to Deploy!
看到FREE无比的激动,她不只免费,而且较比之前的版本,是一个Full OPTION ON的版本

,

Oracle Database 18C (18.3) RPMs 安装方式

近日oracle发布了传说已久的RPMs安装版本18.3, 但不是oracle database core m […]

Troubleshooting Connected to an idle instance, But Instance is running

Connected to an idle instance.
Errors in file /s01/oracle/app/oracle/diag/rdbms/anbob/ANBOB1/trace/ANBOB1_cjq0_14004.trc:
Process J000 died, see its trace file
kkjcre1p: unable to spawn jobq slave process

event “library cache: mutex X” caused by Long time dynamic sampling of large tables

一日数据库多个会话出现较长时间的等待, 等待event是”library cache: mutex X”, 关于这个等待事件以前在post记录过,发生在SQL的解析阶段,在申请libary cache的锁时产生的等待,当时是部分应用session 被一些监控会话堵塞,这些会话正在执行v$sql ,v$sqlarea的收集统计,同时又被一个应用UPDATE会话堵塞,该会话当前是ON CPU,且已经执行了有近2万秒,正在执行动态采样的SQL…

, ,

安全加固导致的CRS启动失败(CRS-1612:Network communication xxx timeout ,but “PING” was fine)

本次故障是因为前期主机配置了白名单,安全扫描导致CRS 2节点crash, 在CRS自动重启中又因为白名单,网络通信异常,无法启动CRS进程。此时手动启动2节点甚至会导致1节点crash. 因为目前没有找到官方文档描述对123端口的描述…

, , ,

Oracle Internal C functions (非官方)

anbob.com收集的一些ORACLE 数据库内部调用C函数,以后会一直更新下去,如果有不存在的可以提供发函 […]

MMNL生成非常大的trace文件,包含ASH dump, MMON进程不存在

前几日一套11.2.0.4.7 on suse 11 2nodes2 RAC中节点2的oracle软件目录使用率高,发现mmnl后台进程生成了64GB的trace文件, 包含大量的ash dump信息, 下面简单的记录一下该问题。

,

Oracle Database 配置IPV6 (一)

Oracle 11.2中除了ORACLE RAC和Oracle Clusterware所有功能都支持IPV6, 还有也不支持ASM使用IPV6,支持IPV6和IPV4共存. 在ORACLE 12C中,Oracle支持IPV4和IPV6在同一个网络,同样也可以配置PLUBIC network(Public/vip)在IPV6和IPV4,但是确保同一集群中所有节点使用相同的IP协议。但12.1 时不支持WINDOWS和private newwork. 在12.2 版本中 ORACLE提供了完全的支持IPV6,包括WINDOWS平台,ASM, FAN, 所有平台中的ORACLE Clusterwarer的private network。

,

“Out of Range” 谓词越界 dbms_stats.copy_table_stats

BMS_STATS.COPY_TABLE_STATS存储过程通常用于大的分区表的统计信息复制,当增加一个新分区后,如果立即收集统计信息使用dbms_stats.gather_table_stats当前的数据又不能反应数据的真实分布,更容易因统计不准确出现错误的执行计划或out-of-range(越界)使CBO估算错误的Cardination, 所以可以使用dbms_stats.copy_table_stats直接复制上个分区的统计给新的分区

,

Shouldn’t we have waited for buffer busy waits while waiting CBC latch?

With regular logical IOs the buffer contents are not read while holding the CBC(Cache Buffer Chian) latch:

Take CBC latch into shared mode
Walk the buffer hash chain until you find the relevant buffer header
Upgrade the CBC latch to Exclusive mode

Troubleshoot RMAN session fail ORA-01861 during restore database

朋友一套数据库版本10.2.0.5 on HPUX 11, 源库是noarchivelog read-only database open mode时备份,在目标库(其它主机)还原时遇到 ora-1861, 错误很简单就是遇到了不标准的时间日期字符串,如2月30日,4月31日等。

, ,

Oracle 18.3 hidden undocumented parameter list

here is all of the Oracle 18c 18.3 on-premises hidden u […]

Troubleshoot 11.2.0.4 CRS stop fail, ora.asm resource “UNKNOWN”state

前几日朋友一套CRS停不下来,RAC版本是11.2.0.4, 停在关闭ASM阶段, 手动尝试了停资源也不成功,使用-f选项一样失败, 查看ora.asm资源当前是UNKNOWN状态.

,

Troubleshoot DDL递归SQL触发的row cache lock deadlock(死锁)

两个同时启动的JOB, truncate 了不同的对象DDL, 递归触发了DDL trigger的审计操作,在insert DDL日志表时,遇到了回收站空间再利用,再次递归触发了drop table BIN$ purge, 又属于DDL操作, 并且申请的回收站对象的row cache enqueue时,在2个跨实例会话互相等待对方持有对象lock造成死锁

, ,

Oracle 12cR2 RAC新特性”fast index split wait” 引入gc index split transaction增长导致ora-4031

几日朋友有套数据库升级到oracle 12C r2后出现了ORA-4031, 是一套on Linux x86 64-bit 2节点的RAC数据库,Hard parse并不高,并且没有使用AMM, ASMM。SGA分配80G, shared pool固定在13Gb.”gc index split transaction”也是在持续增长,符合bug 27163928.

, ,

oracle 12c等待事件Failed Logon Delay

Oracle 12C R2的AWR top event是”Failed Logon Delay”, 发现12c 在安全方面又有几个参数的变化,这个等待事件常常是因为有程序尝试使用错误的用户密码登录数据库, 如暴力破解程序.

, ,

案例: checkpoint hang等待log file switch(checkpoint incomplete) 11.2.0.4 on Solaris OS 5.11

前段时间遇到的一个案例,朋友开始给我说是数据库连接数很高,让我帮分析一下。这是一套 11.2.0.4 2nodes RAC on Sun OS 5.11环境,大多数会话等待enq: sq – contention, log file switch (checkpoint incomplete) , checkpoint 无法完成…

,