ANBOB™

专业的Oracle及国产数据库选型咨询、案例培训、安装部署、迁移改造、故障诊断、性能优化、远程支持、紧急救援恢复等, QQ:85304522 微信/Tel:(+86)134-365-60330

MySQL8中ALGORITHM=INSTANT带来的风险小结

2023/03/23
MySQL
596 views
6 条评论

近日因为一个MySQL备份使用XtraBackup失败的问题，让我认识了一下MySQL的DDL中ALGORITHM=INSTANT算法，发现该问题引起的风险并不小这里整理一下，Oracle其实也一样，在不同的版本中有可能引入一些新特性同时，也可能引入一些风险bug,

ALGORITHM=INSTANT

Troubleshooting oracle 11.2.0.4 RAC crsd.bin is not running after replace VD and OCR(Storage device)

2023/03/13
ORACLE 9i-23c
310 views
Troubleshooting oracle 11.2.0.4 RAC crsd.bin is not running after replace VD and OCR(Storage device)已关闭评论

环境oracle 11.2.0.4 2-nodes RAC on linux, 客户做了存储设备更换，像RAC 依赖的设备VD/OCR 通过增加NEW ASM DISKGROUP方式替换，做完以后当时RAC资源都正常，此日重启CRS服务发现crsd.bin进程一直失败，两个节点相同CRS无法启动，CSSD、GIPC\GPNP均启动正常，但ASM实例启动正常，DB手动启动也可以正常open, 后分析crs日志发现crs为启动后crash，这里简单记录该问题。

crsd.bin start fail

Troubleshooting Oracle 11.2.0.4 高并发insert等待 ‘enq: HW – contention’后分配大量空extent

2023/03/10
ORACLE 9i-23c
132 views
Troubleshooting Oracle 11.2.0.4 高并发insert等待 ‘enq: HW – contention’后分配大量空extent已关闭评论

环境11.2.0.4 RAC，表空间耗尽大量insert并发等待enq: HW, 增加30数据文件后，但很快空间再次接近耗尽，后分析增长最大的segment时发现了新增加的数据文件被insert的segment分配大量extent，但都是unused block，存在重复提升High water Mark现象，通常extent是用完后再allocate new extent，这种大量创建空extent的现象属于软件bug.

enq: hw, enq: HW - contention

如何在麒麟Kylin Linux V10 SP1静默安装 Oracle 11g (11.2.0.4)单实例

2023/03/10
ORACLE 9i-23c, 系统相关
566 views
如何在麒麟Kylin Linux V10 SP1静默安装 Oracle 11g (11.2.0.4)单实例已关闭评论

最近信C进程加速，一些行业可能面临替换CentOS、RedHat linux的ZZ任务， Oracle可能还要3-4年的缓和期，当前Oracle官方在12c已经增加了对中标麒麟的认证，但目前没有任证的OS如果基于centOS的货也可以安装并运行生产环境，在Kylin V10安装了个单实例oracle 11.2.0.4还算不复杂，下面简单分享

Alert behavior changed from 11.2.0.4 “create or replace view” fail with ORA-01720

2023/03/09
ORACLE [C]系列, ORACLE 9i-23c
148 views
Alert behavior changed from 11.2.0.4 “create or replace view” fail with ORA-01720已关闭评论

今天有个同事咨询，发现在11.2.0.4以后的版本create or replace view 修改view 视图时，即使view owner当前用户是dba role也无法create or replace方式重建view，如当前用户u1把select on u1.t1 给u2（without grant option）, 用户u2创建 view 给了u3 select 查询. 按说u3对u1.t1是当前没有级联授权，所以u2在编辑view时会报错ORA-01720，而在11.2.0.3之前是正常编辑，但行为是不正确的, 从11.2.0.4以后已做修正。

Oracle 数据库安全性评估工具 (DBSAT) 小试

2023/03/07
ORACLE 9i-23c
224 views
Oracle 数据库安全性评估工具 (DBSAT) 小试已关闭评论

Oracle 数据库安全性评估工具Oracle Database Security Assessment Tool (DBSAT) 可提供专业建议，助您降低 Oracle 数据库的安全风险或漏洞威胁。使用 DBSAT，您可以通过数据库当前状态评估（包括配置）和敏感数据发现等功能，全面洞察数据库的安全和合规态势。DBSAT区分 Oracle on-premises 数据库、自治数据库（共享和专用）和 DBCS，根据数据库目标类型，DBSAT 执行不同的检查项

MySQL8 ‘show engine innodb status’ 显示 “Total large memory allocated 0”

2023/03/05
MySQL
282 views
MySQL8 ‘show engine innodb status’ 显示 “Total large memory allocated 0”已关闭评论

MySQL 中也有像oracle v$sysstat简化的实时监控InnoDB表内部计数器， MySQL 8.0.31 最新版有310多个计数器，使用show engine innodb status可以查看，但可读性并不好，有些版本显示内存总扩展为0错误。这个问题影响>= 8.0.27.

show engine innodb status

Troubleshooting Oracle 19c RAC ORA-29770 with LMD hang， LMHB terminating the instance

2023/03/05
ORACLE [C]系列, ORACLE 9i-23c
404 views
Troubleshooting Oracle 19c RAC ORA-29770 with LMD hang， LMHB terminating the instance已关闭评论

前段时间一个oracle 19c RAC 1个节点异常重启，日志显示是lmd进程hang 丢失heartbaet 超过70s， Lmhb进程重启了实例，操作系统资源空闲，从lmhb trace中确实lmd在做free memory的操作。

kjr_freeable_chunk_free, ORA-29770

Linux message show “systemd-logind: Failed to start user slice xx, The maximum number of pending replies per connection has been reached”

2023/02/28
系统相关
744 views
Linux message show “systemd-logind: Failed to start user slice xx, The maximum number of pending replies per connection has been reached”已关闭评论

最近操作系统的问题有点多，上周有套Oracle数据库RAC部分节点的日志在频繁输出“systemd-logind: Failed to start user slice user-1002.slice, ignoring: The maximum number of pending replies per connection has been reached (org.freedesktop.DBus.Error.LimitsExceeded)” 信息，找我协助分析一下。

replies per connection, systemd-logind

Exadata 故障3例:ORA-27302: failure occurred at: skgxpcnclrpc，内存耗尽，Cellserver disk error

2023/02/20
Exadata
251 views
Exadata 故障3例:ORA-27302: failure occurred at: skgxpcnclrpc，内存耗尽，Cellserver disk error已关闭评论

上周遇到几例Oracle Exadata Machine上的故障，简单记录一下问题现象，涉及db 实例重启失败报措OS资源相关skgxpcnclrpc，与内存耗尽后进程系统失败，IO hang/error , 及cell 存储节点坏盘日志的输出。

critical medium error, exadata, rwsem_down_read_failed, skgxpcnclrpc

How to diag High Memory Utilization on HP-UX ? (内存使用高)

2023/02/20
系统相关
162 views
How to diag High Memory Utilization on HP-UX ? (内存使用高)已关闭评论

ile cache用于缓存文件数据的最小和最大内存数量由可调的内核参数filecache_min(5)和filecache_max(5)控制。参数filecache_min指定的部分内存专门用于加速文件I/O活动。内存不能用于任何其他目的，即使它不需要缓存文件数据。参数filecache_max指定filecache的最大大小。

Troubleshooting Oracle RAC node OS shutdown (‘crsctl stop crs -f’) cause db instance stop on another node

2023/02/13
ORACLE [C]系列, ORACLE 9i-23c
460 views
Troubleshooting Oracle RAC node OS shutdown (‘crsctl stop crs -f’) cause db instance stop on another node已关闭评论

ORACLE 2-NODES RAC只关闭了node1上的db instace,当然此时业务不受影响，node2上的实例正常依旧可以对外提供服务， 1小时后OS组准备就绪，在节点1关闭操作系统，同步收到了业务无法访问，查看node2 db实例已自动shutdown, 其它资源正常，手动立即起动db实例2恢复业务，刺激，为什么停实例1 CRS会触发停实例2 的db instance?

crsctl stop crs -f, 备份, 备份一体机

Troubleshooting Oracle 19c sessions hang wait “enq: SS – contention” and “DFS lock handle” event

2023/02/09
ORACLE [C]系列, ORACLE 9i-23c
269 views
Troubleshooting Oracle 19c sessions hang wait “enq: SS – contention” and “DFS lock handle” event已关闭评论

背景是了解到当晚B库的节点1有大量的数据加载操作。实例2 FG 并行查询Sort segment allocations空间紧张，通知所有实例CIC 等待DFS LOCK HANDLE, 其它会话等它完成等ENQ SS, 而实例1一直未答复sort segment清理完成。因为 Sort Segments cleanup是后台进程SMON责任，实例1 DBW似乎在等SMON或DBW很忙未完成，TEMP表空间已大到1.5TB，

DFS lock handle, enq: SS - contention

Index Rebuild in Postgresql vs Oracle

2023/02/03
ORACLE 9i-23c, PostgreSQL/GaussDB
221 views
Index Rebuild in Postgresql vs Oracle已关闭评论

在关系型数据库中，索引是SQL查询性能优化的常用技术，mysql可能不会创建太大的数据库，但是pg和oracle表达到100G或TB以上时，慢查询可能会比较明显，需要考虑创建适当的索引，但随着时间的推移，索引可能需要一些维护来保持性能. 通常当涉及到表时更新时，Oracle管理UNDO的方式和PostgreSQL中的MVCC工作方式略有不同，然而索引仍然可能碎片化，因此需要重新构建。

12cR2 ASM start fail when using multiple private interconnects， HAIP issue

2023/02/01
ORACLE 9i-23c
447 views
12cR2 ASM start fail when using multiple private interconnects， HAIP issue已关闭评论

Oracle从11.2.0.2开始引入了一个新特性网络冗余技术HAIP。HAIP的目的用来代替操作系统级别的网卡绑定以实现Active-Active的模式进行数据传输。Oracle HAIP 支持多个私网，之前通常使用OS层的网卡绑定，但Oracle一直在希望使用自己的技术而不依赖其他，但HAIP存在较多bug，个人还是比较推荐OS bond网卡，这里简单记录一个案例，当使用2个HAIP网卡时，节点间HAIP 1缺失并且交叉在两个网卡上的，导致ASM无法启动。

PostgreSQL explain解析(一): buffers

2023/01/30
PostgreSQL/GaussDB
230 views
PostgreSQL explain解析(一): buffers已关闭评论

通过扩展EXPLAIN添加值来描述postgresql数据库中SQL的执行计划每个操作读/写的数据,需要使用ANALYZE参数，从Postgres 13开始，它可以额外报告planner的缓冲区使用情况。默认情况下，BUFFERS是关闭的。在更多的情况下，使用BUFFERS将极大地帮助我们理解内部发生了什么

buffers, explain

RMAN Fails With RMAN-20021: Database Not Set On Physical Standby

2023/01/28
ORACLE 9i-23c
183 views
RMAN Fails With RMAN-20021: Database Not Set On Physical Standby已关闭评论

前段时间一套11.2.0.4环境standby db因为password file问题与primary db产生了一个月的Archivelog GAP，修复密码文件后Standby已同步跟上Primary db ，但是原备份软件在Standby上的备份任务从那天起一直失败报错RMAN-20021

RMAN-20021, standby

2022年年终总结

2023/01/20
点滴岁月
144 views
2022年年终总结已关闭评论

Anbob建站跨进第14年年头，习惯性在次年春节前前总结一年的经历，这一年都很难，大疫三年，时间也不短，当家里的小孩儿都不再唱雇佣者，听我说谢谢你变成尬舞，临近年末宣布疫情新入新阶段，但也无奈有些人可能无法熬过这个春节，因为疫情影响实在太大，“二舅”可能都没冶好的矫情，在不断“续杯”疫情防控封小区囤菜打回现实，放开后报复性消费击倒了“海克斯科技”的冷静。

Oracle 12c后的安全增强查询sys.user$ ORA-01031

2023/01/12
ORACLE [C]系列, ORACLE 9i-23c
142 views
Oracle 12c后的安全增强查询sys.user$ ORA-01031已关闭评论

Oracle 12c后的安全增强可能会导致运维中出现些差异，如有时需要非sys用户查询sys的user$、link$等基表，这些表是因为存有password hash值，在之前一些安全部门查询是否有弱密码时喜欢采集user$，之前授权select any dictionary系统权限或dba role可以，但在是12c后增强不再允许，还有像Toad这种第三方工具如11.6的老版本在连接数据库时还以检测select any dictionary 判断user$权限也提示ORA-1031错误

AIX 平台分析TOP CPU使用进程ps和topas差异

2023/01/08
系统相关
203 views
AIX 平台分析TOP CPU使用进程ps和topas差异已关闭评论

近日一客户应用反馈数据库使用较慢，每个数据库的性能分析应该先从操作系统负载分析开始，当CPU耗尽时，其它指标可能失真变的没有意义，当系统缓慢时不应仅从DB里找原因，数据库中几乎无负载，查看OS层发现idle接近个位数，操作系统为AIX，从OS层定位top process的命令通常有topas, ps, vmstat,nmon -t等，发现ps和topas显示cpu占比存在较大差异，4%和90%. 简单记录一下。

第 8 页，共 68 页« 最近 «...6 789 10...20 30 40...»从前 »