ANBOB – Page 10 – 提供综合数据库运维服务与优化方案(不限Oracle MySQL PG GaussDB GoldenDB OceanBase等), 微信/Tel:(+86)134-365-60330

How to reduce space of the largest object （table system.logmnr_restart_ckpt$）in System Tablespace

2024-10-102024-10-10 by weejar zhang

Today, I noticed that the customer’s system tablespace usage is quite large, currently around 3.5TB. The largest object is the system.Logmnr_restart_ckpt$ table, which is already close to 2TB in size. The next largest is the aud$unified table used for unified auditing. In my blog yesterday 《Know more about Unified Auditing in Oracle 19c》

Know more about Unified Auditing in Oracle 19c

2025-07-102024-10-09 by weejar zhang

Today, a customer encountered a database issue in an Oracle 19c 4-node RAC environment on an Oracle Exadata machine. The database is experiencing a high number of active sessions—thousands in total—indicating waits for ‘enq: hw contention’ and ‘enq: tx contention.’ The blocked business session is executing the SQL statement “insert into AUD$UNIFIED…,” related to unified auditing of the database

如何查看ocenabase的冻结、转储、合并?

2024-10-082024-10-07 by weejar zhang

在OceanBase数据库中，有多种维护操作用于确保数据的一致性和提高性能，其中包括冻结（Freeze）、转储（Dump）和合并（Merge）。这些操作对于数据库的健康运行至关重要。下面分别介绍如何查看这些操作的状态和相关信息。

How to diagnose slow performance or long execution times with Oracle Data Pump (expdp)?

2024-10-06 by weejar zhang

You can easily track the duration of each export/import operation by directing the export/import job to write timestamps to the logfile using the LOGTIME parameter. For more details, refer to Expdp/Impdp LOGTIME.

However, simply having this information alone is often insufficient, even if you know there was a version or operating system change. What’s really needed to diagnose or analyze performance is concrete data—and that’s where the METRICS and LOGTIME parameters come in handy.

Troubleshooting ‘local write wait’ wait event during Truncate table

2024-10-01 by weejar zhang

I have seen problems with Local Write Wait in the Oracle database, normal tables in the databases were being used for temporary working storage before that data was then written to another table. The content of the working storage tables was then cleared out by periodically truncating them.

如何修复损坏的数据库 PostgreSQL？

2024-09-28 by weejar zhang

在PostgreSQL有可能因为硬件(磁盘控制器或某些内存)或bug等未知原因，导致数据文件的page corrupted损坏,只限于少数页面，有没有办法从部分损坏的 Postgres DB 中恢复数据？
psql: FATAL: could not read block 0 in file “base/xxxx/xxxx”: read only 0 of 8192 bytes.
—
ERROR: invalid page in block xxxxxx of relation base/xxxx/xxxx

聊聊Oceanbase的悬挂事务 suspend_transaction

2025-06-192024-09-23 by weejar zhang

事务按照执行的时间和状态可以分为其他事务、长事务、悬挂事务三种。其中长事务和悬挂事务会导致资源长时间不释放，等待会话长时间被阻塞，“悬挂事务”通常指的是那些未能正常结束的事务，已进入到提交阶段(事务阶段主要有包含初始化、prepare、SQL执行、Commit、Clear)，并且事务的提交时间超过一定阈值的事务, 即事务既没有被”完全”提交（COMMIT）/回滚（ROLLBACK），这类事务处于未完成状态，可能会占用数据库资源，并对后续的事务处理产生影响。需要重点关注这类异常的事务。

Oceanbase 存储空间使用率高统计分析方法

2024-09-182024-09-17 by weejar zhang

在Oceanbase数据库日常运维中，像oracle一样数据库的存储空间当到在上限时会在日志或ocp中提示预警，可能磁盘空间物理大小限制或DB参数限制，分析空间不足的原因在分布式数据库OCEANBASE中相比ORACLE要复杂一些，如何查看当前的使用大小？是哪一类文件占用较大？如果是temp文件是DDL 还是SQL 查询产生的？有没有可能temp文件泄露没有释放？如何定位temp使用高？本篇仅记录一些方法

在PostgreSQL中主键使用 UUIDs vs. bigserial

2024-09-14 by weejar zhang

在关系型数据库中做为主键使用UUID还是整数序列是一直有人讨论的话题，在oracle、Postgresq、MySQL、Sql Server(GUID) 都有类似的对象，那应该使用整数（ serials， sequences）还是 UUID 作为主键？在大数据集时性能上存在一些差异，同时还有一些安全因素。

坑: openGauss/GaussDB CM管理文件系统使用率超过85% 进入事务只读

2024-09-13 by weejar zhang

最近，一位使用 openGauss 数据库的客户遇到了一个突发情况：应用程序突然无法处理事务，并在应用日志中报错： ERROR: cannot execute CREATE TABLE in a read-only transaction，经过分析，发现这是由于数据库的 CM（Cluster Manager）集群管理软件触发了某种保护机制所致。这种情况令人费解，在 Oracle 数据库中即使文件存储空间耗尽也仅在alert log中打印错误信息，或有些OS资源使用高在RAC时会在LMHB日志中提示, 而不是直接将业务置为只读模式，从而广泛影响应用。

Migrate oracle to openGauss/oceanbase/达梦/kingbase： md5 function

2024-09-13 by weejar zhang

在十年前简单测试过oracle 9i 的加密解密用法之dbms_obfuscation_toolkit(二)，其中有md5单向加密，最近在oracle迁移到opengauss项目中用到了md5，这里简单记录替换方案，在pg或og中直接就有md5 function. 在mysql及Mysql系的产品和ocenabse, 达梦一样存在该函数md5。

openGauss ERROR: current user does not have privilege to role XXX 解决方案

2024-09-11 by weejar zhang

在openGauss 数据库中如果存在多个用户如A和B，希望B用户可以在用户A的同名schema下创建table对象，需要授权给用户B，在oracle中如create any table的系统权限或者是user Proxy 高级用法，在我之前的笔记Oracle 23c 几个开发相关新特性中,在oracle 23c 才引入grant xx ON SCHEMA xx to xx的语法，就是这样的功能在openGauss中有不同的用法。今天在一个项目遇到了这个问题，下面演示一下这个情况。

Migrate oracle to openGauss： dbms_crypto.encrypt /decrypt functions

2024-09-112024-09-10 by weejar zhang

在oracle迁移opengauss数据库时，可能会遇到在oracle数据库中使用dbms_crypto 加密的数据 ,在目标数据库opengauss有时也不需要完全等同，仅实现加密功能即可，需要我们改写对应的存储过程，或自定义包装function, 也需要合理规划数据迁移的一些方法，比如需要先解密，在目标库重新加密，尤其是加密方法不同，避免迁移源加密数据到目标库后无法解密，当然如果应用层能实现加密功能那是极好的

Migrate oracle to openGauss： cast_to_raw/cast_to_varchar2 & base64_encode/base64_decode functions

2026-05-282024-09-09 by weejar zhang

我和我们的团队最近在迁移oracle到openGauss（postgresql）时现在有一些存储过程中使用了加密函数，其中有一些涉及到编码的package 如utl_i18、utl_raw、utl_encode，对一些明文数值进行raw或base64编码，这里记录一下oracle到opengauss后对应的函数实现, 基本也适用于postgresql，下一篇会记录加密函数。

Oracle迁移openGauss/PostgreSQL注意事项：java代码中的setDouble、setFloat会导致全表扫描

2024-09-062024-09-06 by weejar zhang

近几年XC的快速推荐，我和我的团队一直在努力做从 Oracle 迁移到国产数据库的工作，其中国产数据库像基于postgreSQL的kingbase/highgo等，还是opengauss等下游发行版产品，因为得于pg的优化器或对oracle的兼容性，在传统企业也广泛应用，企业应用程序像java开发的颇多，而java代码中对于数字的变量赋值的数据类型有多种，在postgresql/openGauss系的数据库与oracle存在差异，可能会导致PostgreSQL JDBC 驱动程序不像 Oracle JDBC 驱动程序那样转换该数据类型。数据类型不匹配的结果最终在 PostgreSQL系中是全表扫描，而不像oracle中的使用索引，导致SQL性能变差，下面做个演示

Kingbase( PostgreSQL) 使用 “ON CONFLICT” /Merge 减少vacuum死元组量

2024-09-06 by weejar zhang

我们的一位客户的计费系统大量依赖于Oracle数据库的主键（PK）进行去重操作，且其事务频率极高。基于ORA-1报错的编程习惯，这种业务逻辑在Oracle环境下虽然运作尚可，但并不理想。近年来，我一直从事Oracle数据库迁移到国产数据库的咨询、评估及实施工作。在此过程中，我习惯考虑各种场景，这就像在使用一些老品牌的汽车时，虽然耐用性强，但如果换成国产汽车，可能就会遇到不同的问题。若前期考虑不周，类似的场景切换到国产数据库后，可能会出现意想不到的困难。

v$active_session_history slow, 如何查询v$fixed_view_definition中的全文本？

2024-09-062024-09-05 by weejar zhang

最近一个客户oracle数据库中大量的活动会话在查询v$active_session_history, 原因是一个监控软件的刷新ASH数据，但是该SQL正常也都是秒回，该数据库一次查询近6分钟，好奇要分析一下这个案例，但因为客户环境无法远程，所以无分析过程，这里记录我的分析思路，同时在分析v$active_session_history 发现取完整的SQL定义并不是很容易，记录oradebug peek , objdump, gdb等方式读取内存中FIXED VIEW定义的方法。

MySQL Estimate of the duration of a rollback operation(估算rollback事务回滚剩余时间)

2024-09-03 by weejar zhang

很久以前记录过一篇 Oracle Estimate of the duration of a rollback operation (估算rollback事务回滚剩余时间) ，oracle的大事务cancel或kill后的回滚操作，rollback所花费的时间通常比原来的操作还要长，而且在回滚完成前有可能会堵塞其它事务，在PostgreSQL中因为没有使用undo而是多版本，所以忽略rollback的时间，这是PG的强项，但是在MySQL中和oracle一样同样存在回滚问题，这里简单记录如何估算MySQL中的事务回滚时间。

openGauss Connecting to database FATAL : no pg_hba.conf entry for host”x.x.x.x”, user”xxx”, database”postgres”, SSL off

2024-08-31 by weejar zhang

一个客户应用原来直接使用opengauss 驱动连接正常，但是出于加密的应用需求，外包了一层增加了应用驱动，在连接串不变前提下，连接数据库报错：
Error Connecting to database FATAL : no pg_hba.conf entry for host”x.x.x.x”, user”weejar”, database”postgres”, SSL off

Troubleshooting Oracle RAC hang due to DBreplay capture write wcr file on NFS

2024-09-072024-08-31 by weejar zhang

我之前写过一篇关于的文章。在将 Oracle 迁移到国产数据库的过程中，为了进行负载重演，一些国产数据库需要在 Oracle 源库上进行 DBReplay 的 capture。然而，这种操作对源生产环境会带来一定风险，不仅有 license 商务风险，还存在可用性风险，比如空间或性能问题。在之前的文档中，我建议将 capture 产生的 WCR rec 文件存储在高吞吐量且稳定的文件系统设备上。然而还是因为没有足够的重视wcr文件存储，最近还是因为 WCR 文件存放在NFS写入问题，导致了源数据库的全库 hang 死等重大故障。这里简单记录一下这个事件。