25.6.3.2 NDB 集群日志事件
日志事件报告在事件日志中具有以下格式:
datetime [string] severity -- message
例如:
09:19:30 2005-07-24 [NDB] INFO -- Node 4 Start phase 4 completed
本节讨论所有可报告的事件,按类别和严重性级别排序。
在事件描述中,GCP 和 LCP 分别表示“全局检查点”和“本地检查点”。
这些事件与集群节点之间的连接相关。
表25.28:与集群节点之间连接相关的事件
Event | Priority | Severity Level | Description |
---|---|---|---|
Connected |
8 | INFO |
数据节点已连接 |
Disconnected |
8 | ALERT |
数据节点已断开连接 |
CommunicationClosed |
8 | INFO |
SQL 节点或数据节点连接关闭 |
CommunicationOpened |
8 | INFO |
SQL 节点或数据节点连接打开 |
ConnectedApiVersion |
8 | INFO |
使用 API 版本的连接 |
显示的日志消息与检查点相关。
表25.29:与检查点相关的事件
Event | Priority | Severity Level | Description |
---|---|---|---|
GlobalCheckpointStarted |
9 | INFO |
GCP 开始:redo日志写入磁盘 |
GlobalCheckpointCompleted |
10 | INFO |
GCP 完成 |
LocalCheckpointStarted |
7 | INFO |
LCP 开始:数据写入磁盘 |
LocalCheckpointCompleted |
7 | INFO |
LCP 完成正常 |
LCPStoppedInCalcKeepGci |
0 | ALERT |
LCP 停止 |
LCPFragmentCompleted |
11 | INFO |
LCP 在一个分片上已经完成 |
UndoLogBlocked |
7 | INFO |
UNDO 记录被阻塞;缓冲区近似溢出 |
RedoStatus |
7 | INFO |
redo 状态 |
以下事件在节点或集群启动时生成,以响应成功或失败。它们还提供了关于启动进程的信息,包括与日志活动相关的信息。
表25.30:节点或集群启动相关事件
Event | Priority | Severity Level | Description |
---|---|---|---|
NDBStartStarted |
1 | INFO |
数据节点启动阶段开始(所有节点启动) |
NDBStartCompleted |
1 | INFO |
启动阶段完成,所有数据节点 |
STTORRYRecieved |
15 | INFO |
块在重启完成后接收 |
StartPhaseCompleted |
4 | INFO |
数据节点启动阶段 X 完成 |
CM_REGCONF |
3 | INFO |
节点已经成功加入集群;显示节点、管理节点和动态ID |
CM_REGREF |
8 | INFO |
节点被拒绝加入集群;不能在集群中加入,因为配置错误、无法建立通信或其他问题 |
FIND_NEIGHBOURS |
8 | INFO |
显示邻近数据节点 |
NDBStopStarted |
1 | INFO |
数据节点关闭已启动 |
NDBStopCompleted |
1 | INFO |
数据节点关闭完成 |
NDBStopForced |
1 | ALERT |
强制关闭数据节点 |
NDBStopAborted |
1 | INFO |
无法正常关闭数据节点 |
StartREDOLog |
4 | INFO |
新 redo 日志启动;GCI 保持 X ,最新可恢复的 GCI Y |
StartLog |
10 | INFO |
新日志启动;日志部分 X ,开始 MB Y ,停止 MB Z |
UNDORecordsExecuted |
15 | INFO |
Undo 记录执行 |
StartReport |
4 | INFO |
报告启动 |
LogFileInitStatus |
7 | INFO |
日志文件初始化状态 |
LogFileInitCompStatus |
7 | INFO |
日志文件完成状态 |
StartReadLCP |
10 | INFO |
开始读取本地检查点 |
ReadLCPComplete |
10 | INFO |
读取本地检查点完成 |
RunRedo |
8 | INFO |
运行 redo 日志 |
RebuildIndex |
10 | INFO |
重建索引 |
在重启节点时生成的事件与节点重启过程的成功或失败相关。
表25.31:关于重启节点的事件
Event | Priority | Severity Level | Description |
---|---|---|---|
NR_CopyDict |
7 | INFO |
字典信息复制完成 |
NR_CopyDistr |
7 | INFO |
分布信息复制完成 |
NR_CopyFragsStarted |
7 | INFO |
开始复制碎片 |
NR_CopyFragDone |
10 | INFO |
复制一个碎片完成 |
NR_CopyFragsCompleted |
7 | INFO |
复制所有碎片完成 |
NodeFailCompleted |
8 | ALERT |
节点故障阶段完成 |
NODE_FAILREP |
8 | ALERT |
报告节点失败 |
ArbitState |
6 | INFO |
Report whether an arbitrator is found or not; there are seven different possible outcomes when seeking an arbitrator, listed here:
|
ArbitResult |
2 | ALERT |
Report arbitrator results; there are eight different possible results for arbitration attempts, listed here:
|
GCP_TakeoverStarted |
7 | INFO |
GCP.takeover开始 |
GCP_TakeoverCompleted |
7 | INFO |
GCP.takeover完成 |
LCP_TakeoverStarted |
7 | INFO |
LCP.takeover开始 |
LCP_TakeoverCompleted |
7 | INFO |
LCP.takeover完成(状态=X ) |
ConnectCheckStarted |
6 | INFO |
连接检查开始 |
ConnectCheckCompleted |
6 | INFO |
连接检查完成 |
NodeFailRejected |
6 | ALERT |
节点故障阶段失败 |
以下事件是统计性质的。它们提供了关于事务和其他操作的信息,例如每个节点发送或接收的数据量,以及内存使用情况。
表25.32:统计性质事件
Event | Priority | Severity Level | Description |
---|---|---|---|
TransReportCounters |
8 | INFO |
报告事务统计信息,包括事务数、提交数、读取数、简单读取数、写入数、并发操作数、属性信息和中止数 |
OperationReportCounters |
8 | INFO |
操作数量 |
TableCreated |
7 | INFO |
报告创建的表数 |
JobStatistic |
9 | INFO |
内部作业调度统计信息的平均值 |
ThreadConfigLoop |
9 | INFO |
线程配置循环次数 |
SendBytesStatistic |
9 | INFO |
平均字节传输到节点X |
ReceiveBytesStatistic |
9 | INFO |
从节点X 接收的平均字节数 |
MemoryUsage |
5 | INFO |
数据和索引内存使用(80%,90%和100%) |
MTSignalStatistics |
9 | INFO |
多线程信号 |
这些事件与 NDB 集群架构操作相关。
表25.33:NDB 集群架构操作事件
Event | Priority | Severity Level | Description |
---|---|---|---|
CreateSchemaObject |
8 | INFO |
架构对象创建 |
AlterSchemaObject |
8 | INFO |
架构对象更新 |
DropSchemaObject |
8 | INFO |
架构对象删除 |
这些事件与集群错误和警告相关。出现其中之一或多个通常表明发生了严重的故障或失败。
表25.34:集群错误和警告事件
Event | Priority | Severity Level | Description |
---|---|---|---|
TransporterError |
2 | ERROR |
传输器错误 |
TransporterWarning |
8 | WARNING |
传输器警告 |
MissedHeartbeat |
8 | WARNING |
节点X 错过心跳次数Y |
DeadDueToHeartbeat |
8 | ALERT |
节点 X 因为missed heartbeat被声明为“死亡” |
WarningEvent |
2 | 警告 |
常规警告事件 |
SubscriptionStatus |
4 | 警告 |
订阅状态变化 |
这些事件提供了集群的状态信息和与Cluster维护相关的活动信息,例如日志记录和心跳传输。
表25.35:信息事件
Event | Priority | Severity Level | Description |
---|---|---|---|
SentHeartbeat |
12 | 信息 |
发送心跳 |
CreateLogBytes |
11 | 信息 |
创建日志:日志部分、日志文件、大小(MB) |
InfoEvent |
2 | 信息 |
常规信息事件 |
EventBufferStatus |
7 | 信息 |
事件缓冲区状态 |
EventBufferStatus2 |
7 | 信息 |
改进的事件缓冲区状态信息 |
SentHeartbeat
事件仅在 NDB 集群编译时启用了 VM_TRACE
时可用。
这些事件与单用户模式的进入和退出相关。
这些事件提供了备份创建或恢复的信息。
表25.37:备份事件
Event | Priority | Severity Level | Description |
---|---|---|---|
BackupStarted |
7 | 信息 |
备份开始 |
BackupStatus |
7 | INFO |
备份状态 |
BackupCompleted |
7 | INFO |
备份完成 |
BackupFailedToStart |
7 | ALERT |
备份启动失败 |
BackupAborted |
7 | ALERT |
用户中止备份 |
RestoreStarted |
7 | INFO |
从备份开始恢复 |
RestoreMetaData |
7 | INFO |
恢复元数据 |
RestoreData |
7 | INFO |
恢复数据 |
RestoreLog |
7 | INFO |
恢复日志文件 |
RestoreCompleted |
7 | INFO |
从备份完成恢复 |
SavedEvent |
7 | INFO |
事件保存成功 |