MySQL 8.3 Release Notes
以下表格列出了最常见的 NDB
集群日志消息。有关集群日志、日志事件和事件类型的信息,请参阅 第 25.6.3 节,“NDB 集群中的事件报告”。这些日志消息也对应于 MGM API 中的日志事件类型;请参阅 Ndb_logevent_type 类型,以获取与 Cluster API 开发人员相关的信息。
表 25.53 常见 NDB 集群日志消息
Log Message | Description | Event Name | Event Type | Priority | Severity |
---|---|---|---|---|---|
Node |
节点 ID 为 node_id 的数据节点已经连接到管理服务器(节点 mgm_node_id )。 |
Connected |
Connection |
8 | INFO |
Node |
节点 ID 为 data_node_id 的数据节点已经从管理服务器(节点 mgm_node_id )断开连接。 |
Disconnected |
Connection |
8 | ALERT |
Node |
节点 ID 为 api_node_id 的 API 节点或 SQL 节点不再与数据节点 data_node_id 通信。 |
CommunicationClosed |
Connection |
8 | INFO |
Node |
节点 ID 为 api_node_id 的 API 节点或 SQL 节点现在正在与数据节点 data_node_id 通信。 |
CommunicationOpened |
Connection |
8 | INFO |
Node |
节点 ID 为 api_node_id 的 API 节点已经连接到管理节点 mgm_node_id ,使用 NDB API 版本 version (通常与 MySQL 版本号相同)。 |
ConnectedApiVersion |
Connection |
8 | INFO |
Node |
全局检查点 ID 为 gci 的全局检查点已经启动;节点 node_id 是负责该全局检查点的主节点。 |
GlobalCheckpointStarted |
Checkpoint |
9 | INFO |
Node |
全局检查点 ID 为 gci 的全局检查点已经完成;节点 node_id 是负责该全局检查点的主节点。 |
GlobalCheckpointCompleted |
Checkpoint |
10 | INFO |
Node |
节点 node_id 上的本地检查点序列 ID 为 lcp 的本地检查点已经启动。最新的 GCI 可以用于恢复的索引为 current_gci ,而最旧的 GCI 可以从中恢复的索引为 old_gci 。 |
LocalCheckpointStarted |
Checkpoint |
7 | INFO |
Node |
节点 node_id 上的本地检查点序列 ID 为 lcp 的本地检查点已经完成。 |
LocalCheckpointCompleted |
Checkpoint |
8 | INFO |
Node |
节点无法确定最新的可用 GCI。 | LCPStoppedInCalcKeepGci |
Checkpoint |
0 | ALERT |
Node |
节点 node_id 上的表碎片已经被 checkpoint 到磁盘。正在进行的 GCI 的索引为 started_gci ,而最新完成的 GCI 的索引为 completed_gci 。 |
LCPFragmentCompleted |
检查点 |
11 | INFO |
Node |
Undo 日志记录被阻止,因为日志缓冲区即将溢出。 | UndoLogBlocked |
Checkpoint |
7 | INFO |
Node |
数据节点 node_id ,运行 NDB 版本 version ,正在启动过程中。 |
NDBStartStarted |
StartUp |
1 | INFO |
Node |
数据节点 node_id ,运行 NDB 版本 version ,已经成功启动。 |
NDBStartCompleted |
StartUp |
1 | INFO |
Node |
节点已经收到集群重启完成的信号。 | STTORRYRecieved |
StartUp |
15 | INFO |
Node |
节点已经完成启动阶段 phase 的 type 启动。有关启动阶段的列表,请参阅 第 25.6.4 节,「NDB 集群启动阶段概述」。(type 是 initial 、system 、node 、initial node 或 <Unknown> 之一。) |
StartPhaseCompleted |
StartUp |
4 | INFO |
Node |
节点 president_id 已经被选为「总统」。 own_id 和 dynamic_id 应该总是与报告节点的 ID (node_id ) 相同。 |
CM_REGCONF |
StartUp |
3 | INFO |
Node |
报告节点(ID node_id )无法接受节点 president_id 作为总统。问题的原因是 cause ,可能是 Busy 、Election with wait = false 、Not president 、Election without selecting new candidate 或 No such cause 。 |
CM_REGREF |
StartUp |
8 | INFO |
Node |
节点已经发现集群中的邻居节点(节点 id_1 和节点 id_2 )。 node_id 、own_id 和 dynamic_id 应该总是相同的;如果它们不同,这表明集群节点的严重misconfiguration。 |
FIND_NEIGHBOURS |
StartUp |
8 | INFO |
Node |
节点已经收到关闭信号。关闭类型是 Cluster 或 Node 。 |
NDBStopStarted |
StartUp |
1 | INFO |
Node [, ] [Initiated by signal ] |
节点已经关闭。该报告可能包括一个 action ,如果存在,则是 restarting 、no start 或 initial 。该报告可能还包括对 NDB 协议 signal 的引用;有关可能的信号,请参阅 Operations and Signals。 |
NDBStopCompleted |
StartUp |
1 | INFO |
Node [, action ]. [Occurred during startphase ] [ Initiated by ] [Caused by error [(extra info ]] |
节点已经被强制关闭。随后采取的操作(如果有的话)也将被报告。如果节点是在启动过程中关闭的,那么报告将包括失败的阶段。如果这是由于发送给节点的信号所致,这些信息也将被提供(参见Operations and Signals,以获取更多信息)。如果错误导致的失败是已知的,也将被包括;有关NDB 错误消息和分类的更多信息,请参见NDB Cluster API Errors。 |
NDBStopForced |
StartUp |
1 | ALERT |
Node |
节点关闭过程被用户中止。 | NDBStopAborted |
StartUp |
1 | INFO |
Node |
这报告了在节点启动期间引用的全局检查点。redo 日志在 keep_pos 之前的部分将被删除。last_pos 是数据节点参与的最后一个全局检查点;restore_pos 是用于恢复所有数据节点的全局检查点。 |
StartREDOLog |
StartUp |
4 | INFO |
startup_message [Listed separately; see below.] |
在不同的情况下可能会记录多种启动消息。这些消息将单独列出;参见第 25.6.2.2 节,“NDB 集群日志启动消息”。 | StartReport |
StartUp |
4 | INFO |
Node |
已经完成了对重新启动节点的数据字典信息的复制。 | NR_CopyDict |
NodeRestart |
8 | INFO |
Node |
已经完成了对重新启动节点的数据分布信息的复制。 | NR_CopyDistr |
NodeRestart |
8 | INFO |
Node |
已经开始将碎片复制到启动数据节点 node_id 。 |
NR_CopyFragsStarted |
NodeRestart |
8 | INFO |
Node |
已经将碎片 fragment_id 从表 table_id 复制到数据节点 node_id 。 |
NR_CopyFragDone |
NodeRestart |
10 | INFO |
Node |
已经完成了对重新启动数据节点 node_id 的所有表碎片的复制。 |
NR_CopyFragsCompleted |
NodeRestart |
8 | INFO |
Node |
数据节点 node1_id 已经检测到数据节点 node2_id 的失败。 |
NodeFailCompleted |
NodeRestart |
8 | ALERT |
All nodes completed failure of Node |
所有(剩余的)数据节点已经检测到数据节点 node_id 的失败。 |
NodeFailCompleted |
NodeRestart |
8 | ALERT |
Node failure of |
数据节点 node_id 的失败已经在 block NDB 内核块中检测到,块可以是 DBTC 、DBDICT 、DBDIH 或 DBLQH ;有关更多信息,请参阅 NDB 内核块 |
NodeFailCompleted |
NodeRestart |
8 | ALERT |
Node |
数据节点已经失败。其失败时的状态由仲裁状态代码 state_code 描述:可能的状态代码值可以在文件 include/kernel/signaldata/ArbitSignalData.hpp 中找到。 |
NODE_FAILREP |
NodeRestart |
8 | ALERT |
President restarts arbitration thread [state= or Prepare arbitrator node or Receive arbitrator node or Started arbitrator node or Lost arbitrator node or Lost arbitrator node or Lost arbitrator node |
这是集群中仲裁的当前状态和进度报告。node_id 是管理节点或 SQL 节点的节点 ID,作为仲裁者。state_code 是仲裁状态代码,如 include/kernel/signaldata/ArbitSignalData.hpp 中所定义的。当出现错误时,将提供一个 error_message ,也定义在 ArbitSignalData.hpp 中。ticket_id 是仲裁者在选举过程中分配给所有参与节点的唯一标识符,以确保每个请求仲裁的节点都是参与选举过程的节点。 |
ArbitState |
NodeRestart |
6 | INFO |
Arbitration check lost - less than 1/2 nodes left or Arbitration check won - all node groups and more than 1/2 nodes left or Arbitration check won - node group majority or Arbitration check lost - missing node group or Network partitioning - arbitration required or Arbitration won - positive reply from node or Arbitration lost - negative reply from node or Network partitioning - no arbitrator available or Network partitioning - no arbitrator configured or Arbitration failure - |
这是仲裁结果的报告。在仲裁失败的情况下,将提供一个 error_message 和仲裁状态代码 state_code ,定义在 include/kernel/signaldata/ArbitSignalData.hpp 中。 |
ArbitResult |
NodeRestart |
2 | ALERT |
Node |
该节点正在尝试接管下一个全局检查点(即,它正在成为主节点) | GCP_TakeoverStarted |
NodeRestart |
7 | INFO |
Node |
该节点已经成为主节点,并且已经接管了下一个全局检查点 | GCP_TakeoverCompleted |
NodeRestart |
7 | INFO |
Node |
该节点正在尝试接管下一个本地检查点集(即,它正在成为主节点) | LCP_TakeoverStarted |
NodeRestart |
7 | INFO |
Node |
该节点已经成为主节点,并且已经接管了下一个本地检查点集 | LCP_TakeoverCompleted |
NodeRestart |
7 | INFO |
Node |
大约每 10 秒报告一次事务活动 | TransReportCounters |
Statistic |
8 | INFO |
Node |
大约每 10 秒报告一次该节点执行的操作数量 | OperationReportCounters |
Statistic |
8 | INFO |
Node |
已经创建了一个表,表 ID 如下所示 | TableCreated |
Statistic |
7 | INFO |
Node |
JobStatistic |
Statistic |
9 | INFO |
|
Mean send size to Node = |
该节点平均每次发送 字节 字节到节点 node_id |
SendBytesStatistic |
Statistic |
9 | INFO |
Mean receive size to Node = |
该节点平均每次从节点 node_id 接收 字节 数据 |
ReceiveBytesStatistic |
Statistic |
9 | INFO |
Node / Node |
当在集群管理客户端中发出 DUMP 1000 命令时生成此报告 |
MemoryUsage |
Statistic |
5 | INFO |
Node |
在与节点 node2_id 通信时发生传输器错误;有关传输器错误代码和消息的列表,请参阅 NDB 传输器错误,在 MySQL NDB 集群内部手册 中 |
TransporterError |
Error |
2 | ERROR |
Node |
在与节点 node2_id 通信时可能出现传输器问题的警告;有关传输器错误代码和消息的列表,请参阅 NDB 传输器错误,以获取更多信息 |
TransporterWarning |
Error |
8 | WARNING |
Node |
该节点从节点 node2_id 缺少心跳 |
MissedHeartbeat |
Error |
8 | WARNING |
Node |
该节点至少从节点 node2_id 缺少 3 次心跳,因此宣布该节点为“死亡” |
DeadDueToHeartbeat |
Error |
8 | ALERT |
Node |
该节点向节点 node2_id 发送心跳 |
SentHeartbeat |
Info |
12 | INFO |
Node |
在事件缓冲区使用率很高时,例如,在短时间内应用了许多更新时,会看到该报告;该报告显示事件缓冲区内存的使用情况、分配的字节数和可用百分比、最新的缓冲和消费 epoch;有关更多信息,请参阅 第 25.6.2.3 节,“事件缓冲区报告在集群日志中” | EventBufferStatus2 |
Info |
7 | INFO |
Node , Node , Node |
这些报告是在单用户模式下写入集群日志的;API_node_id 是拥有独占集群访问权的 API 或 SQL 的节点 ID(有关更多信息,请参阅 第 25.6.6 节,“NDB 集群单用户模式”);消息 Unknown single user report 表示错误已经发生,正常情况下不应该看到 |
SingleUser |
Info |
7 | INFO |
Node |
使用管理节点 mgm_node_id 启动了备份;该消息也将在集群管理客户端中显示,当 START BACKUP 命令被发出时;有关更多信息,请参阅 第 25.6.8.2 节,“使用 NDB 集群管理客户端创建备份” |
BackupStarted |
Backup |
7 | INFO |
Node |
备份拥有 ID backup_id 已经完成;有关更多信息,请参阅 第 25.6.8.2 节,“使用 NDB 集群管理客户端创建备份” |
备份完成 |
备份 |
7 | 信息 |
Node |
备份无法启动;有关错误代码,请参阅 MGM API 错误 | 备份无法启动 |
备份 |
7 | 警报 |
Node |
备份在启动后被终止,可能是由于用户干预 | 备份中止 |
备份 |
7 | 警报 |