Documentation Home
MySQL 8.4 Reference Manual
Related Documentation Download this Manual
PDF (US Ltr) - 39.8Mb
PDF (A4) - 39.9Mb
Man Pages (TGZ) - 257.9Kb
Man Pages (Zip) - 364.9Kb
Info (Gzip) - 4.0Mb
Info (Zip) - 4.0Mb


MySQL 8.4 Reference Manual  /  ...  /  NDB Cluster: Messages in the Cluster Log

25.6.2.1 NDB 集群:集群日志中的消息

以下表格列出了最常见的NDB集群日志消息。关于集群日志、日志事件和事件类型,请见第25.6.3节,“NDB 集群中的事件报告”。这些日志消息还对应于MGM API中的日志事件类型;见Ndb_ logevent_type 类型,了解Cluster API 开发人员感兴趣的相关信息。

表25.25:常见 NDB 集群日志消息

Log Message Description Event Name Event Type Priority Severity
Node mgm_node_id: Node data_node_id Connected 拥有节点 ID node_ id 的数据节点已经连接到管理服务器(节点mgm_node_id)。 Connected Connection 8 INFO
Node mgm_node_id: Node data_node_id Disconnected 拥有节点 ID data_node_id 的数据节点已经从管理服务器(节点mgm_node_id)断开连接。 Disconnected Connection 8 ALERT
Node data_node_id: Communication to Node api_node_id closed 拥有节点 ID api_node_id 的 API 节点或 SQL 节点已经不再与数据节点data_node_id通讯。 CommunicationClosed 连接 8 信息
Node data_node_id: Communication to Node api_node_id opened API 节点或 SQL 节点,拥有节点 ID api_node_id 正在与数据节点 data_node_id 通信。 通信打开 连接 8 信息
Node mgm_node_id: Node api_node_id: API version API 节点,拥有节点 ID api_node_id 已经连接到管理节点 mgm_node_id,使用 NDB API 版本 version(通常与 MySQL 版本号相同)。 连接API版本 连接 8 信息
Node node_id: Global checkpoint gci started 一个全局检查点,拥有 ID gci 已经启动;节点 node_id 是负责这个全局检查点的主节点。 全局检查点启动 检查点 9 信息
Node node_id: Global checkpoint gci completed 已经完成的全局检查点,拥有 ID gci;节点 node_id 是负责这个全局检查点的主节点。 全局检查点完成 检查点 10 信息
Node node_id: Local checkpoint lcp started. Keep GCI = current_gci oldest restorable GCI = old_gci 节点 node_id 上启动了具有序列 ID lcp 的本地检查点。最新可用的 GCI 索引为 current_gci,从而可以恢复的最老 GCI 索引为 old_gci LocalCheckpointStarted 检查点 7 INFO
Node node_id: Local checkpoint lcp completed 节点 node_id 上的本地检查点具有序列 ID lcp 已经完成。 LocalCheckpointCompleted 检查点 8 INFO
Node node_id: Local Checkpoint stopped in CALCULATED_KEEP_GCI 节点无法确定最新可用的 GCI。 LCPStoppedInCalcKeepGci 检查点 0 警告
Node node_id: Table ID = table_id, fragment ID = fragment_id has completed LCP on Node node_id maxGciStarted: started_gci maxGciCompleted: completed_gci 节点 node_id 上的表格碎片已经写入磁盘。当前进行中的 GCI 索引为 started_ gci,最新完成的 GCI 索引为 completed_gci LCPFragmentCompleted 检查点 11 INFO
Node node_id: ACC Blocked num_1 and TUP Blocked num_2 times last second undo 日志被阻塞,因为日志缓冲区即将溢出。 UndoLogBlocked 检查点 7 INFO
Node node_id: Start initiated version 数据节点 node_id,运行NDB版本version,正在启动其启动过程。 NDBStartStarted StartUp 1 INFO
Node node_id: Started version 数据节点 node_id,运行NDB版本version,已经成功启动。 NDBStartCompleted StartUp 1 INFO
Node node_id: STTORRY received after restart finished 节点已经接收到一个信号,表示集群重启已经完成。 STTORRYRecieved StartUp 15 INFO
Node node_id: Start phase phase completed (type) 节点已经完成了phase阶段的type启动。关于NDB集群启动阶段的列表,请见第25.6.4节,“NDB集群启动阶段总结”。(typeinitialsystemnodeinitial node<Unknown>之一。) StartPhaseCompleted 启动 4 INFO
Node node_id: CM_REGCONF president = president_id, own Node = own_id, our dynamic id = dynamic_id 节点 president_id 已被选为““总裁””。own_iddynamic_id 应该始终与报告节点的 ID (node_id) 相同。 CM_REGCONF 启动 3 INFO
Node node_id: CM_REGREF from Node president_id to our Node node_id. Cause = cause 报告节点(ID node_id) 无法接受节点 president_id 作为总裁。问题的原因是 Busy、Election with wait = false、Not president、Election without selecting new candidate 或 No such cause 之一。 CM_REGREF 启动 8 INFO
Node node_id: We are Node own_id with dynamic ID dynamic_id, our left neighbor is Node id_1, our right is Node id_2 节点已经发现了集群中的邻居节点(节点 id_1 和节点 id_2)。node_idown_iddynamic_id 应该始终相同;如果它们不同,这表明集群节点的严重配置错误。 FIND_NEIGHBOURS 启动 8 信息
Node node_id: type shutdown initiated 节点已经接收到关闭信号。关闭的类型是 either 集群节点 NDBStopStarted 启动 1 信息
Node node_id: Node shutdown completed [, action] [Initiated by signal signal.] 节点已经关闭。这份报告可能包括一个动作,如果存在,那么它将是 重启不启动初始 之一。报告也可能包括一个对NDB 协议的信号引用;关于可能的信号,请参阅操作和信号 NDBStopCompleted 启动 1 信息
Node node_id: Forced node shutdown completed [, action]. [Occurred during startphase start_phase.] [ Initiated by signal.] [Caused by error error_code: 'error_message(error_classification). error_status'. [(extra info extra_code)]] 节点已被强制关闭。随后可能采取的动作(其中之一为restartingno startinitial)也将报告。如果关闭发生在节点启动期间,该报告还将包括节点失败时的start_phase。如果这是由于向节点发送的signal导致的,这些信息也将提供(请参阅Operations and Signals,了解更多信息)。如果知道导致失败的错误,这也将包括;关于NDB错误消息和分类,请参阅NDB Cluster API Errors NDBStopForced StartUp 1 ALERT
Node node_id: Node shutdown aborted 用户终止了节点关闭过程。 NDBStopAborted StartUp 1 INFO
Node node_id: StartLog: [GCI Keep: keep_pos LastCompleted: last_pos NewestRestorable: restore_pos] 这报告了节点启动期间引用到的全局检查点。redo日志前的keep_ pos将被删除。last_pos是数据节点参与的最后一个全局检查点;restore_pos是实际用于恢复所有数据节点的全局检查点。 StartREDOLog StartUp 4 INFO
startup_message [Listed separately; see below.] 有多种可能的启动信息可以在不同的情况下被记录。这些信息单独列出;请参见第25.6.2.2节,“NDB Cluster Log Startup Messages” StartReport StartUp 4 INFO
Node node_id: Node restart completed copy of dictionary information 数据字典信息复制到重启节点已经完成。 NR_CopyDict NodeRestart 8 INFO
Node node_id: Node restart completed copy of distribution information 数据分布信息复制到重启节点已经完成。 NR_CopyDistr NodeRestart 8 INFO
Node node_id: Node restart starting to copy the fragments to Node node_id 将碎片复制到启动数据节点node_id开始了 NR_CopyFragsStarted NodeRestart 8 INFO
Node node_id: Table ID = table_id, fragment ID = fragment_id have been copied to Node node_id 从表table_id中碎片fragment_id复制到数据节点node_id已经完成 NR_CopyFragDone NodeRestart 10 INFO
Node node_id: Node restart completed copying the fragments to Node node_id 所有表碎片复制到重启数据节点node_id已经完成 NR_CopyFragsCompleted NodeRestart 8 INFO
Node node_id: Node node1_id completed failure of Node node2_id 数据节点node1_id检测到数据节点node2_id的故障 NodeFailCompleted NodeRestart 8 ALERT
All nodes completed failure of Node node_id 所有(剩余)数据节点都检测到数据节点node_id的故障 NodeFailCompleted NodeRestart 8 ALERT
Node failure of node_idblock completed 数据节点node_idNDB内核块中检测到故障,该块是DBTCDBDICTDBDIHDBLQH之一;欲知更多信息,请参阅NDB Kernel Blocks NodeFailCompleted NodeRestart 8 ALERT
Node mgm_node_id: Node data_node_id has failed. The Node state at failure was state_code 数据节点已故障。其在故障时的状态由仲裁状态代码state_code描述:可能的状态代码值可以在文件include/kernel/signaldata/ArbitSignalData.hpp中找到。 NODE_FAILREP NodeRestart 8 ALERT
President restarts arbitration thread [state=state_code] or Prepare arbitrator node node_id [ticket=ticket_id] or Receive arbitrator node node_id [ticket=ticket_id] or Started arbitrator node node_id [ticket=ticket_id] or Lost arbitrator node node_id - process failure [state=state_code] or Lost arbitrator node node_id - process exit [state=state_code] or Lost arbitrator node node_id - error_message [state=state_code] 当前集群仲裁状态报告。 node_id 是管理节点或 SQL 节点的 ID,选择为仲裁者的节点 ID。 state_code 是仲裁状态代码,见 include/kernel/signaldata/ArbitSignalData.hpp。当出现错误时,将提供一个 error_message,定义在 ArbitSignalData.hpp 中。 ticket_id 是仲裁者选择时向参与选择的所有节点分配的唯一标识符,这用于确保每个请求仲裁的节点都是参与选择过程中的节点。 仲裁状态 节点重启 6 信息
Arbitration check lost - less than 1/2 nodes left or Arbitration check won - all node groups and more than 1/2 nodes left or Arbitration check won - node group majority or Arbitration check lost - missing node group or Network partitioning - arbitration required or Arbitration won - positive reply from node node_id or Arbitration lost - negative reply from node node_id or Network partitioning - no arbitrator available or Network partitioning - no arbitrator configured or Arbitration failure - error_message [state=state_code] 这个消息报告仲裁结果。在仲裁失败时,将提供一个 error_message 和一个仲裁 state_code,定义在 include/kernel/signaldata/ArbitSignalData.hpp 中。 仲裁结果 节点重启 2 警告
Node node_id: GCP Take over started 这个节点正在尝试成为下一个全局检查点的负责人(即它将成为主节点) GCP_TakeoverStarted 节点重启 7 信息
Node node_id: GCP Take over completed 该节点已经成为主节点,并且承担了下一个全局检查点的责任 GCP_TakeoverCompleted NodeRestart 7 INFO
Node node_id: LCP Take over started 该节点正在尝试承担下一个本地检查点的责任(即它将成为主节点) LCP_TakeoverStarted NodeRestart 7 INFO
Node node_id: LCP Take over completed 该节点已经成为主节点,并且承担了下一个本地检查点的责任 LCP_TakeoverCompleted NodeRestart 7 INFO
Node node_id: Trans. Count = transactions, Commit Count = commits, Read Count = reads, Simple Read Count = simple_reads, Write Count = writes, AttrInfo Count = AttrInfo_objects, Concurrent Operations = concurrent_operations, Abort Count = aborts, Scans = scans, Range scans = range_scans 每隔约10秒,这个报告将提供事务活动的信息 TransReportCounters Statistic 8 INFO
Node node_id: Operations=operations 该节点每隔约10秒提供的操作数 OperationReportCounters Statistic 8 INFO
Node node_id: Table with ID = table_id created 具有显示的表ID的表已经被创建 TableCreated Statistic 7 INFO
Node node_id: Mean loop Counter in doJob last 8192 times = count JobStatistic Statistic 9 INFO
Mean send size to Node = node_id last 4096 sends = bytes bytes 该节点向节点node_id发送平均bytes字节 SendBytesStatistic 统计信息 9 INFO
Mean receive size to Node = node_id last 4096 sends = bytes bytes 该节点从节点node_id接收平均bytes字节数据 ReceiveBytesStatistic 统计信息 9 INFO
Node node_id: Data usage is data_memory_percentage% (data_pages_used 32K pages of total data_pages_total) / Node node_id: Index usage is index_memory_percentage% (index_pages_used 8K pages of total index_pages_total) 当在集群管理客户端中发出DUMP 1000命令时生成该报告 MemoryUsage 统计信息 5 INFO
Node node1_id: Transporter to node node2_id reported error error_code: error_message 与节点node2_id通信时发生了传输器错误;关于传输器错误代码和消息的列表,请参见NDB Transporter Errors,在MySQL NDB Cluster Internals Manual TransporterError 错误信息 2 ERROR
Node node1_id: Transporter to node node2_id reported error error_code: error_message 与节点node2_id通信时可能出现的传输问题警告;关于传输错误代码和消息,请见NDB 传输错误,了解更多信息。 TransporterWarning Error 8 警告
Node node1_id: Node node2_id missed heartbeat heartbeat_id 节点node2_id未发送心跳信号到本节点。 MissedHeartbeat Error 8 警告
Node node1_id: Node node2_id declared dead due to missed heartbeat 节点node2_id已missed至少3个心跳信号,本节点因此宣布该节点“死亡”。 DeadDueToHeartbeat Error 8 警告
Node node1_id: Node Sent Heartbeat to node = node2_id 本节点已发送心跳信号到节点node2_id SentHeartbeat Info 12 信息
Node node_id: Event buffer status (object_id): used=bytes_used (percent_used% of alloc) alloc=bytes_allocated max=bytes_available latest_consumed_epoch=latest_consumed_epoch latest_buffered_epoch=latest_buffered_epoch report_reason=report_reason 在事件缓冲区使用率高时,例如,在短时间内应用了许多更新操作时,这个报告将显示事件缓冲区内存的字节数和百分比、已分配的字节数和百分比,以及最新的缓冲和消费 epoch;更多信息,请见第25.6.2.3节,“事件缓冲区报告在集群日志中” EventBufferStatus2 Info 7 INFO
Node node_id: Entering single user mode, Node node_id: Entered single user mode Node API_node_id has exclusive access, Node node_id: Entering single user mode 这些报告将在进入和退出单用户模式时写入集群日志;API_node_id 是 API 或 SQL 对集群的独占访问节点 ID(更多信息,请见第25.6.6节,“NDB 集群单用户模式”);消息Unknown single user report API_node_id 表示错误已经发生并且在正常操作中应该从不出现 SingleUser Info 7 INFO
Node node_id: Backup backup_id started from node mgm_node_id 已经使用管理节点mgm_node_id启动备份,这个信息也将在集群管理客户端中显示,当执行START BACKUP命令时;更多信息,请见第25.6.8.2节,“使用 NDB 集群管理客户端创建备份” BackupStarted Backup 7 INFO
Node node_id: Backup backup_id started from node mgm_node_id completed. StartGCP: start_gcp StopGCP: stop_gcp #Records: records #LogRecords: log_records Data: data_bytes bytes Log: log_bytes bytes 拥有 ID backup_id 的备份已经完成;更多信息,请见第25.6.8.2节,“使用 NDB 集群管理客户端创建备份” BackupCompleted Backup 7 INFO
Node node_id: Backup request from mgm_node_id failed to start. Error: error_code 备份启动失败;错误代码,请见MGM API Errors BackupFailedToStart Backup 7 ALERT
Node node_id: Backup backup_id started from mgm_node_id has been aborted. Error: error_code 备份被终止,可能是由于用户干预 BackupAborted Backup 7 警报