扫码关注公众号
获取最新汽车动态
安全机制——看门狗(Watch Dog)
谈思汽车
2025-11-24 15:39:55
2020

01

什么是看门狗?

看门狗技术是20世纪80年代由美国半导体巨头AMD公司首次提出,是一种专门用于检测、记录处理器运行状况以及在异常情况下复位的一种技术,随着技术的不断的迭代,看门狗逐渐发展成一类专门的芯片,广泛应用于汽车、工业自动化、物联网等领域。

软件会在执行完特定指令后进行喂狗,若在一定周期内看门狗没有收到来自软件的喂狗信号,则认为系统故障,会进入中断处理程序或强制系统复位。系统上电后根据不同的工作模式可以选择使能看门狗,若看门狗被使能则计数器开始计数,如果在设定的时间内没有及时喂狗则会发生看门狗超时。通过寄存器对看门狗进行基本设置,计数器计算狗叫时间,狗叫模块决定看门狗超时后发出的中断或复位方式。

看门狗发展至今,功能已经发展的比较完善,所以已经有很多比较详细且角度不同的分类,例如按照种类分可以分为硬件看门狗和软件看门狗;按照与单片机集成性可以分为内部看门狗和外部看门狗;

1.TLF35584中集成的看门狗

以汽车产品中最通用的英飞凌的TLF35584芯片为例,该电源管理芯片通过了ISO26262的ASILD的认证,并且集成了看门狗模块,该看门狗模块既属于硬件看门狗,同时也属于外部看门狗。由Window Watchdog和Functional Watchdog组成,(后面简化成为WWD和FWD)

图片

Window Watchdog和Functional Watchdog

  1. 功能看门狗与窗口看门狗不同步,两者完全独立。

  2. 功能看门狗和窗口看门狗可以独立激活和禁用。

  3. 看门狗的结果(有效或无效触发)由相关看门狗故障计数器独立监控。

  4. 窗口看门狗的状态为WWO,其值可能为“有效WWD 触发”或“无效WWD 触发”

  5. 功能看门狗的状态为FWO,其值可能为“有效FWD 触发”或“无效FWD 触发”。

  6. 两个看门狗的设置对安全状态控制的影响在安全状态控制一章中进行了描述,以便更好地理解

02

Window Watchdog(WWD)

我们称作窗口看门狗或时间看门狗,首先被监控的控制器(MCU)必须在Open Window期间内触发(就是指喂狗操作),喂狗可以通过 WDI 引脚上的下降沿或通过 SPI 命令写入寄存器 WWDSCMD,具体取决于配置。触发后将终止“Open Window”。 看门狗输出指示 WWD 故障计数器的“有效”或“无效”WWD 触发。

如果有效触发,则启动“Closed Window”。如果在“Open Window”期间没有触发或在“Closed Window”期间触发,看门狗输出指示“无效 WWD 触发”到 WWD 失败计数器,并启动新的“Open Window”。

1.WWD工作状态图

图片

Window Watchdog State

  1. “触发”可以是发送到 WWDSCMD 寄存器的 SPI 命令,也可以是 WDI 引脚上的有效看门狗触发

  2. “Long open Window”中“No Trigger”被视为“无效WWD 触发”,看门狗会再次打开一个“Long Open Window”

  3. “Long open Window”内的“触发”被视为“有效 WWD 触发”,看门狗关闭“Long open Window”并打开“Closed Window”

  4. “CLosed Window”内的“触发”被视为“无效WWD触发”

  5. “Closed Window”结束后,“Closed Window”内的“无触发”会将看门狗移至“Open Window”。

  6. “Open Window”内的“触发”被视为“有效WWD 触发”,看门狗关闭“Open Window”并打开“Closed Window”

  7. “Open Window”中的“无触发”被视为“WWD 触发无效”。

2.WDI引脚触发WWD

看门狗输入引脚 WDI 具有集成的下拉电流  。 看门狗输入 WDI 可以在“Closed Window”内或随后的“Open Window”期间转换为高电平。

图片

WDI引脚

WD的有效触发信号

看门狗输入 WDI 以Tsaw周期定期采样。 有效触发信号是从Vwdi,高电平到Vwdi,低电平的下降沿。 为了提高 WDI 输入上的抗噪声或毛刺的能力,有效触发信号至少需要两个高采样点,然后是两个低采样点,通过测量低信号的第二个连续采样点来考虑有效触发。 例如,如果引脚 WDI 处的触发脉冲的前三个采样(两个高一个低)位于“关闭窗口”内,并且仅在“打开窗口”中采集第四个采样(第二个低采样),则看门狗 输出 WWO 将指示“有效 WWD 触发”。

WDI 触发无效

在“Open Window”期间未检测到触发信号或在“Closed Window”期间检测到触发信号,均视为无效触发。 看门狗输出 WDO 在“Open Window”期间无有效触发后立即指示“无效触发”,或者在“Closed Window”期间检测到触发信号后立即指示“无效触发”。

图片

WDI有效触发和无效触发

WWD正常工作——正确触发

图片

正确触发

  1. 如果 ROT(监控微控制器相关电压)的复位输出变高,则“Long Open Window”在 INIT 状态下启动。 如果窗口看门狗在睡眠状态下被停用,则第一个Open Window将从睡眠状态转换到唤醒状态(由中断指示)开始。 第一个Open Window的时间取决于配置的周期时间,为 600 ms (WDCYC = 1) 或 60 ms (WDCYC = 0)

  2. 在“Long Open Window”期间,预计会根据配置的触发选择有效触发 WWD。 “长Open Window”的最长时间是固定的,但一旦识别到“有效 WWD 触发”,它就会终止。

  3. 窗口看门狗现在将进入“Closed Window”。 收到第一个有效触发后,设备将被允许从 INIT 状态移至 NORMAL 状态或从 WAKE 状态移至 NORMAL 状态。

  4. “Closed Window”具有固定的持续时间  (可以通过SPI 命令确定)。 它在有效触发信号后立即启动,关闭“Open Window”或“长Open Window”。 在“Closed Window”期间不应施加触发信号。 不会检测到 WDI 引脚从低电平到高电平的转换,也不会导致触发事件,

  5. 有效的触发信号立即终止“Open Window”,因此“Open Window”的时间是可变的,并且取决于微控制器安排触发的时间。 这被视为“有效 WWD 触发”

WWD异常工作——在“Long Open Window”未触发

图片

在Long Open Window未触发

  1. 初始化超时和Long Open Window(LOW)具有相同的典型值。 长度。 通常这会导致初始化超时在低电平之前或同时完成,这将跳过中断事件 (1)。 尽管由于给定的精度,“Long Open Window”内缺少有效触发可能会在低电平结束后导致中断事件,从而使窗口看门狗故障计数器增加 2。

  2. INIT状态定时器第一次超时。 由于在 INIT 状态期间未按预期接收到窗口看门狗的有效触发,因此将发出所谓的“软复位”:引脚 ROT 变为零,但后置稳压器的输出电压保持开启状态。附加信息:如果窗口看门狗在接下来的 INIT 阶段的下一个“Long Open Window”内未正确触发,将发出“硬复位”,这意味着引脚 ROT 将变为零,并且输出电压将 也被关闭。 在 INIT 阶段第三次无效触发后,设备将进入 FAILSAFE 状态。

  3. 经过上电复位延迟时间trd后,所谓的“软复位”引脚ROT再次变高,看门狗打开一个“Long Open Window”,让微控制器有机会触发并同步到看门狗周期 。

  4. 有效触发终止“Long Open Window”,这使得“Long Open Window”的持续时间可变并取决于触发。 这被视为“有效 WWD 触发”并启动“Closed Window”。 在不发出中断的情况下,窗口看门狗故障计数器将减 1。

  5. 接下来的“Closed Window”持续时间  。 在此时间内触发将被视为“无效WWD触发”。

WWD异常工作——在“ Open Window”未触发

图片

在Open Window未触发

  1. “Open Window”内缺少有效触发,导致窗口结束后出现“无效 WWD 触发”。 该事件由中断指示,窗口看门狗故障计数器增加 2。

  2. 检测到“无效 WWD 触发”后,看门狗将启动一个持续时间为  的新“Open Window”,以使微控制器有机会触发并同步到看门狗周期。

  3. 有效触发终止“Open Window”,这使得“Open Window”的持续时间可变并取决于触发。 这被视为“有效 WWD 触发”并启动“Closed Window”。 在不发出中断的情况下,窗口看门狗故障计数器将减 1。

  4. 如果“Open Window”内出现多次“无效 WWD 触发”,窗口看门狗故障计数器将再次增加 2,直到达到配置的阈值。 在这种情况下,将发出重置命令。

  5. 接下来的“Closed Window”持续时间  。 在此时间内触发将被视为“无效WWD触发”。

引脚 ROT 的行为取决于 ΣWWO 的值。 在上面的例子中,假设无效触发不会导致超过阈值ΣWWO。

WWD异常工作——在初始化之后的“Closed Window”中错误的触发

图片

在CLosed Window中错误触发

  1. “Closed Window”期间的触发被指示为“无效WWD触发”。 该事件由中断指示,并且窗口看门狗故障计数器增加 2。

  2. “Closed Window”将因“WWD 触发无效”而关闭。 最初它会持续时间  。 错误触发终止“Closed Window”并启动“Open Window”,以使微处理器有机会同步到窗口看门狗周期。

  3. 在此“Open Window”内预计会发生有效触发。 有效的触发会终止“Open Window”,这使得“Open Window”的持续时间可变并取决于触发。 这被视为“有效 WWD 触发”并启动“Closed Window”。 在不发出中断的情况下,窗口看门狗故障计数器将减 1。

  4. 接下来的“Closed Window”持续时间  。 在此时间内触发将被视为“无效WWD触发”。

引脚 ROT 的行为取决于 ΣWWO 的值。 在上面的例子中,假设无效触发不会导致超过阈值ΣWWO。

WWD异常工作——在稳态“Closed Window”错误的触发

图片

在Close Window中错误的触发

  1. “Closed Window”期间的触发被指示为“无效WWD触发”。 该事件由中断指示,并且窗口看门狗故障计数器增加 2。

  2. “Closed Window”将因“WWD 触发无效”而关闭。 最初它会持续时间  。 错误触发终止“Closed Window”并启动“Open Window”,以使微处理器有机会同步到窗口看门狗周期。

  3. 在此“Open Window”内预计会发生有效触发。 有效的触发会终止“Open Window”,这使得“Open Window”的持续时间可变并取决于触发。 这被视为“有效 WWD 触发”并启动“Closed Window”。 在不发出中断的情况下,窗口看门狗故障计数器将减 1。

  4. 接下来的“Closed Window”持续时间  。 在此时间内触发将被视为“无效WWD触发”。

  5. 引脚 ROT 的行为取决于 ΣWWO 的值。 在上面的例子中,假设无效触发不会导致超过阈值ΣWWO。

03

Functional Watchdog(FWD)

我们称作功能看门狗或问答看门狗。 在稳定状态下,会生成一个问题(从表中取出),同时心跳计数器从零开始计数。 心跳计数器开始计数,直到心跳周期结束。 心跳周期的持续时间可以通过 SPI 命令进行设置和调整。

问题由 4 bits组成,预期答案由 4 个回复组成,每个回复为 8 位。 这四个回复应在心跳周期结束之前发送。 最后回复应写入同步回复寄存器以重置心跳计数器。

图片

Functional Watchdog的问题与回复

功能看门狗输出 FWO 是一个内部信号:它连接到 FWD 故障计数器。 功能看门狗 FWO 输出的值为“有效 FWD 触发”或“无效 FWD 触发”。

1.FWD工作流程图

图片

FWD工作流程图

步骤如下:

  1. 首先判断FWD是否使能;如果未使能,停止并清空心跳计数器值;如果使能,请跳至步骤2;

  2. 开启心跳计数器,并生成初始化问题;

  3. 设置response byte number为3,准备接受第一个回复;

  4. 等待回复值;

  5. 判断心跳计数器是否超时,如果超时,重置心跳计数器,FWD故障计数器加2,请跳至步骤4;如果未超时,请跳至步骤6;

  6. 判断新的回复值是否收到?如果未收到,请跳至步骤4;如果收到了,请跳至步骤7;

  7. 判断是否为最后一个回复?如果不是,将response byte number减1,请跳至步骤4;如果是,请跳至步骤8;

  8. 判断是否同步了回复?如果未同步,请跳至步骤9;如果同步了,重置心跳计数器,也请跳至步骤9;

  9. 判断回复是否正确?如果不正确,请跳至步骤10;如果正确,FWD故障计数器减1,生成新的问题,请跳至步骤3;

  10. 判断是否同步了回复?如果未同步,请跳至步骤3;如果同步了FWD故障计数器加2,也请跳至步骤3;

2.FWD正常工作——正确触发

图片

正确触发模式

步骤如下:

  1. 生成一个新问题,同时心跳计数器开始计数(假设之前发生过“有效 FWD 触发”)。

  2. 收到正确的回复(RESP3)

  3. 收到正确的回复(RESP2)

  4. 收到正确回复(RESP1)

  5. 收到正确的同步回复(RESP0)。 所有回复均正确,回复顺序正确,并且在心跳计数器溢出之前收到最后一个同步回复。 心跳计数器将被重置(设置为零)。 这被视为“有效 FWD 触发”,功能看门狗错误计数器 ΣFWO 减 1(如果功能看门狗错误计数器值大于零)。

  6. 生成一个新问题,同时心跳计数器开始计数。

3.FWD异常工作——同步丢失

图片

同步丢失

步骤如下:

  1. 生成一个新问题,同时心跳计数器开始计数(假设之前发生过“有效 FWD 触发”)。

  2. 收到正确的回复(RESP3)

  3. 收到正确的回复(RESP2)

  4. 收到正确回复(RESP1)

  5. 接收到正确的回复(RESP0),但未同步(写入错误的寄存器)。 到目前为止,所有回复都是正确的,回复顺序是正确的,并且在心跳计数器溢出发生之前收到了最后一个不同步的回复。 心跳计数器不会被重置并继续计数。 这被视为“有效 FWD 触发”,功能看门狗错误计数器 ΣFWO 减 1(如果功能看门狗错误计数器值大于零)。 生成了一个新问题。

  6. 心跳计数器仍在计数,等待新问题的回复。 心跳计数器将到期并发生溢出。 这被视为“无效 FWD 触发”。 这功能看门狗错误计数器 ΣFWO 加 2。心跳计数器复位。

  7. 心跳计数器开始计数。,不会产生新问题。

4.FWD异常工作——回答错误

图片

回答错误

步骤如下:

  1. 生成一个新问题,同时心跳计数器开始计数(假设之前发生过“有效 FWD 触发”)

  2. 收到正确的回复(RESP3)

  3. 收到正确的回复(RESP2)

  4. 收到错误回复(RESP1)

  5. 收到正确的回复(RESP0), 心跳计数器将被重置(设置为零), 完整的答案是不正确的。 这被视为“无效 FWD 触发”。 功能看门狗错误计数器 ΣFWO 加 2。心跳计数器复位。

  6. 没有生成新问题,但心跳计数器开始计数。

注意:如果将Resp2和Resp1混合在一起,则将两个回复视为不正确的,则必须按正确的顺序发送回复。

5.FWD异常工作——回复丢失

图片

回复丢失

步骤如下:

  1. 生成一个新问题,同时心跳计数器开始计数(假设之前发生过“有效 FWD 触发”)。

  2. 收到正确的回复(RESP3)

  3. 收到正确的回复(RESP2)

  4. 缺少回复(RESP1)

  5. 收到正确的回复(RESP0)。 因此,由于缺少回复(在此示例中为 RESP1),最后一个回复不是最后一个回复,而是倒数第二个回复。 功能看门狗将等待所有四个回复被写入,而心跳计数器继续计数。 所有四个回复没有固定时间,但必须在心跳计数器到期之前以正确的顺序发送。

  6. 由于缺少回复RESP1,完整答案不正确。 虽然最后的回复是同步的,但是心跳计数器不会被重置并继续计数,直到发生溢出。 这被视为“无效 FWD 触发”。 功能看门狗错误计数器 ΣFWO 加 2。心跳计数器复位。

  7. 不再生成新问题,心跳计数器开始计数。

04

为什么需要Watch Dog?

1.功能安全标准软件部分要求

首先在功能安全标准第6章,7.4.12中提到,应使用看门狗进行软件的时间监控和程序流监控。

图片

ISO26262标准第6章

2.功能安全标准硬件部分要求

在第5章的附录中,也提到了不同看门狗的功能和诊断覆盖率

图片

看门狗的诊断覆盖率

图片

功能安全标准

标准中分别介绍几种看门狗的目标和功能描述,我在这里归纳总结一下在ISO26262中,看门狗作为安全机制的一些用法和要求

图片

看门狗的作用


安全机制
看门狗(Watch Dog)
点赞 0
评论 0
收藏 0
[[ item.name ]]
[[ item.create_time ]]
点赞 [[ item.count_zan ]]
回复
[[ child.name ]]
[[ child.create_time ]]
回复 [[ child.reply_name ]][[ child.content ]]
点赞 [[ child.count_zan ]]
回复
暂无数据