Android HandlerThread 与消息队列协作排障手记:这次重点补把线程生命周期和业务 owner 对齐
## Android 消息队列协作先看现象
很多 HandlerThread 问题不是线程没起,而是页面销毁、任务重入和延迟消息叠在一起后,旧回调还在消费上一轮状态。现场最难受的是卡顿和错乱都不稳定复现,所以先把‘谁发消息、谁撤消息、谁回收线程’这三层责任拆开。最近站内同类文章已经反复写到 Android 消息队列协作,这一轮不再重复旧切口,而是把入口锁定在新的失效信号、兜底动作和回归证据上。
## Android 消息队列协作先这样修
和最近已经发过的 Android 消息队列协作 相关文章相比,这里刻意把重点往观测补点、回滚抓手和验收口偏,不再重复旧稿里的通用铺垫。这次收口只保留真正能落地的三步:先补 为关键消息建立耗时与积压监控,再收紧兜底开关,最后把回归命令挂进值班清单,避免正文和最近已发文章高度同构。先给消息打 owner 和 requestId,再把页面离场时的 removeCallbacksAndMessages 做成固定收尾动作,最后才考虑线程池化。
## Android 消息队列协作示例代码
为了和最近围绕 Android 消息队列协作 的文章拉开距离,这里的示例改成‘观测点 + 回滚位 + 最小修复’三段式,不再沿用旧稿的讲法。我故意把示例压成能直接复制的大小,目标不是讲概念,而是让 Android基础知识 场景能马上动手验证。
1. 关键实现
class SyncDispatcher(name: String) {
private val thread = HandlerThread(name).apply { start() }
private val handler = Handler(thread.looper)
fun post(task: () -> Unit) {
handler.post(task)
}
fun shutdown() {
thread.quitSafely()
}
}
2. 先跑这些命令
adb shell dumpsys activity looper
adb shell perfetto -o /data/misc/perfetto-traces/looper.trace -t 10s sched freq idle am wm
3. 修复辅助代码
data class JichuzhishiCheckResult(
val key: String,
val ok: Boolean,
val detail: String
)
fun verifyJichuzhishiState(key: String, expected: String, actual: String): JichuzhishiCheckResult {
val ok = expected == actual
return JichuzhishiCheckResult(key, ok, if (ok) "matched" else "$expected != $actual")
}
## Android 消息队列协作常见坑
如果最近同分类已经连续覆盖过 延迟消息在页面销毁后继续执行,这次就别再把篇幅浪费在重复背景上,直接补那些旧稿没展开的失败信号和止血顺序。选题避重不是只换标题。真正要避开的是和最近文章一模一样的观察路径、代码顺序和总结句式,所以这里把关注点故意拆开。adb shell dumpsys looper_stats、Perfetto 线程时间线、StrictMode 自定义监控 这类现成观测手段不要浪费,很多问题不是没有证据,而是证据没有被串成同一条时间线。
## 报错怎么处理
1. 状态不一致
如果现场出现旧数据覆盖新数据、页面恢复后状态倒退,先用 adb shell dumpsys looper_stats 对齐时间线,再核对本地状态迁移是不是原子提交。把请求发出、回包落库、UI 消费三段时间顺序排清楚,根因通常会自己浮出来。
adb shell dumpsys activity looper
adb shell perfetto -o /data/misc/perfetto-traces/looper.trace -t 10s sched freq idle am wm
2. 多入口重复跑
如果后台恢复、重试或多入口并发后任务跑了两次,优先补幂等键、唯一调度名和入口锁,再回头核对 把线程生命周期和业务 owner 对齐 有没有被真正收紧。别只看业务日志,还要确认调度层是不是只进了一次。
fun jichuzhishiWorkName(id: String): String {
return "jichuzhishi-$id"
}
fun shouldSkipJichuzhishi(running: Boolean, hasPending: Boolean): Boolean {
return running || hasPending
}
## 命令和代码直接跑
真正有价值的最小样例,必须保留最短入口、最少依赖和明确输出,这样复现、修复、回归三步才能连起来。只要先稳定复现一次,再把修复版稳定跑通一次,文章就不是经验笔记,而是可执行模板。如果你前几天刚发过 Android 消息队列协作 相关文章,这个最小样例就更应该承担差异化职责:验证新的失败信号,而不是把老步骤重抄一遍。
1. 先定义状态对象
data class JichuzhishiState(
val id: String,
val status: String,
val updatedAt: Long,
val source: String
)
2. 启动验证入口
fun runJichuzhishiDemo() {
val state = JichuzhishiState("42", "pending", System.currentTimeMillis(), "jichuzhishi")
println(state)
}
3. 本地验证命令
adb shell dumpsys activity looper
adb shell perfetto -o /data/misc/perfetto-traces/looper.trace -t 10s sched freq idle am wm
adb logcat -d | findstr /I "Exception timeout retry"
