AOSP 问题定位优化思路
## AOSP 问题定位先看现象
很多团队以为自己缺的是更多代码,实际更缺的是把 AOSP 问题定位 这条链路拆成可观察节点,否则每次都像在盲调。AOSP 问题定位 这次改用新的故障入口来拆,不再复用旧文套路。AOSP 问题定位 一旦出问题,现场通常不会只报一个错,而是先从 看源码最怕陷入目录海,真正高效的方式是先用日志把模块边界卡住,再按调用栈回到源码。 这种工程背景里放大成连锁反应。
## AOSP 问题定位先这样修
方案上不要急着推翻整条链路,先把最危险的节点单点替换掉,再用 cs.android.com 和 repo grep 把新旧行为对齐。只要状态生产者、状态消费者、兜底重试这三层没有明确 owner,AOSP 问题定位 后面一定还会反复炸,所以这里先把责任边界钉住。这类文章最怕写成过程回忆录,我更倾向于直接给出能落地的最短修复路径:先观测、再收敛、最后补回归。
## AOSP 问题定位示例代码
下面这组片段按新的代码入口与验证顺序展开。下面这组片段按 AOSP 问题定位 的真实处理顺序展开:先贴核心实现,再给排查命令,最后补一段修复辅助代码。
1. 先贴核心代码
repo forall framework* -c "git rev-parse --short HEAD"
repo grep -n "Timeout waiting for service" frameworks base services
2. 排查命令
adb logcat -v threadtime ActivityManager:* SystemServer:* *:S
m services/tests/servicestests
3. 状态校验辅助代码
data class YuandaimaCheckResult(
val key: String,
val ok: Boolean,
val detail: String
)
fun verifyYuandaimaState(key: String, expected: String, actual: String): YuandaimaCheckResult {
val ok = expected == actual
return YuandaimaCheckResult(key, ok, if (ok) "matched" else "$expected != $actual")
}
## AOSP 问题定位常见坑
如果旧文已经把 AOSP 问题定位 讲成通用排查文章,这次就别再重复宽口径写法,直接缩到更具体的子问题与验证信号。先盯三类高危点:一上来全局搜索导致失焦;分支版本与真机 build 不一致;补丁验证只看编译通过。多数时候不是接口挂了,而是边界松了。cs.android.com、repo grep、m / mm 增量编译 这类现成观测手段不要浪费,很多问题不是没有证据,而是证据没有被串成同一条时间线。
## 报错怎么处理
1. 状态回退
如果现场出现旧数据覆盖新数据、页面恢复后状态倒退,先用 cs.android.com 对齐时间线,再核对本地状态迁移是不是原子提交。把请求发出、回包落库、UI 消费三段时间顺序排清楚,根因通常会自己浮出来。
adb logcat -v threadtime ActivityManager:* SystemServer:* *:S
m services/tests/servicestests
2. 调度层重入
如果后台恢复、重试或多入口并发后任务跑了两次,优先补幂等键、唯一调度名和入口锁,再回头核对 保留常用 repo branch 和 tag 速查表 有没有被真正收紧。别只看业务日志,还要确认调度层是不是只进了一次。
fun yuandaimaWorkName(id: String): String {
return "yuandaima-$id"
}
fun shouldSkipYuandaima(running: Boolean, hasPending: Boolean): Boolean {
return running || hasPending
}
## 命令和代码直接跑
只要先稳定复现一次,再把修复版稳定跑通一次,文章就不是经验笔记,而是可执行模板。最小可运行片段也不再沿用旧文那套标题/首段/代码锚点,而是直接验证这次新切面的根因。最后留一个最小可运行片段,重点不是完整业务,而是让 AOSP 问题定位 能在本地快速复现、快速验证。
1. 最小状态模型
data class YuandaimaState(
val id: String,
val status: String,
val updatedAt: Long,
val source: String
)
2. 最小执行入口
fun runYuandaimaDemo() {
val state = YuandaimaState("42", "pending", System.currentTimeMillis(), "yuandaima")
println(state)
}
3. 回归命令
adb logcat -v threadtime ActivityManager:* SystemServer:* *:S
m services/tests/servicestests
adb logcat -d | findstr /I "Exception timeout retry"
