Kotlin 的 Inline Class 和 Value Class，字节码层面看什么

从一次性能调优的困惑说起

去年维护一个高频交易相关的 Android 模块时，团队里有人提议用 Kotlin 的 value class 来包装金额类型，避免 Double 的精度问题和原始类型混淆。我当时没多想就同意了，毕竟 Kotlin 1.5 正式把 inline class 改名为 value class，文档里写得天花乱坠："零开销抽象"、"编译时内联消除"。结果上线后做 trace 分析，发现某些调用路径不仅没有消除装箱，反而在热点路径上产生了额外的对象分配。这让我意识到，自己对这门特性的理解停留在语法糖层面，根本没看过它生成的字节码长什么样。

这篇文章记录我后来用 ASM Bytecode Viewer 和 Kotlin Bytecode 工具逐行对比的过程。重点不是语法怎么写，而是编译器在什么情况下会"食言"、JVM 在什么情况下会拒绝内联、以及 Android 的 ART 和桌面 HotSpot 在这件事上的差异。

Inline Class 的历史包袱：1.3 的实验性设计

Kotlin 1.3 引入 inline class 时，语法是 inline class Password(val value: String)。这个设计有个明显的历史包袱：它只允许一个主构造参数，且这个参数必须是 final 的。更关键的是，编译器对这个"内联"的承诺是尽力而为，而非强制保证。

我当时翻了一个 1.3.72 的项目，用 javap -c 看生成的字节码。一个声明为 inline class 的类，如果用在泛型参数位置，比如 List<Password>，编译器会生成一个静态的 constructor-impl 和一个 box-impl 方法。看这段字节码：

public final java.lang.String unbox-impl();
public static final Password box-impl(java.lang.String);

box-impl 的存在本身就说明问题：编译器预留了装箱的逃生舱。任何需要对象语义的场景——泛型、可空类型、类型擦除后的边界——都会触发这个装箱。Kotlin 1.3 的文档对此语焉不详，只说了"大多数情况下零开销"，但没定义"大多数"的精确范围。

我实际测试下来，1.3 的 inline class 在 Array<Password> 这种场景里表现尤其差。因为 JVM 数组是协变的且需要具体类型，编译器不得不生成完整的包装类实例。用 Android Studio 的 Memory Profiler 抓 dump，能看到 Password 的实例在 GC 堆里实实在在存在，和文档说的"内联消除"完全两码事。这个困惑一直持续到 1.5 版本。

Kotlin 1.5 的改名背后：Value Class 的 JVM 契约

Kotlin 1.5 把 inline class 改名为 value class，同时引入 @JvmInline 注解。表面是改名，实际是向 JVM 的 Project Valhalla 靠拢。Valhalla 里的 value type 是 JVM 原生支持的，而 Kotlin 的 value class 在当前 JVM 上只是编译器层面的模拟。

关键变化在 kotlin-stdlib 1.5.0 的 JvmInline 注解定义。这个注解是 SOURCE 保留级别的，意味着它只给 Kotlin 编译器看，JVM 运行时不感知。这和 Java 未来真正的 value class（JEP 401，目前仍在预览）有本质区别。Java 的 value class 会修改 JVM 的对象模型，数组可以扁平存储 value 类型；而 Kotlin 的 value class 在今天，数组里存的还是引用或者装箱后的对象。

我对比了 1.4.32 和 1.5.31 编译同一段代码的结果。假设有这样的定义：

@JvmInline
value class Millis(val value: Long)

在 1.5.31 下，编译器生成的类文件会有 ACC_FINAL 和 ACC_ABSTRACT 之外的标记吗？用 javap -v 看，发现类上有 kotlin/jvm/JvmInline 的运行时可见注解，但类的 access flag 和普通 final class 没区别。这意味着 ART 在加载这个类时，完全不知道它"应该"被内联处理。

这里有个容易踩的坑：很多人以为加了 @JvmInline 就能在 JNI 层直接拿到原始类型。实际测试，JNI 的签名还是 Lcom/example/Millis;，不是 J。如果 JNI 方法声明里写 long，运行时会抛 NoSuchMethodError。这个细节在 Kotlin 官方文档的 JNI 互操作章节里根本没提，我是在一个 GitHub issue kotlin-native #4567 的评论区里才找到确认。

字节码层面的内联承诺：什么时候生效，什么时候失效

真正理解 value class 的行为，需要看调用点生成的字节码。Kotlin 编译器有个优化策略：在静态类型已知的情况下，直接用底层类型替换 value class，跳过 boxing。但这个优化极其脆弱。

我写了个测试 case，看函数返回 value class 时的行为：

@JvmInline
value class UserId(val id: Int)

fun getUserId(): UserId = UserId(42)

用 Kotlin Bytecode 工具看 getUserId 的字节码，1.7.20 编译器生成的是：

public final int getUserId-s-VKNWU()

方法名被 mangling 了，加了 -s-VKNWU 后缀，返回类型直接是 I（int）。这是内联生效的理想情况。调用方如果也是 Kotlin 代码，编译器知道这个 mangled name，直接按 int 调用。

但把同样的 UserId 放到接口里：

interface UserRepository {
    fun findById(id: UserId): User
}

字节码立刻变样。接口方法的签名变成：

public abstract com.example.User findById-WZ4Q5Ns(int);

等等，返回类型还是 int？不对，仔细看，参数类型确实是 int，但方法名 mangling 了。这里有个微妙的点：接口方法本身不需要 object header，但实现这个接口的类，如果通过接口类型调用，编译器必须生成 bridge method。

看实现类：

class UserRepositoryImpl : UserRepository {
    override fun findById(id: UserId): User = ...
}

UserRepositoryImpl 会生成两个方法：一个是 mangled 的 findById-WZ4Q5Ns(int)，另一个是 bridge 的 findById(int)。这个 bridge 方法内部会调用 UserId.box-impl(id)，然后调 mangled 方法。这意味着通过接口调用时，即使参数是 int，也会有一次装箱！我用 Android Profiler 的 Allocation Tracking 验证过，在循环里通过接口调用，确实能看到 UserId 的分配。

这个行为在 Kotlin 1.8.0 之前没有文档说明，1.8.20 的 release note 里才加了一段小字提到"interface bridge method 的装箱优化"。但实际测试 1.9.0，这个装箱依然存在，只是编译器在某些情况下能内联消除掉。

可空类型的致命一击：Int? 和 UserId? 不是一回事

Value class 的可空版本是另一个装箱重灾区。UserId? 在字节码层面不是 int，而是 UserId 的引用加上 null 检查。因为 int 本身不能为 null，编译器必须引入包装来承载 null 状态。

看这个函数：

fun parseUserId(input: String?): UserId? = input?.toIntOrNull()?.let(::UserId)

反编译后的字节码里，UserId? 的局部变量类型是 Ljava/lang/Integer; 还是 Lcom/example/UserId;？实际是后者，但编译器会插入 ifnull 检查。更麻烦的是，当这个可空值参与 Elvis 运算时：

val id = parseUserId(null) ?: UserId(0)

字节码里会先检查 parseUserId 返回是否为 null，如果是，调用 UserId.constructor-impl(0) 然后 UserId.box-impl(...)。这里的 box-impl 调用无法避免，因为 Elvis 表达式的结果类型是 UserId（非空），而左操作数是 UserId?。编译器必须在某个时刻把 int 包装成对象来统一类型。

我对比过直接用 Int? 的类似代码，发现 Int? 在某些情况下能被编译器优化为 java.lang.Integer 的缓存实例（-128 到 127），而 value class 的 box-impl 每次都会 new 新对象。这个差异在高频调用下会产生明显的 GC 压力。

泛型擦除后的真相：ArrayList<UserId> 里到底是什么

这是最反直觉的部分。Java 泛型擦除后，List<UserId> 运行时就是 List。但 Kotlin 编译器在生成字节码时，需要处理 value class 的存取。

看这段代码：

val list = mutableListOf<UserId>()
list.add(UserId(1))
val first = list[0]

mutableListOf<UserId>() 编译后调用的是 kotlin.collections.CollectionsKt.mutableListOf()，没有类型参数。list.add(UserId(1)) 这里，UserId(1) 会被装箱，因为 List.add 的参数类型是 Object。字节码里能看到 INVOKESTATIC com/example/UserId.box-impl (I)Lcom/example/UserId; 的调用。

然后 list[0] 取出来的类型是 Object，编译器会插入 CHECKCAST com/example/UserId 和 unbox-impl 调用。整个过程是：装箱存进去，取出来再拆箱。和直接用 Int 的 List<Int> 行为完全一致，因为 Int 在 JVM 上也是装箱成 Integer。

但这里有个 Android 特有的坑：ART 的 inline cache 和 JIT 编译对频繁装箱的优化不如 HotSpot。我在 Pixel 6 上跑微基准测试，用 JMH 的 Android 移植版（不是官方 JMH，是 androidx.benchmark 的 Macrobenchmark），发现 List<UserId> 的遍历比 IntArray 慢 3-4 倍，而桌面 HotSpot 的差距只有 1.5 倍左右。ART 的 JIT 似乎没能有效消除这种重复的 box/unbox 对。

更隐蔽的问题在 Map<UserId, User>。Map.get 的参数是 Object，所以查找 key 时，UserId 必须装箱。但如果 key 不存在，Map 实现可能会调用 hashCode() 和 equals()，这两个方法在 value class 上是怎么定义的？

Kotlin 编译器会自动生成基于底层值的 hashCode-impl 和 equals-impl 静态方法，以及实例方法 hashCode() 和 equals(Any?) 来转发。但注意，equals 的参数类型是 Any?，意味着传入的可能是未装箱的底层类型吗？不可能，因为运行时类型擦除后，能传进来的只有 UserId 实例或者其他对象。所以 equals 方法里会先 instanceof 检查，失败直接返回 false。

这导致一个诡异的现象：两个底层值相同的 UserId，一个装箱一个未装箱，在 Map 里行为不同，因为 Map 内部比较时两边都是装箱状态。但如果手写 == 比较，Kotlin 编译器可能优化为直接比较底层 int。这种不一致曾经让我在单元测试里困惑了很久。

Mangling 规则的实际影响：反射和序列化

Value class 的方法 mangling 是个双刃剑。它避免了方法签名冲突，但让反射调用变得复杂。

看 UserId 的完整方法列表（javap -p）：

public final int unbox-impl()
public static final int constructor-impl(int)
public static final UserId box-impl(int)
public static final boolean equals-impl(int, java.lang.Object)
public static final int hashCode-impl(int)
public static final java.lang.String toString-impl(int)
public boolean equals(java.lang.Object)
public int hashCode()
public java.lang.String toString()

实例方法 equals、hashCode、toString 是公开的，但它们的实现都转发到 -impl 静态方法。真正被 Kotlin 代码调用的是 mangled 方法，比如 getUserId-s-VKNWU。

这对 JSON 序列化库是灾难。Gson 用反射找 getUserId()，找不到，因为实际方法名是 getUserId-s-VKNWU。Moshi 和 kotlinx.serialization 处理得好一些，因为它们有 Kotlin 特定的支持，能识别 @JvmInline 注解并调用底层值。但 Gson 2.10.1 至今不支持 value class，会报 IllegalArgumentException: Cannot serialize value class。

我踩过的坑是用 Retrofit 配合 Gson 时，一个 API 接口返回 UserId，Gson 反序列化直接崩溃。解决方案要么换序列化库，要么在 API 层不用 value class，用 Int 然后手动包装。这实际上抵消了 value class 的类型安全价值。

Retrofit 2.9.0 对 value class 的支持也有问题。如果接口方法参数是 UserId，Retrofit 的 RequestFactory 在构建时会用 ParameterHandler 处理参数。但 value class 的 mangling 导致它找不到合适的 Converter，除非自定义 Converter.Factory 显式处理 @JvmInline 注解。这个 issue 在 Retrofit 的 GitHub 上 #3828 有讨论，但 2.9.0 release 时还没合并修复。

Kotlin 1.8 的 Operator 优化：数组访问的特殊处理

Kotlin 1.8.0 引入了一个针对 value class 的优化：数组访问运算符的重载。如果定义了 operator fun get(index: Int): UserId，编译器在某些情况下能避免临时装箱。

但我测试发现，这个优化非常局限。看标准库里的 IntArray，它不是用 value class 实现的，而是编译器特殊处理的 int[]。Array<UserId> 则完全不同，它底层是 UserId[]，而 UserId 是引用类型，数组里存的是引用。

等等，这里要纠正一个常见误解。Array<UserId> 在 JVM 上不是 int[]，而是 UserId[]，也就是 Object[] 的子类。因为 value class 在当前 JVM 上没有值类型支持，数组无法扁平化。这和 Project Valhalla 的 Array<int> 能扁平存储有本质区别。

我写过一段测试代码来验证：

@JvmInline
value class SmallInt(val value: Int)

val array = Array(1000) { SmallInt(it) }
println(array.javaClass.componentType)

输出是 class com.example.SmallInt，不是 int。用 sun.misc.Unsafe 或者 java.lang.reflect.Array 也能确认，这个数组的每个元素都是对象引用，占 4 字节（32 位引用）或 8 字节（64 位压缩引用），加上对象头对齐，实际内存开销远大于 1000 个 int 的 4000 字节。

Android 的 ART 在 GC 时还要扫描这个数组的引用，标记阶段的开销和 Array<Any> 一样。这是 value class 在 Android 上最大的性能陷阱：你以为在栈上分配了一个 int，实际在堆里分配了 1000 个带对象头的小对象。

与 Java 互操作的边界：签名冲突和重载

Value class 的 mangling 在和 Java 混编时会产生奇怪的重载限制。假设你有两个 Kotlin 函数：

fun process(id: UserId) { ... }
fun process(id: OrderId) { ... }

UserId 和 OrderId 都是 value class，底层都是 Int。编译后，这两个函数的 JVM 签名分别是 process-WZ4Q5Ns(int) 和 process-xxx(int)，不会冲突。但如果从 Java 调用，你能看到的只有 mangled 方法名，而且参数类型都是 int，没有类型安全。

更糟的是，如果你在 Java 里定义了 void process(int id)，Kotlin 代码里调用 process(UserId(1)) 会优先解析到哪个？实际测试，Kotlin 编译器会报模糊引用错误，因为 mangled 方法和 Java 的原始方法在调用点都匹配。这个错误信息 Overload resolution ambiguity 在复杂项目里很难定位，因为 IDE 的跳转可能会指向错误的方法。

Java 调用 Kotlin 的 value class 函数时，必须手动 mangling 方法名，或者 Kotlin 侧提供 @JvmName 标注的非 mangled 包装。但这又引入了额外的函数调用开销。

ART vs HotSpot：同样的字节码，不同的命运

最后想提的是，value class 的"零开销"承诺在 Android ART 上比桌面 HotSpot 更难兑现。不是因为 Kotlin 编译器生成不同，而是运行时优化能力的差异。

HotSpot 的 C2 编译器有逃逸分析和标量替换，能把某些 value class 的实例拆成字段，消除实际分配。ART 的 JIT（Android 7+）也有逃逸分析，但触发阈值和优化深度都更保守。我在 Android 13 的 Pixel 设备上测试，简单的 value class 局部变量确实能被优化掉，但一旦涉及方法调用边界，ART 就保守地保留装箱。

Macrobenchmark 库测量到的结果：一个循环 100 万次创建 UserId 并传入深层调用链，ART 上的分配计数是 HotSpot 的 2-3 倍。这个差距在 Android 14 的 ART 更新后有所缩小，但没有根本改变。

另外，Android R8/ProGuard 的混淆对 value class 的 mangled 方法名处理也有坑。R8 可能会重命名方法时破坏 Kotlin 的 mangling 规则，导致运行时 NoSuchMethodError。这个在 R8 3.3.75 版本后修复，但如果项目用的 AGP 较旧，需要手动 keep 规则。

到底什么时候该用，什么时候不该用

经过这些字节码层面的分析，我个人的使用策略变得很保守。

绝对避免的场景：需要存储大量实例的集合（用 IntArray 而不是 Array<UserId>）、频繁跨 JNI 边界、需要 Gson 等旧序列化库、泛型容器里的 key/value 类型。

可以考虑的场景：编译期常量传播能消除的纯计算类型、配合 kotlinx.serialization 的 API 边界、作为 DSL 的标记类型（比如 Dp 这种 Compose 里的用法，但 Compose 编译器有额外优化支持）。

Compose 的 Dp、Sp、Color 都是 value class，但 Compose 编译器插件会额外处理它们，生成特殊的 IR 代码，和普通 Kotlin 代码不一样。不能直接把 Compose 里的 value class 用法套用到业务代码里。

一个具体的踩坑记录：我们曾把网络请求的 timeout 参数改成 value class Millis(val value: Long) 和 value class Seconds(val value: Long)，以为能避免单位混淆。结果在 OkHttp 的 Interceptor 里，通过反射读取注解参数时，因为 mangling 找不到方法，timeout 配置全部失效，线上出现大量超时报错。回滚后改用普通 data class 加私有构造，配合工厂方法，反而更可靠。

最后的字节码片段：1.9.0 的新变化

Kotlin 1.9.0 引入了一个实验性特性，value class 可以有多个底层值（multi-field value class），但仍然是实验性的，需要 -XXLanguage:+GenericInlineClassParameter 开启。我试了下：

@JvmInline
value class Range(val start: Int, val endInclusive: Int)

编译报错，提示当前 JVM 不支持。看编译器源码，这个特性实际上依赖 Valhalla 的 Q-types，在现有 JVM 上无法落地。所以即使语法层面允许多字段，字节码生成还是受限。

另一个 1.9.0 的变化是 @JvmInline 的注解目标放宽，可以用在 type alias 上？不，实际测试不行，那是误读 release note。真正变化的是 value class 可以继承接口时的方法分发优化，字节码里 invokeinterface 的调用点在某些情况下能被编译器替换为静态调用，减少一次虚方法分派。但这个优化非常场景特定，我在实际项目里没观察到可测量的性能提升。

看这段 1.9.0 生成的字节码，对比 1.8.22，value class 的 equals 方法实现有细微变化：

// 1.8.22
public boolean equals(java.lang.Object);
    Code:
       0: aload_0
       1: aload_1
       2: invokestatic  #20 // Method equals-impl:(ILjava/lang/Object;)Z
       5: ireturn

// 1.9.0
public boolean equals(java.lang.Object);
    Code:
       0: aload_1
       1: instanceof    #2  // class com/example/UserId
       4: ifeq          20
       7: aload_1
       8: checkcast     #2  // class com/example/UserId
      11: invokevirtual #14 // Method unbox-impl:()I
      14: iload_0
      15: if_icmpne     22
      18: iconst_1
      19: ireturn
      20: iconst_0
      21: ireturn
      22: iconst_0
      23: ireturn

1.9.0 把 equals-impl 的调用内联展开了，减少了一层静态方法调用。这个优化对微性能有帮助，但更重要的是它反映了编译器团队在不断打磨 value class 的代码生成策略。只是这种优化在 ART 上能否被 JIT 进一步内联，又是另一回事了。

字节码层面的观察让我对 Kotlin 的 value class 有了更清醒的认识：它是个向前兼容的过渡设计，语法层面为 Valhalla 做准备，但当前实现受限于 JVM 的对象模型。在 Android 这种对分配敏感的环境里，不能无条件信任"零开销"的宣传，而得具体场景具体分析，必要时回到字节码验证编译器的实际行为。