随着业务的快速发展,Release构建速度问题不断凸显,从2020年底构建50min到如今接近1h30min的构建时长,其中Proguard阶段耗时占用了接近40%, 时刻影响着工作效率。在整个Release构建耗时链路上,业界优化方案众多,并起到了一定的优化效果。然而我们另辟蹊径,自研一套Inc-Proguard方案,解决了无法增量Proguard问题,实现将耗时降低到分钟级别。
目前Android微信采用模块化的Gradle构建方式,也是业界普遍采用的一种方式。大致构建流程如下:
图1
上图可以看出每个Plugin都有可能并发Compile,执行到Boot Plugin时则需要串行Compile,最终经过Proguard、Dex等构建流程输出Apk, 而每个任务都会有相应的Gradle Task负责执行。
通过对Task进行耗时排序, 了解到Full Proguard(3 optimizationpasses) 平均需要40分钟【图2】,在有Apply Mapping情况下也要20分钟左右【图3】
图2 Full Proguard
图3 Apply Mapping Proguard
图4 Proguard部分流程
具体原因主要有几点:
考虑的优化方案:
综上,我们考虑到在日常开发构建过程中,往往提交的代码并不多,一次提交全量构建,属实恶劣,那能否针对增量修改的代码部分进行增量Proguard呢?答案是可行的!
图5 Proguard + D8
图6 R8
在R8出现之前,Proguard基本上配合Dx/D8使用,生成更小更快的Java字节码,然后交给Dx/D8生成Dalvik字节码【图5】,其中D8 比 dx 输出质量指令更少,寄存器分配更好的字节码。而 R8 【图6】是 D8 的衍生产品,旨在集成 ProGuard 和 D8 的功能,目前仍在优化中,逐渐成熟,具体查看QuardSquare官网[1]了解更多。对于微信,我们仍然使用Proguard,主要原因如下:
下面重点介绍增量混淆核心工作:
先来看一下Proguard的大致输入输出流程:
图7
Proguard输出两个产出文件 usage.txt 和 mapping.txt【图7】,usage.txt 是将无用Class、Field和Method进行删除,mapping.txt保留Class、Field和Method的original-obfucate class mapping、inline mapping【图8】,其中inline最为常见,也是Proguard难以增量的主要原因之一。
图8 inline
图9
那我们所做的工作就是用当前构建的New Inputs再结合上次构建的产出Outputs【图9】进行增量Proguard,具体实现思路如下:
图10 实现思路
根据上述流程图,总结出大致的实现步骤:
首先来看我们如何将输入Jars进行Hash,首先大家很容易想到利用ASM工具解析Class,分析出Fields/Methods等字节码内容,并利用哈希函数计算hashcode值,例图11:
图11 hash snapshot
哈希函数我们采用hash = hash ∗iConstant+value, hash=17, iconstant=37,选取质数因子主要是尽可能避免hash冲突,分布均匀。至此我们很容易计算出相邻构建的代码差异即可【图12】
图12 Diff
目前我们支持以下几种类型的变更,基本覆盖所有的代码增量情况的更改:
图13 变更类型
有了具体的代码变更之后,为了方便后续进行字节码操作,还需要对当前的Class构建Class Node结构化数据,同样我们借鉴ASM-Tree库进行分析和扩展,构建出了功能更为强大的MM-ClassNode-Tree, 结构大致如下【图14】:
图14 ClassNode Tree
其中每个Node都保存着对Class的直接引用和inline关系,引用关系【15】我们可以通过Constants Pool获得,Inline信息可以从Mapping中获取【图16】,同样我们的Mapping、Usage信息都将会被结构化组织。
private fun findReferencedClasses(referencingClass: Clazz, member: Member?, descriptor: String, owner: String,
name: String, node: String): ArrayList<Clazz?>? {
val enumeration = DescriptorClassEnumeration(descriptor)
val classCount = enumeration.classCount()
var referencedClasses :ArrayList<Clazz?>? = null
if (classCount > 0) {
referencedClasses = ArrayList<Clazz?>()
for (index in 0 until classCount) {
val fluff = enumeration.nextFluff()
val name = enumeration.nextClassName()
val referencedClass: Clazz? = findClass(referencingClass, member, name, node)
if (referencedClass != null) {
referencedClasses.add(referencedClass)
}
}
}
val referencedClass: Clazz? = findClass(referencingClass, member, owner, node)
if (referencedClass != null) {
if (referencedClasses == null) {
referencedClasses = ArrayList<Clazz?>()
}
referencedClasses.add(referencedClass)
}
return referencedClasses
}
例15 find reference
public static class MethodInfo {
private int obfuscatedFirstLineNumber;
private int obfuscatedLastLineNumber;
private final String originalClassName;
private int originalFirstLineNumber;
private int originalLastLineNumber;
private final String originalType;
private final String originalName;
private final String originalArguments;
private final String obfuscatedName;
private final String obfuscatedArguments;
public MethodInfo inlineToInfo;
public MethodInfo inlineByInfo;
//mapping文件中是否为:xxx:xxx[false], :xxx[true]
private boolean sameLineNumber;
private boolean markRemoved;
}
例16 mapping info(部分)
接下来,我们有必要继续计算当前的变更的Spread Change,有了上面的引用和内联关系,就很容易计算出影响的其他Class Diff:
def spreadDiffClassMarker = new SpreadDiffClassVisitor(spreadDiffWriter, logWriter,
configuration.classLoader, programClassPool)
programClassPool.classAccept(
new ClassProcessingInfoFilter(Status.NodeStatusFlag.ADD.value |
Status.NodeStatusFlag.CHANGE.value |
Status.NodeStatusFlag.REPLACE.value, 0, 0,
new MultiClassVisitor(
spreadDiffClassMarker,
new MMAllMemberVisitor(
new MMemberProcessingInfoFilter(Status.NodeStatusFlag.ADD.value |
Status.NodeStatusFlag.CHANGE.value, 0, 0, spreadDiffClassMarker)))))}
例17 spread diff
图18
上述章节主要讲述如何获取Diff Class Nodes, 整个流程最为关键的部分则是字节码校正,下面通过举例说明针对不同的变更类型,其处理方式也不尽相同:
图19
在上次构建中,class A被映射为class a,B.funb() 被shrink掉保存在usage.txt中,A$2为匿名内部类remapping为A$1, 方法funB中将class C的func方法inline,并保存在mapping.txt中,考虑针对当前修改情况进行分别校正处理:
图20 ADD
图21 CHANGE
图22 REPLACE
usageMarker.isAdded(programMethod) || usageMarker.isSpreadAdded(programMethod) -> {
val exceptionsArray: Array<String>? =
if (programMethod.exceptions == null) null else programMethod.exceptions.toTypedArray<String>()
val correctMethodVisitor = outputClass.visitMethod(
programMethod.access,
programMethod.name,
programMethod.desc,
programMethod.signature,
exceptionsArray
) as MMethodNode
processingFlagMarker.markCorrectAdd(correctMethodVisitor)
programMethod.accept(InnerProcessingMethodVisitor(
programClass = inputProgramClass,
inputMethodNode = programMethod,
methodVisitor = correctMethodVisitor
))
}
usageMarker.isChanged(inputMethodNode) || usageMarker.isSpreadChanged(inputMethodNode) -> {
val index = outputProgramClass.methods.indexOf(outputProgramMethod)
val exceptionsArray: Array<String>? =
if (outputProgramMethod.exceptions == null) null else outputProgramMethod.exceptions.toTypedArray<String>()
val newProgramMethod = MMProgramMethodNode(outputProgramMethod.access,
outputProgramMethod.name,
outputProgramMethod.desc,
outputProgramMethod.signature,
exceptionsArray)
inputMethodNode.accept(
InnerProcessingMethodVisitor(
programClass = inputProgramClass,
inputMethodNode = inputMethodNode,
methodVisitor = newProgramMethod
)
)
outputProgramClass.methods[index] = newProgramMethod
processingFlagMarker.markCorrectChange(newProgramMethod)
}
indexLineNumberOffsets = inputMethodNode.getLineNumberOffset(inputProgramClass)
val filterInputLineNumberNodes = inputMethodNode.filterLineNumberNodes()
val filterOutputLineNumberNodes = outputProgramMethod.filterLineNumberNodes()
if (filterInputLineNumberNodes.size == indexLineNumberOffsets?.size && filterOutputLineNumberNodes.size == indexLineNumberOffsets?.size ) {
oldLineNumberArray = inputMethodNode.filterLineNumberNodes().mapIndexed { _index ,lineNumberNode -> lineNumberNode.line - indexLineNumberOffsets!![_index] }
outputProgramMethod.insnsAccept(outputProgramClass, this, null)
} else {
logPrinter?.println("$TAG >>>>>>>>>>>>>> ERROR, lineNumberNodes is not same size!")
}
考虑以下几种特殊情况:
Proguard针对匿名内部类,可能会做remapping处理,比如图23中SearchView$10会被重新mapping为SearchView$2,因此,因此无法利用上次构建的mapping信息来还原当前的class,这里我们采取REPLACE的方式进行处理,见图22,当class A中的funA方法体有修改,则标记为CHANGE状态,此时A$2将必须copy到class a中,同时A$2需要remapping为A$2, 而不是A$1;
图23 匿名类
其他情况:
method的方法参数也有可能被Shrink优化【proguard.optimize.MethodDescriptorShrinker#visitProgramMethod】,导致无法通过mapping进行找回,这里我们修改Proguard源码,保留Shrink前后的mapping信息即可。
同样method的 return value也会存在优化的情况,考虑到在微信此优化数量并不明显,这里通过配置!method/propagation/returnvalue简单处理
corrector环节处理之后,最后则需要对outputs进行remapping,并更新产出文件,大致原理如下:
校正后的字节码还必须进行重新混淆才能输出生产环境Apk,阅读retrace解析流程,我们顺利地将上次构建的mapping.txt进行结构化解析,再对已经标记待处理的output classes/fields/methods/annotation/code insn部分进行混淆remapping【图24,25,26】;
// Process mapping
def mappingProcessor = new ProcessingMappingVisitor(mappingRemapper, logPrinter, outputProgramPool)
outputProgramPool.classAccept(new MultiClassVisitor(
// Update class mapping
new ClassProcessingFlagFilter(ProcessingFlag.CORRECTED_CHANGE.value |
ProcessingFlag.CORRECTED_ADD.value |
ProcessingFlag.CORRECTED_REPLACED.value,
0,0, mappingProcessor),
new MMAllMemberVisitor(
// Update methods/fields mapping
new MMemberProcessingFlagFilter(ProcessingFlag.CORRECTED_CHANGE.value |
ProcessingFlag.CORRECTED_ADD.value|
ProcessingFlag.CORRECTED_REPLACED.value,
0, 0, mappingProcessor)),
))
图24 remapping
if (typeInsnNode.opcode == Opcodes.NEW ||
typeInsnNode.opcode == Opcodes.ANEWARRAY ||
typeInsnNode.opcode == Opcodes.CHECKCAST ||
typeInsnNode.opcode == Opcodes.INSTANCEOF) {
typeInsnNode.desc = obfuscatedDescriptor(typeInsnNode.desc, mapper, logPrinter)
logPrinter?.println("$TAG, >>>>>>>> process typeInsn desc: ${typeInsnNode.desc}" +
" -> obfuscate desc: ${typeInsnNode.desc}")
}
图25 obfuscate insn(部分)
fun obfuscatedDescriptor(originalInternalDescriptor: String, mappingRemapper: FrameRemapper?,
logPrinter: PrintWriter?, fixClassInfo: ProgramClassFixInfo? = null): String {
val startIndex = originalInternalDescriptor.indexOf(TypeConstants.CLASS_START)
val endIndex = originalInternalDescriptor.lastIndexOf(TypeConstants.CLASS_END)
if (startIndex < 0 || endIndex <= 0) {
return obfuscatedInternalClass(ClassUtil.externalClassName(originalInternalDescriptor), mappingRemapper, fixClassInfo)
}
try {
val newDescriptorBuffer = StringBuffer(originalInternalDescriptor.length)
val enumeration = DescriptorClassEnumeration(originalInternalDescriptor)
if (enumeration.classCount() < 2) {
return obfuscatedInnerDescriptor(originalInternalDescriptor, startIndex, endIndex, mappingRemapper, logPrinter, fixClassInfo)
}
newDescriptorBuffer.append(enumeration.nextFluff())
while (enumeration.hasMoreClassNames()) {
val internalClassName = enumeration.nextClassName()
val obfuscatedClassName = obfuscatedInternalClass(ClassUtil.externalClassName(internalClassName), mappingRemapper, fixClassInfo)
newDescriptorBuffer.append(obfuscatedClassName)
newDescriptorBuffer.append(enumeration.nextFluff())
}
return newDescriptorBuffer.toString()
} catch (ex: Exception) {
logPrinter?.println("process obfuscatedDescriptor error, originalDescriptor: $originalInternalDescriptor")
ex.printStackTrace()
}
return obfuscatedInnerDescriptor(originalInternalDescriptor, startIndex, endIndex, mappingRemapper, logPrinter, fixClassInfo)
}
图26 obfuscate description
进一步的,通过corrector后的字节码状态信息,也需要同步更新usase/mapping的结构化数据,并Print到当前的usage和mapping产出文件中【图27】;
...
if (!methodInfo.isInlineInfo()) {
if (methodInfo.originalFirstLineNumber > 0) {
// Print out the line number range of the method,
// ignoring line numbers of any inlined methods.
pw.println(" " +
methodInfo.originalFirstLineNumber + ":" +
methodInfo.originalLastLineNumber + ":" +
methodInfo.originalType + " " +
methodInfo.originalName + JavaTypeConstants.METHOD_ARGUMENTS_OPEN +
methodInfo.originalArguments + JavaTypeConstants.METHOD_ARGUMENTS_CLOSE +
" -> " +
obfuscatedMethodName);
} else {
// Print out the method mapping without line numbers.
pw.println(" " +
methodInfo.originalType + " " +
methodInfo.originalName + JavaTypeConstants.METHOD_ARGUMENTS_OPEN +
methodInfo.originalArguments + JavaTypeConstants.METHOD_ARGUMENTS_CLOSE +
" -> " +
obfuscatedMethodName);
}
} else {
...
}
图27 print mapping
最后,基于corrector后的字节码状态信息,利用ASM更新上次构建的Output Jars产物【图28】,从而实现增量混淆效果;
...
ExtensionUtil.isDir(outputFile.absolutePath) -> {
classNameSets?.forEach { name ->
val programClass = outputProgramPool.getClass(name) as MMClassNode
IncrementalDirProcessor(
logPrinter,
classLoader,
ignoreCheckClass,
outputProgramPool, programClass,
processFlagsMarker,
outputFile.toPath(),
outputFile.toPath()
).proceed()
}
}
...
图28 update outputs
图29
图30
从图29,30可以看出,优化效果十分明显,整个inc-proguard过程平均控制在8分钟左右即可增量混淆完成,pass越多优化越明显,达到了预期效果。除此之外,为了保证增量准确率,还做了很多细节上的处理,比如call super/interface class的method 其mapping如何处理、特定的字节码指令如何mapping、ClassReader出现ClassNotFoundException如何解决等等。
最后,编译优化并不是一件容易的事情,有些策略的选择都是结合整个团队的实际情况来综合考虑,总体上增量混淆方案基本上保持了耗时相对稳定、代码侵入小、优化程度完全可控等优势,编译问题我们仍在优化,欢迎大家留言交流。
[1]https://www.guardsquare.com/blog/proguard-and-r8
本文由哈喽比特于2年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/80jSfeF5pbxQdNZry5aOmQ
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。