不改一行业务代码,飞书 iOS 低端机启动优化实践

发表于 2年以前  | 总阅读数:2113 次

引言

在启动优化时,我们常常通过增加并发的方式来减轻主线程的耗时。而在 iOS 中,GCD 是并发编程最常用的框架。增加并发是否是启动优化的良策?开发者适合选用哪个优先级的 GCD 队列?本文将结合飞书启动优化,给出选取 GCD 队列的最佳实践,也提供针对低端机的启动优化思路。

应用此思路,我们在未修改飞书业务逻辑的情况下,在飞书低端机上,取得了不错的用户体验收益:首屏展示时间优化 100ms,消息列表首刷时间优化 1500ms。

低端机的特性

通过 Instruments 的 App Launch 功能,我们能看到 App 启动时的线程状态、Time Profiler 等信息。其中,我们发现不同设备在启动时的表现有很大差异。

以 iPhone 7p(低端)和 iPhone 12(高端)举例,它们的设备参数分别为:

设备 CPU 参数 实际核数 ProcessInfo.processInfo.activeProcessorCount 跑满的 CPU 占比(Xcode 测试)
iPhone 7p A10 芯片[1],2 高性能 + 2 低功耗,但是只有 2 核能同时工作 2 200%
iPhone 12 A14 芯片[2],2 高性能 + 4 低功耗 6 600%

启动飞书时,我们通过 Instruments 观察两个设备的线程状态,经过统计发现,iPhone 7p 上,主线程 Preempted 和 Runnable 状态的占比高达 21%。Instruments 的图中能看到主线程大片被抢占。

一个典型的局部,能看到主线程是 preempted 状态,CPU0 在执行其他进程,CPU1 在执行 GCD 线程。

而 iPhone 12,主线程 Preempted 和 Runnable 状态占比则只占 1%从这里我们能发现:对低端机来说,CPU 已经成为了启动的瓶颈,“增大并发”已不是一个万能的启动优化措施,而想办法减少其他线程对主线程的抢占,可能会是优化思路。GCD queue 对主线程的抢占评测

为了评估“减少其他线程对主线程的抢占”是否是一个可行的优化思路,我们首先需要弄明白,主线程被抢占的程度会有多大?我们可以使用 Demo 制造一些极端场景,了解极端场景下,主线程有多少比例会被其他线程抢占,因此有了如下 Demo 实验:

实验组1:

  • 异步线程 QoS:DispatchQoS.userInteractive

  • 代码:

    for _ in 1...100 {
      let queue = DispatchQueue.init(label: "serialQueue", qos: .userInteractive)
      queue.async {
          while true {
          }
      }
    }
    while true {
    }
  • qos_class_self 数值:33

  • 主线程 Preempted + Runnable 占比:74%

实验组2:

  • 异步线程 QoS:不指定 QoS 或 DispatchQoS.userInitiated
  • 代码:
  for _ in 1...100 {
    let queue = DispatchQueue.init(label: "serialQueue")
    queue.async {
        while true {
        }
    }
}
while true {
}
  • qos_class_self 数值:25
  • 主线程 Preempted + Runnable 占比:73%

实验组3:

  • 异步线程 QoS:DispatchQoS.utility
  • 代码:
  for _ in 1...100 {
    let queue = DispatchQueue.init(label: "serialQueue", qos: .utility)
    queue.async {
        while true {
        }
    }
}
while true {
}
  • qos_class_self 数值:17
  • 主线程 Preempted + Runnable 占比:1.3%

实验组4:

  • 异步线程 QoS:DispatchQoS.background
  • 代码:
  for _ in 1...100 {
    let queue = DispatchQueue.init(label: "serialQueue", qos: .background)
    queue.async {
        while true {
        }
    }
}
while true {
}
  • qos_class_self 数值:9
  • 主线程 Preempted + Runnable 占比:1.3%

⬇️ 不指定 QoS 下,一个极端 Demo,启动期间主线程长时间处于 preempted 状态,一直无法得到 running 的机会

从中我们能看到几个结论:

1 . 不指定 QoS 时,自行创建的 GCD queue 的 QoS 是 User-Initiated

2 . User-Initiated 及以上优先级,对主线程会有严重抢占现象;而 Utility 和 Background 则几乎不会抢占主线程。

另外,我们也做测试验证了,pthread_create 创建的线程,也有类似的抢占现象。 QoS 和 Priority

看到 iPhone 7p 上主线程被其他线程抢占,我们可能会有疑问:主线程不应该是优先级最高的么?怎么还会被其他线程抢占?

这里,我们需要理解一下 QoS 和线程 priority 两个概念。

QoS(quality of service)意指服务质量,它影响线程优先级(priority),也影响 I/O 吞吐、 CPU 吞吐等指标[3]。开发者可以用 qos_class_self() 接口获得当前线程 / 队列的 QoS。

苹果对于每个任务应该选用哪个 QoS,也有一些指导意见[4]:

QoS 和 priority 确实有对应关系,参考 xnu 源码和实验结果,对应关系为:

QoS Priority
User-Interactive 46,对于 UI 线程是 47
User-Initiated 37
Utility 20
Background 4

同时,线程的 priority 会随着执行动态调整。测试中我们会发现,主线程的 priority 在运行开始时是 QoS User-Interactive 对应的 47,但随着运行会出现下降的情况。

官方文档[5]中解释了线程 priority 变化的原因,priority 由 Mach scheduler 控制,为了防止计算密集的线程垄断资源,各个线程的 priority 会实时调整。

All of these mechanisms are operating continually in the Mach scheduler. This means that threads are frequently moving up or down in priority based upon their behavior and the behavior of other threads in the system.

进一步阅读 xnu 内核的源码[6],我们发现,线程 priority 的变化,是由各个 Mach scheduler 实现的 compute_timeshare_priority 接口控制的。在 iOS 使用的 Mach scheduler 中,compute_timeshare_priority 为同一个实现 sched_compute_timeshare_priority。线程调度时的 priority,会在线程固有 priority 的基础上,结合当前线程的 CPU 占用情况和当前设备的整体负载进行调整。

在这个实现中,我们能看到 Mach scheduler 对 priority 的调整会有一个极限:对于原先 priority = 47 的线程来说,向下调整的极限是 47 - ((BASEPRI_FOREGROUND - BASEPRI_DEFAULT) + 2) = 29。这和我们用多个设备测试到的结果吻合:主线程执行时,priority 的最低值是 29,依然高于 Utility 对应的 priority 20。

这也解释了,为什么 Demo 中当异步线程的 QoS 是 Utility 时,就几乎无法对主线程造成抢占。

优化落地

通过 Demo 实验,一个启动优化思路产生了:在飞书中,大量异步队列的 QoS 是 User-Initiated,尽管这一 QoS 低于主线程的 User-Interactive,但依然可能对主线程造成抢占;那么,如果将异步队列的 QoS 调低到 Utility,是不是就可以优先保障主线程执行,让首屏更早展现出来?

经过一些粗暴的实验,我们证实了飞书在这个思路上存在优化空间。但另一个问题随之而来:如何兼顾首屏、消息列表首刷等多个指标?

考虑消息列表首刷的场景:获取到最新的消息,不仅仅需要主线程构建 UI,还需要依赖数据库读取、网络请求等异步操作。如果我们粗暴地将所有异步队列的 QoS 调低,首屏确实能更快展现,但消息列表的首刷则随着异步操作的变慢更劣化了。这对用户体验反而带来了负向影响。

梳理出哪些异步操作是首刷依赖的,确保这些队列的 QoS ,是优化中非常重要的一环。我们首先通过不断用 Instruments 测试、阅读代码梳理出了首版白名单队列,并在线下和线上验证了首屏、首刷等关键指标的优化收益。在后来的迭代中,我们又开发了线下工具,通过在线下 hook dispatch_async 等函数,记录下首刷等时机依赖的 GCD 队列,达成了白名单队列自动生成的能力。

效果分析

这一优化在线上产生了不错的体验优化效果:

1 . 启动首屏展现时间优化 100ms

通过调整异步线程的 QoS,启动期间主线程 CPU 抢占现象有明显降低。更多计算资源集中到主线程,使得首屏展示速度明显加快。

2 . 消息列表首刷时间优化 1500ms

通过对消息列表首刷依赖的任务的分析,我们调低了无关线程的 QoS,这也让首刷依赖的数据库读取、网络请求等任务得到了更多资源,加速了它们的执行。

总结

“增加并发”在一定范围内可以作为启动优化的方案,但在低端机上,CPU 已经成为瓶颈,并发时异步线程对主线程的抢占也需要引起重视。

GCD 提供了四种 QoS 给开发者使用,官方也为这四种 QoS 提供了最佳实践建议。

经过评测和源码推理,User-Interactive 和 User-Initiated 对主线程有明显抢占,Utility 和 Background 对主线程的抢占极少。开发者创建的 GCD 队列,默认的 QoS 实际为 User-Initiated。因此在启动期间(或者任何耗时敏感期间),与启动无直接关系的 queue,应该主动设置为 Utility 或 Background,减少对主线程的抢占。

通过飞书上落地优化,我们能得出结论:对线程或 GCD queue 调整 QoS,能在不改变启动业务逻辑的情况下取得显著收益。

当然,比事后优化更好的操作,是在编码时就充分了解不同 QoS 的行为特性,选用最适合的 QoS。

参考文献

[1] Apple A10 https://en.wikipedia.org/wiki/Apple_A10

[2] Apple A14 https://en.wikipedia.org/wiki/Apple_A14

[3] 《*OS Internals》Chapter 6

[4] Prioritize Work with Quality of Service Classeshttps://developer.apple.com/library/archive/documentation/Performance/Conceptual/EnergyGuide-iOS/PrioritizeWorkWithQoS.html [5]Why Did My Thread Priority Change? https://developer.apple.com/library/archive/documentation/Darwin/Conceptual/KernelProgramming/scheduler/scheduler.html

[6] xnu 源码 sched_compute_timeshare_priority https://github.com/apple-oss-distributions/xnu/blob/e7776783b89a353188416a9a346c6cdb4928faad/osfmk/kern/priority.c#L558

本文由哈喽比特于2年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/KQJ5QXHdhwHRN65KdD45qA

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »
 相关文章
快速配置 Sign In with Apple 5年以前  |  7734次阅读
使用 GPUImage 实现一个简单相机 5年以前  |  6021次阅读
APP适配iOS11 5年以前  |  5789次阅读
 目录