构建Python包的五个简单准则简介

发表于 5年以前  | 总阅读数:1043 次

创建一个软件包(package)似乎已经足够简单了,也就是在文件目录下搜集一些模块,再加上一个init.py文件,对吧?我们很容易看出来,随着时间的推移,通过对软件包的越来越多的修改,一个设计很差的软件包可能会出现循环依赖问题,或是可能变得不可移植和不可靠。
1. init.py 仅为导入服务

对于一个简单的软件包,你可能会忍不住把工具方法,工厂方法和异常处理都丢进init.py,千万别这样!

一个结构良好的init.py文件,仅为一个非常重要的目的来服务:从子模块导入。你的init.py应该看起来像这个样子:


    # ORDER MATTERS HERE -- SOME MODULES ARE DEPENDANT ON OTHERS
    # 导入顺序要考虑――一些模块会依赖另外的一些
    from exceptions import FSQError, FSQEnvError, FSQEncodeError,
                FSQTimeFmtError, FSQMalformedEntryError,
                FSQCoerceError, FSQEnqueueError, FSQConfigError,
                FSQPathError, FSQInstallError, FSQCannotLockError,
                FSQWorkItemError, FSQTTLExpiredError,
                FSQMaxTriesError, FSQScanError, FSQDownError,
                FSQDoneError, FSQFailError, FSQTriggerPullError,
                FSQHostsError, FSQReenqueueError, FSQPushError 

    # constants relies on: exceptions, internal
    import constants

    # const relies on: constants, exceptions, internal
    from const import const, set_const 
    # has tests

    # path relies on: exceptions, constants, internal
    import path 
    # has tests

    # lists relies on: path
    from lists import hosts, queues

    #...

2.使用init.py来限制导入顺序

  • 把方法和类置于软件包的作用域中,这样用户就不需要深入软件包的内部结构,使你的软包变得易用。
  • 作为调和导入顺序的唯一地方。

使用得当的话,init.py 可以为你提供重新组织内部软件包结构的灵活性,而不需要担心由内部导入子模块或是每个模块导入顺序所带来的副作用。因为你是以一个特定的顺序导入子模块,你的init.py 对于他程序员来讲应该简单易懂,并且能够明显的表示该软件包所能提供的全部功能。

文档字符串,以及在软件包层面对all属性的赋值应当是init.py中唯一的与导入模块不相关的代码:


    __all__ = [ 'FSQError', 'FSQEnvError', 'FSQEncodeError', 'FSQTimeFmtError',
          'FSQMalformedEntryError', 'FSQCoerceError', 'FSQEnqueueError',
          'FSQConfigError', 'FSQCannotLock', 'FSQWorkItemError',
          'FSQTTLExpiredError', 'FSQMaxTriesError', 'FSQScanError',
          'FSQDownError', 'FSQDoneError', 'FSQFailError', 'FSQInstallError',
          'FSQTriggerPullError', 'FSQCannotLockError', 'FSQPathError',
          'path', 'constants', 'const', 'set_const', 'down', 'up',

    # ...
         ]

3.使用一个模块来定义所有的异常

你也许已经注意到了,init.py中的第一个导入语句从exceptions.py子模块中导入了全部的异常。从这里出发,你将看到,在大多数的软件包中,异常被定义在引起它们的代码附近。尽管这样可以为一个模块提供高度的完整性,一个足够复杂的软件包会通过如下两种方式,使得这一模式出现问题。

通常一个模块/程序需要从一个子模块导入一个函数, 利用它导入代码并抛出异常。为了捕获异常并保持一定的粒度,你需要导入你需要的模块,以及定义了异常的模块(或者更糟,你要导入一系列的异常)。这一系列衍生出来的导入需求,是在你的软件包中编织一张错综复杂的导入之网的始作俑者。你使用这种方式的次数越多,你的软件包内部就变的越相互依赖,也更加容易出错。  
随着异常数量的不断增长,找到一个软件包可能引发的全部异常变的越来越难。把所有的异常定义在一个单独的模块中,提供了一个方便的地方,在这里,程序员可以审查并确定你的软件包所能引发全部潜在错误状态。

你应该为你的软件包的异常定义一个基类:


    class APackageException(Exception):

    '''root for APackage Exceptions, only used to except any APackage error, never raised'''
      pass

然后确保你的软件包在任何错误状态下,只会引发这个基类异常的子类异常,这样如果你需要的话,你就可以阻止全部的异常:


    try:

    '''bunch of code from your package'''
    except APackageException:

    '''blanked condition to handle all errors from your package'''

对于一般的错误状态,这里有一些重要的异常处理已经被包括在标准库中了(例如,TypeError, ValueError等)

灵活地定义异常处理并保持足够的粒度:


    # from fsq
    class FSQEnvError(FSQError):

    '''An error if something cannot be loaded from env, or env has an invalid

    value'''
      pass

    class FSQEncodeError(FSQError):

    '''An error occured while encoding or decoding an argument'''
      pass
    # ... and 20 or so more

在你的异常处理中保持更大的粒度,有利于让程序员们在一个try/except中包含越来越大的,互相不干涉的代码段。


    # this
    try:
      item = fsq.senqueue('queue', 'str', 'arg', 'arg')
      scanner = fsq.scan('queue')
    except FSQScanError:

    '''do something'''
    except FSQEnqueueError:

    '''do something else'''

    # not this
    try:
      item = fsq.senqueue('queue', 'str', 'arg', 'arg')
    except FSQEnqueueError:

    '''do something else'''
    try:
      scanner = fsq.scan('queue')
    except FSQScanError:

    '''do something'''

    # and definitely not
    try:
      item = fsq.senqueue('queue', 'str', 'arg', 'arg')
      try:
        scanner = fsq.scan('queue')
      except FSQScanError:

    '''do something'''
    except FSQEnqueueError:

    '''do something else'''

在异常定义时保持高度的粒度,会减少错综复杂的错误处理,并且允许你把正常执行指令和错误处理指令分别开来,使你的代码更加易懂和更易维护。
4. 在软件包内部只进行相对导入

在子模块中你时常见到的一个简单错误,就是使用软件包的名字来导入软件包。


    # within a sub-module
    from a_package import APackageError

这样做会导致两个不好的结果:

  1. 子模块只有当软件包被安装在 PYTHONPATH 内才能正确运行。
  2. 子模块只有当这个软件包的名字是 a_package 时才能正确运行。

尽管第一条看上去并不是什么大问题,但是考虑一下,如果你在 PYTHONPATH 下的两个目录中,有两个同名的软件包。你的子模块可能最终导入了另一个软件包,你将无意间使得某个或某些对此毫无戒备的程序员(或是你自己)debug 到深夜。


    # within a sub-module 
    from . import FSQEnqueueError, FSQCoerceError, FSQError, FSQReenqueueError,
           constants as _c, path as fsq_path, construct,
           hosts as fsq_hosts, FSQWorkItem
    from .internal import rationalize_file, wrap_io_os_err, fmt_time,
               coerce_unicode, uid_gid
    # you can also use ../... etc. in sub-packages.

5. 让模块保持较小的规模

你的模块应当比较小。记住,那个使用你软件包的程序员会在软件包作用域进行导入,同时你会使用你的 init.py 文件来作为一个组织工具,来暴露一个完整的接口。

好的做法是一个模块只定义一个类,伴随一些帮助方法和工厂方法来协助建立这个模块。


    class APackageClass(object):

    '''One class'''

    def apackage_builder(how_many):
      for i in range(how_many):
        yield APackageClass()

如果你的模块暴露了一些方法,把一些相互依赖的方法分为一组放进一个模块,并且把不相互依赖的方法移动到单独的模块中:


    ####### EXPOSED METHODS #######
    def enqueue(trg_queue, item_f, *args, **kwargs):

    '''Enqueue the contents of a file, or file-like object, file-descriptor or

    the contents of a file at an address (e.g. '/my/file') queue with

    arbitrary arguments, enqueue is to venqueue what printf is to vprintf

    '''
      return venqueue(trg_queue, item_f, args, **kwargs)

    def senqueue(trg_queue, item_s, *args, **kwargs):

    '''Enqueue a string, or string-like object to queue with arbitrary

    arguments, senqueue is to enqueue what sprintf is to printf, senqueue

    is to vsenqueue what sprintf is to vsprintf.

    '''
      return vsenqueue(trg_queue, item_s, args, **kwargs)

    def venqueue(trg_queue, item_f, args, user=None, group=None, mode=None):

    '''Enqueue the contents of a file, or file-like object, file-descriptor or

    the contents of a file at an address (e.g. '/my/file') queue with

    an argument list, venqueue is to enqueue what vprintf is to printf

    if entropy is passed in, failure on duplicates is raised to the caller,

    if entropy is not passed in, venqueue will increment entropy until it

    can create the queue item.

    '''

    # setup defaults
      trg_fd = name = None

    # ...

上面的例子是 fsq/enqueue.py,它暴露了一系列的方法来为同一个功能提供不同的接口(就像 simplejson 中的l oad/loads)。尽管这个例子足够直观,让你的模块保持较小规模需要一些判断,但是一个好的原则是:

当你有疑问的时候,就去创建一个新的子模块吧。

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »
 相关文章
Android插件化方案 5年以前  |  237231次阅读
vscode超好用的代码书签插件Bookmarks 2年以前  |  8065次阅读
 目录