文章类型: 排序方式:
Sublime Text 3.2 发布首个维护版本 3.2.1
Sublime Text 是一个先进的代码编辑器和文本编辑器,具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 3.2.1 已发布,作为 3.2 的首个维护版本,更新内容主要是各种 bug 修复和功能改进,具体如下:
我在探探上24小时内遇到的25个骗子
注:本文来源于微信公众号 满身铜臭(ID:zscmtxw),作者: 满身铜臭的我,获授权转载。作为一个在互联网行业讨口饭的人,我之前一直默默关注着探探的成长。中国从2010年到2019年已经经历3个完整的社交风口周期,但是没有一家可以跑出来,加上最近老罗的子弹短信也黄了,多闪、马桶等其他产品也无声响,所以有了微信之后再无社交的说法。但是近期传闻探探要拆分上市,这让我又开始关注起探探。(探探于2018年被陌陌以6亿美金收购)探探划一划相互匹配的方式,无论是男生还是女生都有一种皇帝选妃的快感。女生有女生的快感,男生有男生的欢乐,总之提供了一种比较好的陌生人社交场景。快捷、迅速、便捷,完全看脸不讲技术含量。众所周知探探和脉脉都是利用熟人圈最先启动的,他们读取了通讯录之后通过几百种话术来唤醒和拉新用户。刚开始你收到这种短信你肯定会选择性屏蔽,但是奈何不了人家发的频次够高,且不用一个短信通道发,召回言语够又非常有挑逗性!直到我在国外又接到了一条探探的短信提醒,四下无人于是决定尝试试用一下探探。谁知这是我人生有史以来最灰暗的24小时!作为一个长相仅达到及格线的同志,我仍然决定大胆的把自己的身材和照片放上去,于是我登录上了探探发现所有的头像都是这样的。后来我才发现我注册的时候选错了性别,于是重新选了一下性别并且头像过了认证之后,来到了探探的主界面。小姐姐果然非常多!头像里的女孩子啊我感觉在实际生活中都没见过!也可能是美女都是晚上出来,我这种穷比创业者打死也看不到。功能也极其简单,左滑讨厌、右划喜欢。可是我划了半小时都没有和女生匹配上,结合自己前十几年悲惨的个人经历,我得出了还是自己长相的问题。痛定思痛,为了划到自己匹配的对想象我迅速列出了解决方案:1.只要是女生我都点击喜欢增大进入流量2.用python写一个小工具缩短手工操作时间3.去淘宝上买了一组男生生活套图,后来发现真的很贴心还附带小视频。4.买了一个自动回复的脚本减少沟通的导入期。秉承“Python自有黄金屋,Python自有颜如玉”的理念,在网上简单了解了一下“前人的经验”之后找到了一段很牛逼的代码。跑了一下,效果还是很不错的!但是为了防止自动化程序,探探还是做了很多障碍。尤其是没有充值会员的用户只能每天划50次,没办法只能先充值一个月的会员。程序跑起来的时候效果飞起。很快就有了很多人添加了我!程序放在那半小时就有了236个匹配!于是我就尝试性的开始和匹配的女生聊聊天!我突然发现所有的女生都很热情啊!和我在现实生活中看到的不一样啊!大家都很友善啊!果然互联网可以解放人的天性啊!有直接要求加微信的!也有聊了不到两分钟就相谈甚欢,直接把微信号甩过来!让你猝不及防地加她微信!此刻的我真的感受人生到达了巅峰!甚至还有连中国人最传统的问候——“吃了吗”都不让我打出来!就把微信发出来给我!我仿佛发现自己是一个未被开垦的处女地!(原谅我真的只会这么问候)陆陆续续加了很多人在微信之后,我就开始进行深度沟通,探探加的很多女生完全和身边的女生不一样,从来都是女生先很主动,每天早上问你吃了吗?晚上问你睡了吗?一种温暖油然而生!我仿佛是一个大明星如走秀一般在各个聊天界面中游刃有余的穿梭。直到突然有一个女生给我说她想和我聊天,还是视频聊天!羞于颜值的我,内心其实是抗拒的,但是考虑到身处国外的内心孤寂,于是想视频就视频吧。结果女生却让打开一个直播地址。进去这个小蓝莓尚柿直播之后,女生就要和我连麦,可是我看了一下想要和主播直接连麦,需要达到五级 点亮 守护女主播,连之前映客直播都没玩过的我又因为有事就和这个美女完美错过了。第二天另外一个美女发了一个朋友圈,这萧瑟、这忧伤,让作为正常男人的我有了呵护她的冲动,这个美女也是要和我在直播间里聊天,于是我愤然点开了直播间。点开之后我只能说不好意思打扰了!可能我的要求还是比较高,女孩子还发语音要求我加入她的工会每日给她守护(大概人民币150元/天),看了一下自己2500的工资卡之后,我果断婉拒了美女的好意。后来我发现每一个我加的女孩子都希望通过直播聊天室和我聊天,这让我不得已下了很多直播软件。有一个让我送很多小花花的女孩子,在她第一次给我推爱尚直播的时候,连App的名称都没有告诉我就一个劲催我进房间了没!后来我慢慢发现好像不对了,女孩子一直叫我充会员,于是乎我打开了这些App的评分,我才恍然大悟原来都是拉客妹。不送礼物就删好友!但是老话说的好,男人有个大通病就是劝人从良,在发现小姐姐是直播拉客妹之后,我苦口婆心劝她不要干这个行当,结果发生了如下的对话。看了是没有办法做好人了,于是乎只要后面是要找我在直播室里面聊天的小姐姐,我都义正言辞的拒绝,突然觉得自己多了很多社会经验
不敌 Java、C/C++、Python,28 岁 VB 究竟输在了哪?
在这个“BCYY48”(编程语言)天团里,C+、Java、Python、PHP……每个都有不少拥趸pick。而曾经有“首富爸爸”和全球后援会撑腰的VisualBasic语言,现在却处在一个非常尴尬的位置。
微软GitHub发布2019年度报告:用户超4000万,Python成第二受欢迎语言
GitHub发布了2019年年度报告《The State of the Octoverse》,下边来看看一些主要数据。全球用户超过4千万目前GitHub上有超过4000万开发人员,其中有80%来自美国以外的地区。去年一年里有1000万新加入的开发者,2019年创建第一个repo的人比2018年增加了44%,还有130万人首次在开源中贡献。组织正在跨时区进行协作,并依赖于开源软件目前GitHub上有将近300万个组织帐户,它们来自世界各地,代表了公司、非营利组织与开源项目等的集体工作。其中,GitHub Enterprise Cloud帐户来自70多个不同的国家。今年全球财富50强中有35家对开源做出了贡献,这反映出专有代码在很大程度上依赖于开源社区。软件社区比以往任何时候都更加紧密地联系在一起去年新创建了超过4400万个repo,从医学上的机器学习和有关深度学习的学术论文,到各种各样的机器人,在这个基础上,开源项目的共享基础架构将所有软件联系在一起,并且它们的依赖关系十分紧密。具体来看,平均而言,GitHub上的每个公共和私有repo都依赖于200多个软件包,每个项目背后都有数百个依赖项。而且,如果按被依赖程度来查看前50个开源项目,可以看到,被依赖度最高的项目今年支持了超过360万个其它repo,比如 rails/rails、facebook/jest与 axios/axios之类的项目对于全球代码已变得至关重要。修复了超过760万个漏洞警报安全性也是开源社区的一项工作,发现潜在的漏洞后,维护人员、开发人员、研究人员与工具生态系统都会协同工作,以确保代码安全。GitHub 自2017年11月发布安全警报以来,目前已修复了超过700万条警报。更多除了以上关于GitHub本身的数据,还一有些托管项目的数据:Python成为GitHub上第二受欢迎的语言。Dart和Rust是增长最快的语言。在过去三年中,使用Jupyter Notebook的同比增长超过100%。TensorFlow的贡献者从2238涨长25166人。详细报告可以查看:https://octoverse.github.com
Python 之父退休,C 语言之父与世长辞,各大编程语言创始人现状大曝光!
从世界上第一台计算机(ENIAC) 于1946年2月在美国诞生至今的七十多年里,涌现出了许多优秀的计算机编程语言。程序员们在使用它们编写程序的时候,一定很好奇发明这些语言的发明者背后的故事,以及他们现状,是像Python 之父一样功成身退,还是继续奋战在编程一线。
[图]谷歌发布Python在线课程:丰富求职人员技能
伴随着科技行业对美国求职人员不断提出更高要求,在丰富他们的职业技能方面谷歌希望提供更多的帮助。本周四,这家搜索巨头宣布推出全新的编程语言Python课程,而这正是很多企业和雇主正在寻找的一项关键技能。
Google为Colab服务推出新的“即用即付”选项
Colab 是谷歌提供的一项服务,旨在允许任何人通过 Web 浏览器编写和执行任意 Python 代码。不过现在,全称 Google Colaboratory 的这项服务,正在推出“即用即付”的新计划。据悉,自 2020 年推出高级订阅选项以来,这是 Google 首次为 Colab 带来新的定价方案。
被忽视15年的CVE-2007-4559 Python漏洞 导致35万项目陷入代码执行风险
Python 编程语言中一个被忽视了 15 年的漏洞,正在重新引发人们的关注,因为它可能对超过 35 万个开源存储库项目造成影响。其实早在 2007 年,就已经有安全研究人员披露并标记过 CVE-2007-4559 。遗憾的是,它一直没有获得正式的修复补丁。唯一的缓解措施,也只是在更新后的开发者文档中提示了相关风险。但是现在,该漏洞又被发现可用于代码执行。
谷歌 Fuchsia OS编程语言策略公布:前端用 Dart,Go 要退出
谷歌新一代开源操作系统 Fuchsia 的开发者网站上公布了一份 Fuchsia 编辑语言策略,文档描述了 C、C++、Dart、Rust 与 Go 的优劣势,并明确指定了其中哪些语言将会在 Fuchsia 开发生态中得到怎样程度的支持。该策略文档描述了 Fuchsia 项目在 Fuchsia Platform Source Tree(Fuchsia 平台源码树)和供终端开发者在这之外构建 Fuchsia 开发目标设备软件时使用和支持的编程语言。Fuchsia Platform Source Tree 是 fuchsia.googlesource.com 上托管的 Fuchsia 源码,终端开发者是指在 Fuchsia Platform Source Tree 之外为 Fuchsia 编写软件的人。与终端开发者相比,Fuchsia Platform Source Tree 可以汇聚对 Fuchsia 系统及其基础技术更大的更改,因为可以执行仅影响 Fuchsia Platform Source Tree 的更改,而无需与其他人员进行协调。相反,影响终端开发者的更改需要更多的协调,并且需要更长的执行时间。谷歌介绍,对终端开发者的支持意味着 Fuchsia SDK 需要包含可帮助他们为 Fuchsia 开发软件的工具和库,包括 FIDL(Fuchsia Interface definition language,Fuchsia 接口定义语言)特定语言后端与支持库等。对异步编程的强大支持则意味着可以使用直线型代码,例如使用 Rust/Dart 等语言的 async/await 编写异步程序。文档接下来分别罗列了几种编程语言,分析了它们的优缺点之后,得出如下结论:CC 被支持用于终端开发者。在 Fuchsia Platform Source Tree 中,不鼓励使用 C 的新用法,并且仅批准用于以下领域:用于底层系统编程,包括内核中用于定义到共享库和其它系统组件的 ABI 稳定接口C++C++ 被支持用于终端开发者。批准在整个 Fuchsia Platform Source Tree 中使用 C++。DartDart 被支持用于面向非驱动程序的终端开发者。Dart 被批准在 Fuchsia Platform Source Tree 中用于用户界面和无限期运行的程序。Rust终端开发者不支持使用 Rust。除了 Zircon 内核,Rust 被批准在整个 Fuchsia Platform Source Tree 中使用。GoGo 仅被批准在网络技术栈中使用,因为网络栈的迁移需要大量成本。时间准许的话,应该将网络栈迁移到批准的语言。必须将 Fuchsia 中用于目标设备上生产软件的所有其它 Go 代码迁移到批准的语言。总结一下,Go 在 Fuchsia 生态中可能会有些失落,值得注意的是文档中关于其缺点的介绍:使用垃圾回收来管理内存,这比其它用于管理内存的技术占用更多的资源运行时环境庞大Fuchsia Platform Source Tree 在使用 Go 方面具有负面的实施经验。Fuchsia 项目在 Go 中构建的系统组件消耗的内存和内核资源相比使用 C++ 或 Rust 构建的同类组件更多工具链产生大型二进制文件值得关注的是,文档中没有涉及 Fuchsia 已经确认支持的 Python。不过关于 Python 的支持细节,支持语言页面也没有详细内容,只有一栏栏 TODO,应该是还没有做好准备。而另一方面,此前关于支持 JavaScript 的传言,看来也无法得证。原文链接
两个月微博热搜分析:疫情之下,哪些时、地、人、物处在舆论的风口浪尖
两个月前的12月25日,一份因“不明原因”发热患者标本在武汉市疾控中心准备完毕,准备送往上海市公共卫生临床中心进行研究。这个病例标本后来被证实含有一种新型冠状病毒,正是这种病毒造成了这次建国后“前所未有”的疫情。疫情的严重性也反映在了人们的情绪中,在家中隔离的人们在网络上关注着疫情相关的各种新闻,微博热搜也持续被疫情刷屏,在1月26这一天,关于疫情的热搜占据了微博前50条热搜中的40条。为了更好的从网络中观察这次疫情,文摘菌爬取从1月1日至2月21日每天12:00微博热搜榜前50的条目,一共得到2600条热搜数据,我们对这些数据用python进行了处理和分析,得出了很多有意思的信息:比如,从第一条新冠肺炎相关热搜12月31日出现,到1月20日,6省市出现疫情上热搜,中间悄无声息的重要三周,疫情虽然已有了苗头,但由于一直被掩盖,并没有引起人们的重视,随着春运的开启,拉开了这次大爆发的序幕;从地点来看,除了湖北、武汉以外,热搜最多的省份是浙江、广东、河南、山东;被关注最多的人物毋庸置疑,钟南山、李兰香院士和医务工作者们热搜次数最多;“故事”最多的机构则是卫健委和红十字。从这些热搜和其出现的时间中,我们可以一窥这次的疫情的发展时间线,以及在这特殊的两个月中,反映在数据上的人间悲欢疾苦。项目地址:https://wqw547243068.github.io/2020/02/06/virus/消失的三周:12月31日出现第一条新冠肺炎相关热搜电影《流浪地球》的开头是这么一句话,“最初,没有人在意这场灾难,这不过是一场山火,一次旱灾,一个物种的灭绝,一座城市的消失。直到这场灾难和每个人息息相关。”这次由新型冠状病毒引发的全国性的严重疫情也是如此,如果说微博的热搜反映了人们关注的焦点,那么新型冠状病毒在微博走进全国网友的视线是在12月31日12时03分,一条名为“武汉发现不明原因肺炎”的热搜排到了第1位。这条热搜在当天20:24便淹没在了其他热搜之中。我们把时间往回倒三周,根据武汉市卫健委后续通报中所述,首例“不明原因”的病毒性肺炎患者的出现是在12月8日。从12月8日到12月31日,因为各种原因,新冠肺炎在微博上“消失”了三周多。然而从微博数据来看,尽管12月31日新型冠状病毒出现在大家视野之后,似乎依然没有立即引起足够的重视,到1月9日才开始持续出现疫情相关热搜。我们对1月9日至2月21日出现的关于疫情的热搜进行了统计,从1月10日到1月19日,这十天关于疫情的热搜只是一两条,直到1月20日,热搜的条目开始激增,更是在1月26这一天,占据了50条热搜中的40条。那么1月20日这一天发什么什么呢?武汉新汇报136例确诊病例,累积确诊的病例人数猛增至198人。当日晚上,钟南山院士在接受官方媒体采访时,首度确定该病毒可以“人传人”,并透露有14名医护人员感染。同时,让所有人都无法置身事外的,是随着春运伊始,病毒已经悄无声息地从武汉扩散到了其他城市的事实。也是这个时候,口罩抢购和短缺开始出现。直到此刻,这次疫情才真正拉开序幕,成为了未来几个月,所有人关注的话题。风暴的中心:湖北·武汉对热搜进行了分词然后进行统计,我们发现出现最多的是“肺炎”和“新增”两个词,显然,这两个词也是最牵动人心的。当然,这两个词排名最高和两个条目有关:全国新增确诊新冠肺炎病例湖北新增确诊新冠肺炎病例在这揪心的两个月,多少人和文摘菌一样,每天早晨醒来后的第一件事就是去查看新增病例数,期待拐点的出现,在亿万民众的关注下,这两个条目也因此每天都会出现在微博热搜。除了这两个词,排名最高的词则是本次疫情“风暴”的中心——武汉,一共出现102次,同时湖北也排名很高,共出现62次。1月23日武汉宣布“封城”,限制公共交通出入,至此,全国的目光都转向湖北武汉。对一个人口千万级别大城市采取如此最严厉的防疫措施,这是新中国历史上第一次,也是人类历史上第一次。如果说之前还有人心存侥幸,那么在腊月二十九武汉封城的这一天,几乎所有人都意识到,这个年不会好过了。除了湖北、武汉,几乎每个省份或者大城市确诊首例肺炎患者都会上一次热搜,牵动着这个省市所有人的心。我们对热搜中出现的所有地名进行了统计,得出了地名的词云,并画出了各省份关注度的分布和热力图。可以看到,武汉和湖北是关注最多的地方,而河南、山东、浙江、广东等地区的出镜率也很高。河南的首次上热搜是因为“硬核”的防疫“作业”让其他省份的网友羡慕不已,1月24日“河南硬核”的条目进入微博热搜前五,同一天,“来抄河南作业”的热搜从第17位跃升至第9位。▲河南“硬核”防疫上热搜山东的多次出现的关联词则是“热心”。先是率先援助出2万副护目镜,之后寿光又承诺每天向湖北供应600吨蔬菜。浙江和广东的热搜多是集中于两地的官方通报和政策通知,包括疫情的变化,以及延迟开学和上班和后期的复工复学的通知,这两个省份的政务效率被频频夸赞。热搜中其他国家的出现分为两种情况,一是疫情中一些国家对中国的援助,二是疫情向其他国家的传播。以关注度最高的日本为例,前期因为向中国捐赠10万套防护服和其他物资而上热搜,后期则因为“钻石公主”号邮轮出现聚集性感染而受到广泛关注。熟悉的身影:医护和学者疫情中,没有什么比“人”更加重要。我们对疫情相关热搜中与人物相关的词作了统计,其中出现频率最高的是钟南山院士,其次是医护人员、医生、医疗队和护士。1月19日,国家卫健委派高级别专家组赴武汉考察,已经84岁的钟南山院士临危受命,带队出征,之后无论是向公众传播疫情相关知识,还是指导政府部门进行防控指挥,钟院士的话每次都能得到全网的强烈反响。从“钟南山说动才动”这条热搜,足以看出全国人民对他的信赖,而钟院士身上承载的压力也可见一番。另一位出现次数不多,但是搜索次数却最多的名字是李文亮,2月6日“李文亮医生去世”的消息登上热搜第一名,搜索量达到1900万。那天凌晨的互联网圈可能会被很多人铭记许久,除了“李文亮”,微博和朋友圈上几乎再无其他内容,这是微博热搜历史,甚至整个中国互联网舆情史上,都从未出现过的一次群体情绪爆发。除了具体的人名,还有一个群体牵动着全国人民的心——医护人员。疫情发展最凶猛的时候,也是医护人员上热搜最多的时候:1月24日,“三所军医大学450人医疗队支援湖北”;1月25日,“卫健委派1230人医疗队驰援武汉”;1月28日,“内蒙古139名医护出征武汉”;2月2日,“多所高校派医护人员驰援武汉”;2月4日,再增加2000名医护人员支援湖北;……截止今日,全国累积支援湖北的医务工作者已超过3万。除了对疫情的关注和对医护人员的敬意,疫情中的问责也一直在进行。一些公务人员因为工作失职而被撤职或者处分的消息,也频频登顶热搜。1月31日,中央督查组赴黄冈督查核查,时任当地卫健委主任唐志红一问三不知,事后被免职。仅仅从微博热搜中统计,疫情中被处分的干部就有近400人。绝对的C位:口罩、卫健委和红十字这次疫情受关注最多的物资当属“口罩”了,在所有的热搜中,口罩共出现58次。人们关于口罩最关心的集中在三个方面——“怎么用”、“到哪买”、“怎么劝父母戴”,1月23日,“怎么劝说父母戴口罩”上了热搜,年轻人对于长辈的固执显得有些无可奈何,而当天出现的另一条热搜“武汉要求全市在公共场合佩戴口罩”则替年轻人解决了这一难题。也是在23日,还有一条热搜是“工信部紧急协调口罩生产”,当时还对带口罩不上心的人,往后一段时间面临的最大问题则是买不到口罩了。另外,从机构来看,最受关注的不出意料是卫健委。从1月3日,武汉卫健委通报不明原因肺炎开始,卫健委就一直处于疫情防控的舆论中心,也一直承担着辟谣的工作,所以卫健委关联度最大的两个词便是“回应”。“卫健委回应部分中成药可防治肺炎”;“国家卫健委回应黄冈卫健委主任被免职”;“卫健委回应公布数据与网传数据差太多”……而另一个处于风口浪尖的部门则是红十字会,作为一个慈善机构,却在这次疫情中因为负面舆论上了多次热搜,综合起来甚至可以串成一个故事。1月份,武汉政府、湖北政府回应了“口罩事件”和“寿光蔬菜事件”;2月1日,在全网的追问下,武汉市政府承认“武汉红十字会存在调拨不及时问题”,成为当天热搜;次日,在全国观众的眼皮底下,“武汉红十字会保安拦央视记者”又上热搜;2月2日,“中国红十字会总会派工作组赴湖北武汉”;2月4日,“湖北通报红十字会领导失职失责”;2月10日,“红十字会总会要求湖北彻底整改”。和17年前的那场疫情一样,灾难之下,各种悲欢离合又一次重新上演;而和17年前那场疫情不同,因为互联网和信息的发展,每一个人都有发声的机会。网友们用手机投票选出的这些“热搜”,不会被遗忘和篡改,这些处在风口浪尖上的时间、地点、人名和机构,正勾勒出一副巨大的历史图卷,也许疫情会在三、五个月内平息,但数据不会,记忆也不会。
谷歌TensorFlow 2.1.0正式发布,最后支持Python 2
TensorFlow 2.1.0 正式发布了,TensorFlow 2.1 是支持 Python 2 的最后一个 TF 版本。主要特性和改进如下:tensorflow pip 软件包现在默认包括针对 Linux 和 Windows 的 GPU 支持(与 tensorflow-gpu 相同)。它可以在带有和不带有 NVIDIA GPU 的机器上运行。 tensorflow-gpu 仍然可用,对于关心软件包大小的用户,可以在 tensorflow-cpu 上下载仅 CPU 的软件包。Windows 用户:为了利用新的 /d2ReducedOptimizeHugeFunctions 编译器标志,现在使用 Visual Studio 2019 版本 16.4 构建了正式发布的 tensorflow Pip 程序包。要使用这些新程序包,必须安装 “Visual Studio 2015、2017 和 2019 的 Microsoft Visual C++ 可再发行组件”。这不会更改在 Windows 上从源代码构建 TensorFlow 所需的最低版本,但是在没有此标志的情况下,启用 EIGEN_STRONG_INLINE 的构建可能需要超过 48 个小时才能进行编译。如果你的计算机上缺少必需的 DLL,msvcp140.dll(旧)或 msvcp140_1.dll(新)之一,则导入 tensorflow 将显示警告消息。tensorflow pip 软件包使用 CUDA 10.1 和 cuDNN 7.6 构建。tf.kerasGPU 和 Cloud TPU 提供了对混合精度的实验支持。引入了 TextVectorization 层,该层将原始字符串作为输入,并负责文本标准化、标记化、n-gram 生成和词汇索引。只要在范围内构建模型,就可以将 Keras .compile .fit .evaluate 和 .predict 置于 DistributionStrategy 范围之外。对于所有类型的 Keras 模型(顺序模型、功能模型和子类模型)、Cloud TPU、Cloud TPU 均可提供 Keras .compile,.fit,.evaluate 和 .predict 的实验支持。为云 TPU 启用了自动外部编译。这使得 tf.summary 可以更方便地与 Cloud TPU 一起使用。Cloud TPU 支持带有 DistributionStrategy 和 Keras 的动态批量大小。除了 tf.data.Dataset 之外,还使用 numpy 数据在 TPU 上支持 .fit,.evaluate,.predict。TensorFlow Model Garden 提供了许多流行模型的 Keras 参考实现。tf.data更改 tf.data 数据集的重新编录+分发策略以提高性能。请注意,数据集的行为也略有不同,因为重新标记的数据集基数将始终是副本数的倍数。tf.data.Dataset现在支持在分布式环境中(包括在 TPU 容器上)自动进行数据分发和分片。现在可以这样调整 tf.data.Dataset 的分发策略: 1. tf.data.experimental.AutoShardPolicy(OFF, AUTO, FILE, DATA) 2. tf.data.experimental.ExternalStatePolicy(WARN, IGNORE, FAIL)添加了环境变量 TF_DETERMINISTIC_OPS。当设置为 “true” 或 “1” 时,此环境变量使 tf.nn.bias_add 确定性地(即可重复地)运行,但当前仅当未启用 XLA JIT 编译时才运行。这使得 Keras Conv*D 和 MaxPool*D 层在启用 CUDA 的 GPU 上运行时可确定地在向前和向后两个方向上运行。详情见更新说明:https://github.com/tensorflow/tensorflow/releases/tag/v2.1.0
Apache HTTP Server 2.4.43 稳定版发布
感谢BlueRoyale的投递Apache HTTP Server(简称Apache)是Apache软件基金会的一个开放源码的网页服务器,可以在大多数电脑操作系统中运行,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩充,将Perl/Python等解释器编译到服务器中。
Google悄悄禁止Colab上的Deepfake培训项目
Google已经悄悄地禁止了其Colaboratory(Colab)服务上的Deepfake项目,结束了为此目的而大规模利用该平台资源的情况。Colab是一个在线计算资源,允许研究人员直接通过浏览器运行Python代码,同时使用免费的计算资源,包括GPU,为其项目提供算力。
微软推出Pylance 改善VS Code中的Python体验
微软宣布推出一种新的 Python 语言服务器,名为 Pylance,其可利用语言服务器协议与 VS Code 进行通信。Pylance 这个名字是对 Monty Python 的 Lancelot 的致敬,Lancelot 是亚瑟王和圆桌骑士中的第一位勇士。
代码跑得慢甩锅Python?手把手教你如何给代码提速30%
Python已经得到了全球程序员的喜爱,但是还是遭到一些人的诟病,原因之一就是认为它运行缓慢。其实某个特定程序(无论使用何种编程语言)的运行速度是快还是慢,在很大程度上取决于编写该程序的开发人员自身素质,以及他们编写优化而高效代码的能力。Medium上一位小哥就详细讲了讲如何让python提速30%,以此证明代码跑得慢不是python的问题,而是代码本身的问题。时序分析在开始进行任何优化之前,我们首先需要找出代码的哪些部分使整个程序变慢。有时程序的问题很明显,但是如果你一时不知道问题出在哪里,那么这里有一些可能的选项:注意:这是我将用于演示的程序,它将进行指数计算(取自Python文档):如果你只能知道整个程序的运行时间,这样就够了,但通常这还远远不够。最详细的分析另外一个指令是cProfile,但是它提供的信息过于详细了。在这里,我们使用cProfile模块和time参数运行测试脚本,以便按内部时间(cumtime)对行进行排序。这给了我们很多信息,你在上面看到的行大约是实际输出的10%。由此可见,exp函数是罪魁祸首,现在我们可以更详细地了解时序和性能分析。时序特定功能现在我们知道了应当主要关注哪里,我们可能想对运行速度缓慢的函数计时,而不用测量其余的代码。为此,我们可以使用一个简单的装饰器:然后可以将此装饰器应用于待测功能,如下所示:这给出我们如下输出:需要考虑的一件事是我们实际想要测量的时间。时间包提供time.perf_counter和time.process_time两个函数。他们的区别在于perf_counter返回的绝对值,包括你的Python程序进程未运行时的时间,因此它可能会受到计算机负载的影响。另一方面,process_time仅返回用户时间(不包括系统时间),这仅是你的过程时间。加速吧!让Python程序运行得更快,这部分会很有趣!我不会展示可以解决你的性能问题的技巧和代码,更多地是关于构想和策略的,这些构想和策略在使用时可能会对性能产生巨大影响,在某些情况下,可以将速度提高30%。使用内置数据类型这一点很明显。内置数据类型非常快,尤其是与我们的自定义类型(例如树或链接列表)相比。这主要是因为内置程序是用C实现的,因此在使用Python进行编码时我们的速度实在无法与之匹敌。使用lru_cache缓存/记忆我已经在上一篇博客中展示了此内容,但我认为值得用简单的示例来重复它:上面的函数使用time.sleep模拟大量计算。第一次使用参数1调用时,它将等待2秒钟,然后才返回结果。再次调用时,结果已经被缓存,因此它将跳过函数的主体并立即返回结果。有关更多实际示例,请参见以前的博客文章。使用局部变量这与在每个作用域中查找变量的速度有关,因为它不只是使用局部变量还是全局变量。实际上,即使在函数的局部变量(最快),类级属性(例如self.name——较慢)和全局(例如,导入的函数)如time.time(最慢)之间,查找速度实际上也有所不同。你可以通过使用看似不必要的分配来提高性能,如下所示:使用函数这似乎违反直觉,因为调用函数会将更多的东西放到堆栈上,并从函数返回中产生开销,但这与上一点有关。如果仅将整个代码放在一个文件中而不将其放入函数中,则由于全局变量,它的运行速度会慢得多。因此,你可以通过将整个代码包装在main函数中并调用一次来加速代码,如下所示:不访问属性可能会使你的程序变慢的另一件事是点运算符(.),它在获得对象属性时被使用。此运算符使用__getattribute__触发字典查找,这会在代码中产生额外的开销。那么,我们如何才能真正避免(限制)使用它呢?当心字符串使用模数(%s)或.format()进行循环运行时,字符串操作可能会变得非常慢。我们有什么更好的选择?根据雷蒙德·海廷格(Raymond Hettinger)最近的推特,我们唯一应该使用的是f字符串,它是最易读,最简洁且最快的方法。根据该推特,这是你可以使用的方法列表——最快到最慢:生成器本质上并没有更快,因为它们被允许进行延迟计算,从而节省了内存而不是时间。但是,保存的内存可能会导致你的程序实际运行得更快。这是怎么做到的?如果你有一个很大的数据集,而没有使用生成器(迭代器),那么数据可能会溢出CPU L1缓存,这将大大减慢内存中值的查找速度。在性能方面,非常重要的一点是CPU可以将正在处理的所有数据尽可能地保存在缓存中。你可以观看Raymond Hettingers的视频,他在其中提到了这些问题。结论优化的首要规则是不要优化。但是,如果确实需要,那么我希望上面这些技巧可以帮助你。但是,在优化代码时要小心,因为它可能最终使你的代码难以阅读,因此难以维护,这可能超过优化的好处。
GitHub十大热门Python项目
GitHub显然是绝大多数在线代码的家园。Python作为一种神奇而又通用的编程语言,已经被成千上万的开发者用来构建各种有趣而有用的项目。在下面的部分,我们将尝试涵盖GitHub上一些使用Python构建的最佳项目。
Python 3.7.8 与 3.6.11 发布
Python 3.7.8 与 3.6.11 发布了,其中 3.7.8 是 3.7.x 系列的最后一个修复版本。需要注意的是,Python 3.8 现在是 Python 3 系列的最新特性版本。在持续发布了两年的 3.7.x bug 修复版本,以及去年成功发布和采用 Python 3.8 之后,预计 3.7.8 将是该系列最后一个 bug 修复版本,开发者应该考虑尽快升级到 3.8。
如果新冠病毒在亚美尼亚爆发会发生什么?程序员用Python进行模拟
2019年末,在中国武汉爆发的冠状病毒疫情冲击了整个金融市场和实体经济。这座总人口超过千万,春运期间流动人口超过500万的巨型城市的灾难在世界各地引发了一连串蝴蝶效应,也在全球普通民众中引发恐慌。2020年1月30日,2019-nCoV已被世界卫生组织列为国际关注的突发公共卫生事件(PHEIC)。在撰写本文时,尚未发现经过医学研究验证的具体治疗方法。此外,一些关键的流行病学指标,如基本再生数(一个感染者传染的平均人数,即R0值)仍然未知。当今时代,全球互联,这类流行病更是借势成为全球范围内的重大威胁之一。可以推测,如果2020年全球发生灾难性事件(大致定义为导致不少于1亿人伤亡的事件),最有可能的原因恰恰是某种流行病——而不是核灾难,也不是气候灾难,等等。全球范围内的快速城市化进一步加剧了这一问题,人口密集且频繁流动的城市俨然变成了疾病扩散网络的传播节点,使得防疫系统变得极为脆弱。武汉的这场灾难也引发了全球对于城市规划和防疫政策的思考。如果疾病不是在武汉,而是在另一座人口规模更小、人口流动也更弱的城市,它的传染性和感染人数,又会是怎样的故事?在这篇文章中,我们将讨论当流行病袭击一个城市时会发生什么,应该立即采取什么措施,以及这对城市规划、政策制定和管理有什么影响。我们将以亚美尼亚首都,一个人口刚过百万、以钢铁和葡萄酒著名的城市埃里温市为例进行研究,建立数学模型并模拟冠状病毒在该市的传播,研究城市流动模式如何影响疾病的传播。城市流动性有效、高效和可持续的城市流动性对现代城市的运作至关重要。它已经被证明会直接影响城市的宜居性和经济产出(GDP)。然而,一旦发生疫情,它就会火上浇油,扩大疾病的传播。那么,让我们先来看看埃里温市在一个平面坐标系上的聚合OD流动网络(Origin-Destination),以了解城市流动模式的空间结构:接着,如果我们观察网格的总流入量,我们会看到或多或少的单中心空间组织,其中一些网格的日流入量较高但位于中心之外:现在,假设一种流行病在城市的任意地点爆发。它将如何传播?我们能做些什么来控制它?流行病学建模为了回答这些问题,我们将建立一个简单的房室模型来模拟传染病在城市中的传播。当一种流行病爆发时,其传播动力会有显著变化,这取决于最初感染的地理位置及其与城市其他地区的连接性。这是最近关于城市人口流行病的数据驱动研究得出的最重要见解之一。然而,正如我们将在下文进一步看到的,各种结果都要求采取类似的措施来控制疫情,并在规划和管理城市时考虑到这种可能性。注:compartmental model,房室模型,也称SIR模型,是一种简化的传染病数学模型。由于我们的目标是展示城市流行病传播的一般原理,而不是建立一个实时的精确模型,我将参考《自然》杂志的一篇文章,通过简单地修改经典SIR模型即可满足我们的需求。相关链接:https://www.nature.com/articles/s41467-017-02064-4这个模型把人口分成三部分。在时间t的每个位置i,其三个房室如下:Si,t:尚未感染或易感的人数;Ii,t:感染疾病并有能力将疾病传播给易感人群的人数;Ri,t: 由于康复或者死亡,在被感染后从受感染组中移除的人数。这个群体中的个体没有能力再次感染该疾病或将感染病传染给他人。在我们的模拟中,时间将是一个离散变量,因为系统的状态是以日为单位进行建模的。在t时刻j点的完全易感人群中,感染病出现的概率为:βt是t时刻的传输率; mj,k是从k地到j地的流动性, xk,t 和yk,t 代表t时刻k地和j地的感染和易感人群数,其中xk,t = Ik,t / Nk,yj,t = Sj,t / Nj,Nk和Nj代表k地和j地的人口总数。然后,我们继续模拟一个随机过程,将这种疾病引入完全易感人群所在的地区,其中Ij,t+1 是概率为h(t,j)的伯努利随机变量。一旦感染在随机地点出现,疾病不仅会在该地点传播,还会通过携带者传播到他处。这就是以OD流矩阵为特征的城市流动模式发挥关键作用的地方。此外,为了确定疾病是如何通过感染者传播的,我们需要考虑其R0值。此处,其中y表示的是治愈率,也可以认为是二次感染率。在撰写本文时,新型冠状病毒的基本再生数估计值在1.4到4之间。凡事做最坏的准备,因此我们假设R0值为4。需要注意的是,R0值是一个有期望值的随机变量。为了让事情更有趣一点,我们在每个地区采用不同的R0值进行模拟,其中R0值服从均值为4的伽玛分布:现在我们来讨论所建立的模型:βk,t是t时刻k地的转移率,α是刻画出行方式倾向的参数。上述的模型十分简洁:为了求得t + 1时刻的j地的尚未感染或易感的人数,我们需要从t时刻的j地的尚未感染或易感的人数中减去j地本地感染的人数(第一个方程的第二部分),还要减去从其他地方来到j地的感染者数,这些外来的感染者通过其传输率进行加权计算(第一个方程的第三部分)。由于总人口数Nj = Sj + Ij + Rj,我们需要将减去的部分移至感染组,同时将治愈的部分移至Rj,t+1(第二个和第三个方程)。仿真建立在此分析中,我们将使用由当地共乘公司gg提供的GPS数据获得的一个典型日的总OD流量矩阵作为埃里温市交通模式的代表。接下来,我们需要每个250×250m网格单元的人口计数,通过按比例缩放提取的流量计数来近似计算,从而使不同位置的总流入量之和接近埃里温市110万人口的一半。这是一个大胆的假设,但对结果影响不大。减少公共交通?第一次模拟,我们将模拟背景设定为一个高度依赖公共交通的未来城市,设定流动率α=0.9:可以看到,经过大约8-10天左右的时间感染人数比例迅速增加至70%,达到峰值,但此时仅有小部分(约10%)的人康复。至100天时,疫情逐渐缓解,康复人数比例达到了惊人的90%!现在,我们再来看一下如果将公共交通强度α降低至0.2时,是否有利于缓解传染病的传播。这可以解释为采取严厉措施来降低城市流动性(例如实施宵禁),或者增加私家车出行比例,以减少人们出行期间感染的机率。可以发现在这种假设下,疫情在16至20天左右到达顶峰,峰值感染人数比例明显降低(约45%),并且此时康复人数为之前的两倍(约20%)。在疫情结行将结束时,易感染人群比例也是之前的两倍(约24% vs. 约12%),这意味着更多的人躲过了这场疫情。正如人们所期望的,通过实施严厉的管控措施来临时降低城市的流动性对于减少传染病传播有明显作用。隔离热门区域?接着,再来看另一个直观想法——隔离一些关键区域能否得到预期的效果。为了测试这一想法,先挑选人流量位于前1%的区域:接着完全限制这些区域的进出,建立有效的隔离制度。从这张图我们可以看出,在埃里温市这些位置主要位于市中心,另两个位置是两家最大的购物商场。将α取中间值,即0.5,我们得到如下结果:感染人数比例的峰值更小了(约35%),并且更重要的是,在疫情行将结束时,大约一半的人未被感染,说明该种方法能够帮助人们有效的降低感染风险!如下动图显示了高度依赖公共交通场景下的结果:结论该实验绝不是说我们已经构建了准确的传染病模型(甚至模型中不涉及任何传染病学的基础知识),我们的目标是在传染病爆发时能够即时了解城市交通网络对传染病传播的影响。随着人口密度、流动性和互动性的增强,我们的城市更容易发生“黑天鹅”事件,并且变得更加脆弱。例如,我们从这个模型可以发现在关键地区实施隔离制度或者采取严苛的措施来控制人员流动能够在疫情期间发挥巨大作用。但还有一个十分重要的问题就是,如何在执行这些措施期间,使得城市功能和经济的损坏最小化?此外,传染病传播机制也是一个活跃的研究领域,该领域的成果必须要渗透并整合到城市规划、政策制定和城市管理当中,以使我们的城市更安全更抗打击。上述模型代码如下:import numpy as np
RedMonk 2020年Q1编程语言排行:Python 冲进前二 Dart值得关注
知名软件行业分析公司 RedMonk 发布了 2020 年第一季度编程语言排行榜。RedMonk 编程语言排行榜通过追踪编程语言在 GitHub 和 Stack Overflow 上的代码使用情况与讨论数量,统计分析后进行排序,其旨在深入了解潜在的语言采用趋势。该榜单一年发布两次,这是今年第一份榜单,下一次榜单将于 6 月份,即第三季度编程语言排行。
Python 3.7.7 发布 bug 修复版本
Python 3.7.7 发布了,这是一个 bug 修复版本。2020 年中之前将持续更新 3.7 系列的 bug 修复版本,并直到 2023 年中之前持续提供安全修复版本。目前 3.8 已经是最新的特性版本系列,官方建议开发者迁移。
Facebook "TransCoder AI"可在 Java、Python 和 C++ 之间转换代码
Facebook 研究人员表示,他们已经开发出了一种名为 TransCoder AI 的“神经编译器” ,该系统可以将代码从一种高级编程语言(如 C ++、Java 和 Python)转换为另一种。
云拜年攻略!用Python自动回复拜年消息,还能“抗”七姑八姨的灵魂问题
为了响应国家号召,今年过年不出去拜年,不出去走亲戚,开启了“云拜年”新模式。从年三十到今天,手机上的拜年消息就没停过,大多还是群发,不回复显得很没有礼貌,一一回复又累心劳神。甚至因为出不了门,七大姑八大姨就更闲了,“云催婚”、“云催娃”也应运而生,如果你也在为此而烦恼,那么你就需要一款能够自动回复拜年信息的小程序,最好还能自动回复各种微信消息,应对七大姑八大姨的花式催婚和催娃。这么小小的要求,Python当然可以做到,itchat包帮你解决一切,没有安装的同学需要先安装,用Python操作微信真是好玩到停不下来!具体思路就是现在图灵机器人网站上注册一个账号,记下自己的key码,代码中要用到。然后在Python中用itchat登录微信,当接受到消息后(可以简单用个if函数设置只对特定好友有效),提交到图灵机器人网站并得到回复,而后将此回复再发送给好友。#引入itchat包
GitHub Copilot现在开始支持Neovim和JetBrains IDE
早在6月,GitHub宣布了GitHub Copilot,这是一项新的人工智能服务,可以在IDE环境内为整行或整个函数提供代码建议。GitHub Copilot对Python、JavaScript、TypeScript、Ruby和Go都很适用。GitHub Copilot由OpenAI Codex驱动,这是一个由OpenAI创建的新人工智能系统。
高中生福利!清华姚班首发高中AI教材,大咖领衔主编
姚期智领衔主编、清华姚班师资做编委的高中AI教材来了!1月7日上午,由图灵奖得主、中科院院士、清华大学交叉信息研究院院长姚期智领衔主编的教材《人工智能(高中版)》,在清华举办了正式的签约仪式。这本书的编委全部来自清华交叉信息研究院计算机科学实验班(姚班)和人工智能班(智班)教学团队。如此大咖云集,也足以看到清华和姚班对这次教材编撰的认真和诚意。其实早在去年上半年,清华姚班就曾透露过要出一本高中人工智能教材的想法。虽然与市面上已有的各类AI教材相比,姚班这次发布高中AI教材的时间并不占先,但是慢工出细活,正如姚期智院士在发布会上所说,“我们(编委会)会把高中教育当作和大学教育一样的事业,怀抱同样的热忱,尽心尽力”。说了这么多,姚班这本教材有何特点和不同,那么就请和文摘菌一起来揭秘清华发布的首本AI教材吧!大咖云集,姚班首本AI教材姚班的这版AI教材名为《人工智能(高中版)》,教材编委阵容可谓非常豪华:姚期智亲自担任主编,副主编为智班班主任黄隆波,编委由高阳、李建、马雄峰等人组成,全都是清华大学交叉信息研究院的教授,对人工智能学科基础与前沿有着深入、全面的把握。从教材内容的章节编排上看,本书共分为9个章节,分别为“数学与编程基础”、“搜索”、“机器学习”、“线性回归”、“决策树与随机森林”、“神经网络”、“计算机视觉”、“自然语言处理”、“强化学习”。从第0章到第4章介绍的都是人工智能的基础性知识,后4个章节的灵活性较大,可供学生和老师选修学习,使其与人工智能的高等教育无缝连接,有力支撑中学人工智能基础教育。对于知识点的选取,姚期智表示这是基于姚班/智班人工智能课程体系的完整梳理:除了体系化的教材知识结构设计,还结合了相关中学知识,便于学生学习和理解。姚期智院士宣布教材发布此外,姚期智还透露到,这版教材兼具了核心原理和具体形式。从人工智能的发展史入手,介绍人工智能的基础背景,在实践环节习题与编程并重,搭配了专属的学习网站资源,学习阶段被合理量化,对学生后续的深入学习也有不小帮助。姚院士在发布会现场表示,这本书目前已经基本成型,两个月以后就能完成了,希望今年秋天就可以发到同学们手里。发布会现场签约仪式从18年开始,国内市场上已经陆续发布了不少人工智能相关的教材,对此姚院士表示,《人工智能(高中版)》与其他教材有着明显的不同,作为高校教师的编委团队首先将教育放在了首位,高中生学习人工智能不仅是为了学生未来事业发展,也是为了以及未来人工智能的突破性研究,更是为了国家科学强盛和人才科学素质的建立,提升整体国民素质。最重要的一点在于,如果中国想在2035-2050年成为人工智能领先的国家,必须让学生接受正确积极的人工智能教育。“就像巴西足球的全民教育一样,我们要把人工智能当作一门基础学科培养”。姚院士称,作为基础学科的数学和物理,经过多年积累,目前已经有了完善的教育体系,但是人工智能如何教授,全球都在探索。中国必须参与其中,这就要求将国内最有才能的研究者集合起来,负起责任做好这件事。对于不同的教材版本,姚院士认为这是一件好事:国内最好能有不同的学者团队编纂不同的人工智能教科书系列,这样可以让教材种类更加丰富,也是为了在10年之内,让人工智能尽快达到数学和物理这样成熟的教育程度。理论计算机科学家,1986年图灵奖得主John Hopcroft发言发布会现场,理论计算机科学家、1986年图灵奖得主John Hopcroft也对这本书也做出了很高的评价。他说,很多父母无法理解人工智能的事实,给孩子的研究建议往往都十分基础,他希望这一书籍能惠及到包括西部地区的中国孩子们,清华和姚院士应该意识到这是多么有意义的一件事。清华大学出版社社长宗俊峰也发言表示,本次清华交叉信息研究院和清华大学出版社强强联合,一定会为国家提供一本质量内容俱佳的精品教材。同时,他还提到,由于人工智能目前仍在快速发展,为了让学生能够了解到人工智能的最新成就,在相关资源网站上也会进行实时更新。姚班是何班?说起清华姚班,大家可能都不会太陌生,坊间有这么一个传言:半国英才聚清华,一半精英在姚班。随便说几个姚班校友名都能威震四方,比如小马智行联合创始人兼CTO楼天城、旷视联合创始人兼CEO印奇、Bit Up创始人兼CEO黄君贤等等。姚班其实是清华大学“计算机科学实验班”的简称。由迄今为止首位、也是唯一一位华裔图灵奖得主姚期智院士于2005年创办,致力于培养与MIT、普林斯顿大学等世界一流高校本科生具有同等、甚至更高竞争力的领跑国际拔尖创新计算机科学人才。姚班的灵魂人物姚期智院士是算法、密码学、及量子计算的国际权威,先后任教于MIT、斯坦福大学、加州伯克利分校及普林斯顿大学。2004年回国加入清华大学,创办“姚班”,2011年创建“清华量子信息中心”与“交叉信息研究院”,2019年再度为本科生创办“清华学堂人工智能班”,简称智班。在2019年Computer Science Rankings中,清华大学人工智能方向位列世界第二,中国第一,在2019年U.S.News世界大学学科排名中,清华大学计算机科学位列世界第一。这一切除了优质的生源,还得益于姚班课程的合理设置。姚班学生共有25门专业课程(其中包括5门核心课程和可选修课程),第1-6学期,每学期开设1-5门课程,以强化学生的科学基础训练,其它课程按照计算机科学实验班的指导性教学计划中规定的课程要求学习。第四学年,学生将在清华或各著名科研院所从事实际专题研究与实践。姚班核心课程从高中到博士,辐射全民教育除发布高中AI教材、成立姚班,清华在AI教育领域做出的贡献辐射到了从高中到博士的整个阶段。清华于2019年新创办智班,全称“清华大学人工智能学堂班”,也是用姚期智院士的名字命名,同样由姚期智担任首席教授。不过与姚班不同的是,智班瞄准的是“人工智能”这个风口。智班从2019年秋季开始招收本科生,首批招收30人。从招生情况可以看出,大部分招收学生仍是奥赛保送生,但与姚班不同,由于智班的创办目的就是“人工智能”研究,招收的竞赛生也就基本都来自信息学竞赛,只有1个数学竞赛生。智班还有一点与姚班不同,总录取人数排第二的大类,并非是高考裸分学生,而是由自招学生分得一杯羹。看来姚班、智班虽师出同源、一脉相承,但在生源的选择与喜好上,各有目标群体。不仅如此,2018年6月,清华大学人工智能研究院在李兆基科技大楼揭牌成立,清华大学计算机系教授张钹出任首任院长,清华大学交叉信息研究院院长姚期智担纲学术委员会主任,谷歌人工智能部门负责人Jeff Dean出任清华大学计算机学科顾问委员会委员。清华人工智能研究院以“一个核心、两个融合”为发展战略,即以人工智能基础理论和基本方法研究为核心,推进大跨度的学科交叉融合,推进大范围的技术与产业、学校与企业融合。AI教材哪家强?根据2018年7月国务院印发的《新一代人工智能发展规划》,要实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育。4月,商汤联合华东师范大学慕课中心推出了国内第一本面向中学生的AI教材《人工智能基础(高中版)》;6月,苏州大学出版社出版“中小学人工智能系列丛书”;11月,优必选与华东师范大学出版社联合发布“AI上未来智造者——中小学人工智能精品课程系列丛书”。《人工智能基础(高中版)》联合了全国多所知名中学教师进行编写,全书共9个章节,以基础普及性的知识为主,分别介绍了图片识别、声音识别、视频识别、计算机写作和深度学习等人工智能技术的原理和应用场景,每一页都配有彩色图表,引入了科普内容和实例,也注重了对概念原理的介绍。华东师范大学慕课中心还与商汤联合举办了多期“人工智能教师研修班”,旨在提升教师的人工智能素养。“校企合作”的方式是解决人工智能领域应用型人才巨大缺口的有效手段之一。苏州大学出版社的“中小学人工智能系列丛书”共8册,包括《人工智能的无限挑战》《比真实更逼真的VR》《狙击自然灾害》《改变生活的物联网》《迈向宇宙的第一步——运载火箭》《更加快速更加准确——智能医疗》《从A到Z了解游戏引擎》和《第三代基因剪刀》。教材以“设计思维”为核心,通过创新的教学方式,确保每位学生都能够找到适合自己的起点和发展方向。全书课题涉及开源硬件、传感器、VR技术、3D打印以及机器人结构件等,没有相应的硬件教具介绍。优必选发布的这套丛书的目标群体则指向了中小学生,因此实践性更强,利用生活应用和任务激发学生对人工智能的兴趣。此外,丛书体现了“人工智能+N”的应用,设有智慧城市、智能家居、智慧农业等课题,鼓励学生从日常生活、农业、工业等领域学习智能设备的工作原理并提出优化方案,尝试动手实践。丛书共包括十册,包括《AI上神奇动物》《AI上智慧生活》《AI在变形工坊》《AI在奇妙世界》《AI上全能助手》《AI在未来小镇》《AI超级工程师》《AI的幕后英雄——Python》《AI超级设计师》《AI的应用与探索》。针对人工智能学习逐渐低龄化趋势,微软亚洲研究院首席研发总监邹欣曾表示,青少年学习人工智能,培养计算思维是关键。处理人工智能领域纷繁复杂、变化多端的问题,重要的是观察并找到“无变化的模式”,将其转化成基础性的问题。目前中国人工智能产业不断扩大,因此更需要雄厚的人才基础。做好人工智能的科普工作,让更多青少年认识人工智能、了解人工智能,在当下显得尤为重要,也是决定人工智能技术创新和产业发展的重要因素之一。
GitHub年度报告:TypeScript超越C++成第四大语言
今天,GitHub一年一度的Octoverse报告发布啦,大家最关心的编程语言排行榜也一并出炉。微软设计的编程语言、JavaScript的超集、还不到10岁的TypeScript表现亮眼,一举超过C#、PHP、C++,跃升为第四大受欢迎编程语言,仅次于JavaScript、Python和Java。
谷歌被曝解雇整个Python团队,PyTorch创始人直呼“WTF”
4月27日,谷歌Python工程师、Python指导委员会成员Thomas Wouters在社交媒体上发布了一条消息,称谷歌解散了Python团队。也有其他网友补充道,这次裁员可能是出于成本原因进行的重组,有的团队被彻底解散,有的则将两个团队合并为一个。这是“一种有利于低成本地区人们的模式。
RIAA发起闪电战 撤下18个用于下载YouTube视频的GitHub项目
ZDNet 报道称,在美国唱片工业协会(RIAA)提出法律请求之后,微软旗下的 GitHub 代码托管平台,已经撤下了与 youtube-dl 有关联的 18 个项目。据悉,作为一个 Python 库,youtube-dl 允许开发者下载源音频和视频文件。但在致 GitHub 的一封信汇总,RIAA 辩称上述项目“明确涉及规避流媒体服务的技术保护措施”,以允许用户“复制和分发未经授权的音视频”。
2020年,GCC项目代码终于从SVN完全切换至Git
经过数月的延误,GCC 计划在刚过去的周末里将项目的大型代码仓库从 SVN 切换至 Git。原本大家都以为这次又将会再次延误,但实际上,经过团队步履不停的工作,他们已完全将 GCC 的代码仓库从 SVN 切换至 Git。此前出现延误的原因包括内存问题(RAM)、兼容性问题(bugs)以及用 Golang 重写了 Reposurgeon 的 Python 代码,据了解,在上周六 GCC 团队通过使用  Eric S Raymond 的 Reposurgeon 程序完成了 GCC 代码仓库从 SVN 到 Git 的切换。Git conversion ... complete. Verification in progress. #GCC pic.twitter.com/bm6GaUYsTA— GCC - GNU Toolchain (@gnutools) January 11, 2020由于刚刚完成迁移,GCC 的代码仓库尚未重新对外开放,目前仍在验证的过程中。该团队表示,如果所有验证都通过并且周一也没有出现严重的问题,那么代码树会再次开放。不过目前看来,官方表示在进行普通的提交(trivially commits )时会出现性能下降的问题。而针对此问题,尚未有来自团队的任何消息。未来,GCC 团队将会通过使用 Git 的工作流程来开发 GCC,就像 LLVM 当初也是从 SVN 转换到 Git 一样。
Facebook 将 Windows 版 PyTorch 的开发维护权移交给微软
Facebook 通过 PyTorch 官方博客宣布,微软已扩大了对 PyTorch 社区的参与,现在拥有 PyTorch 在 Windows 上的开发和维护所有权。PyTorch 是基于 Torch 的开源 Python 机器学习库,由 Facebook 的人工智能研究团队开发。特斯拉的自动驾驶和 Uber 的 Pyro 等深度学习项目都构建于 PyTorch 之上。
GitHub 2020年度Octoverse报告:Python和TypeScript变得更受欢迎
GitHub 刚刚发布了 2020 年度的 Octoverse 报告,可知该开源代码托管平台吸引了全球 5600 万开发者,高于 2019 年的 4400 万、以及 2018 年的 3100 万。此外受 COVID-19 大流行的影响,开源项目的活跃度也有激增的趋势。在最常用的编程语言中,JavaScript 仍是最受欢迎的一个,Python 区居第二,然后是 Java 和快速增长的 TypeScript 社区。