我分析了2TB的代码来统计每一门语言中最常用的单词

国外某人做了一件很有意思的事情,他分析了大约有2TB的代码来看一看每一门语言中最常用的一些单词是什么?听起来挺有意思,虽然没有什么实际意义,但是是不是能从其中发现些什么?下面,在你没看文章之前,你可以先猜一下每一种语言的最常见单词有哪些?

比如:JavaScript、Python、Java、Go、C++

由于作者对词云做的不是很清晰,所以这里我把他的所有的数据“偷”过来了之后,重新做了一遍词云,将会展示在下面的文中。

首先我们来看看备受欢迎的JavaScript

我分析了2TB的代码来统计每一门语言中最常用的单词

排名前5的词分别是:this\function\if/var/return/the/i/a/to/value

抛开this、return、function等关键词之外,我们还可以看到有两个很特别的i/a,其实i作为我们在循环体中常用的变量名称使用如此之多也并不奇怪,但是这个a就是很独树一帜啊,我们看看亲爱的JS开发者们通常在哪些地方喜欢使用a呢?看来这个a大家还是挺喜欢把它当成array的,或者作为参数名称。我们还能看到return a; 出现的频率是return a (多了个分号)两倍之多,看来大部分开发者还是比较喜欢带分号的。

我分析了2TB的代码来统计每一门语言中最常用的单词

接着我们继续看看Python,我使用Python比较多,

我先猜测一下可能会出现最多的单词:self\import\def\__init__\for

我先说一下猜测这几个的原因:

  • self如同其他语言中的this,使用频率无需多说

  • import导库,基本上每个文件都需要导入文件

  • def如同其他语言的function

  • for遍历,循环:for x in l等等经常用

  • init对象初始化的需要,使用很频繁

然后我们看一下实际上的使用频率词云如下:

我分析了2TB的代码来统计每一门语言中最常用的单词

我们看一下排在前几名的词分别是:self\if\def\return\import\the\in\None\for\from

发现我的判断还是有点对的,忘记了from也作为导入的时候一个重要的单词。大家再看看是不是对于其中的the比较好奇,我也是相当奇怪,然后我们看看都是在什么地方使用的?注释

我分析了2TB的代码来统计每一门语言中最常用的单词

我们继续看Java,Java我也使用过很长时间

所以我先根据自己的情况猜测一下:import\void\public\this\org\String

  • import以及org都是在导入包的时候使用的,其中org是企业组织提供的Java类包

  • void与public搭配也是比较多的,当然int\String等搭配也很多

  • this如同JavaScript以及Python的self

实际情况下的使用是这样的,我们先看词云

我分析了2TB的代码来统计每一门语言中最常用的单词

在Java代码中最常出现的单词排在前十位的分别是:import\return\public\if\the\org\String\this\new\null

在关于Java的讨论中,有一位开发者觉得在这些使用频率表中出现了问题,是与正常情况相悖的,他举例例子比如(你觉得相悖吗?):

  • public高于private

  • override高于final

  • static使用频率如此之高

最后在放上几个我不熟悉的语言的词云,因为不熟悉所以没有假设!

Go语言的单词词云

我分析了2TB的代码来统计每一门语言中最常用的单词

虽然我不懂,但是我看着好像这些单词都是特别的简短,是不是更加快捷啊,要啊不要去试试呢?

接着看PHP的,有一个很高频率的关键词php,想象的到应该是频繁使用在注释中,而且大概是这样子的注释:php is the best language!

我分析了2TB的代码来统计每一门语言中最常用的单词

到最后我们再看一下压轴老大哥C++

我分析了2TB的代码来统计每一门语言中最常用的单词

当然,该网站还对其他的语言做了统计,仍然有兴趣的朋友可以在reddit网站查看其他语言,如果你也想做上面的这个词云,可以在tagurl中制作。

相关阅读:

tagxedo词云制作工具,tagul文字云在线生成器


如若喜欢,欢迎转发到朋友圈。


未经允许请勿转载:程序喵 » 我分析了2TB的代码来统计每一门语言中最常用的单词

点  赞 (1) 打  赏
分享到: