你在读开源代码的时候有没有遇到过这种注释?,What the fuck ?,Dude,WTF,Fuck this !,我遇到过,每次都忍不住笑,心想老外可真是性情中人,遇到不爽的地方就开骂,还直接写到注释中,甚至代码中。,,Bob大叔在《Clean Code》一书中谆谆教导我们:要对变量、函数、类精心命名,避免耍小聪明,别使用双关语。,那么在注释甚至在代码中说脏话,会不会影响总体代码质量呢?,还真有人做了这个研究,Jan Strehmel,一个来自德国卡尔斯鲁厄理工学院的学生发表了一篇论文,名称就叫《在开源代码中脏话的使用和代码质量之间有相关性吗?》,为了研究这个问题,作者从GitHub中抓取了3800个含脏话的C代码库,7600个不含脏话的C代码库,用自家的软件SoftWipe分析它们对编码标准的遵守情况,逐个打分。,然后发挥他在统计学的技能,用了中心极限定理,Bootstrapping,Significance testing,Jarque-Bera test,Shapiro-Wilk test,Q-Q plot,Kolmogorov-Smirnov test ……,一顿操作猛如虎,最后他得到了一个惊人结论:,包含脏话的开源代码明显比不含脏话的质量更好!,,(原论文有很多图,感兴趣的可以去看看),面对这个结果,作者恐怕也没想到,他试图解释到:脏话代表了程序员对代码极其复杂性的情感!在写代码的时候,骂几句脏话,是缓解压力的一种方式,这反过来⼜可以提⾼注意⼒,从而提⾼代码质量。,当然,你可千万不要理解成只要在代码中用了脏话,代码质量就会有提高,那就大错特错了。,这个结果让我立刻想到了Linus Torvalds,他经常Fuck 这个,Fuck那个的,Linus在内核源码中对别人代码的评论就足以扭曲统计结果。,,在Linux最早的几个版本中就出现fuck, shit ,damn这样脏话,这似乎成了一种Linux的文化,在后续Linux源码中各种脏词不断出现。,在2005年7月28号,fuck*达到了顶峰,足足出现了68次,随后逐渐下降。,而 idiot* 则一致是在缓慢上升,现在和damn* 并驾齐驱,不分上下。,,但是,这些脏话并不影响Linux内核是优秀代码的典范(详情参见这一篇文章《漫画 | 因为用了C语言,Linux内核代码一团糟》),以Linus Torvalds为首的团队对代码结构和风格做了严格的定义,在Review中坚持执行。,在Java社区,开源代码中的脏话也不少。,2018年,IBM 软件工程师 Adam Farley 给 OpenJDK 提交了一个 Bug ,说 OpenJDK 源码中脏话太多了,到处都是,OpenJDK是在专业领域使用的,这太不合适了吧?这不我特意提交了一个Changset把它们都删了。,,,,3天后,经过 OpenJDK 社区讨论,大家认为:,Damn 和 Crap 不算脏话!还有3 个 f**k,是上游的锅(回头会跟进处理),只有一个文件中的f**k,都是脏话,应该删掉。,为什么程序员喜欢在源码中用脏话表示自己的想法呢? ,代码是程序员每天都要面对的工作对象,对代码确实会出现复杂的情感,有时候需要一种情绪的宣泄。,看到一段高深的,自己无法理解的代码,what the fuck?,好不容易把一段复杂逻辑的各种分支,边界条件都搞定了,代码实在是乱,don’t fuck with it !,花了很大的精力写完了逻辑,却发现有个异常无法处理,damn,damn,damn,……,咱们国内程序员似乎比较含蓄,很少在代码中写脏话,更喜欢吐槽公司,吐槽系统,是不是这样?,不过,一定要记住一点:当在代码评论中出现脏话时,你就要小心了,不要轻易动下面的代码,弄不好就是个大坑!,参考资料:,https://cme.h-its.org/exelixis/pubs/JanThesis.pdf ,https://www.vidarholen.net/contents/wordcount
© 版权声明
文章版权归作者所有,未经允许请勿转载。