竹笋

首页 » 问答 » 常识 » 谁说Python慢来着不用Python,
TUhjnbcbe - 2024/12/31 20:08:00

作者

天元浪子责编

欧阳姝黎

出品

CSDN博客

围棋是全世界最古老的棋种(没有之一),也是古代哲学思想和中国传统文化的物质载体。小小纹枰,不过一尺见方,竟蕴藏着万千气象,着实令人为之着迷。少年时代的我,曾经有一段时间醉心于围棋。

标准的围棋盘由横竖各19道线组成网格,共有个交叉点,每个交叉点上有白子、黑子和无子等三种可能的状态。那么问题来了:围棋总共有多少种不同的局面呢?

稍微思考一下,所有的程序员都会给出正确的答案:3^{}(3的次方)。可是,这究竟是一个多大的数字呢?算一下就知道了。

Python程序员随手写了一行代码,敲个回车,计算就结束了。

pow(3,)

C/C++程序员看完Python程序员的操作,不以为然,心里想,别看你写起来简单,速度肯定没我快。讲效率,还得看我C/C++的。

longresult=1intifor(i=0;i;i++){result*=3;}

写到这里,C/C++程序员忽然意识到,longint恐怕不够用,即使longlongint也只有8个字节,最大只能到2^{64}-1计算3^{}肯定会溢出的。比longlong更大的整型没有了,要是临时定义一个结构保存超大整数,再为超大整数的计算写一堆函数,恐怕一时半会儿搞不定。这可如何是好?要不用改用doublefloat试试?赶紧上网查了一下,double可以表示-1.79E+~+1.79E+之间的任意数,可是3^{}3在这个范围内吗?

这时,C/C++程序员心里有点慌了。幸好有点数学功底,简单计算一下:

3^{}大约有位长,总算还在double覆盖的范围之内。也不用循环了,直接使用数学库中的pow函数吧。

#includestdio.h#includemath.hintmain(void){doubleresult=pow(3,);printf("%Lf\n",result);return0;}

最后,C/C++程序员给出了一个浮点类型的答案。虽然精度略有损失,但也不算离谱。我用的是CodeBlocks,显示耗时28毫秒,这里面应当包括了编译连接的时间,否则C不至于慢到这个程度。

.0Processreturned0(0x0)Executiontime:0.s

看完C/C++程序员的这番折腾,Java程序员擦擦额头的冷汗,心中暗自庆幸:多亏我大Java有BigInteger这样的神器,不然真要出丑了。

importjava.math.BigInteger;BigIntegerresult=newBigInteger("1");for(inti=1;i=;i++){result.multiply(newBigInteger("3")));}

BigInteger用起来很方便,计算3^{}毫无压力,只是不能兼容普通整型的那些运算符号,所有的运算都需要显式地调用函数,比如,这里的乘法就得调用multiply函数。

以上场景,纯属臆测,绝无褒贬任何编程语言之意,请各位明察。实际上,Python的超大整数计算也是C语言实现的,只不过采用了非常精妙的方案,最终经过各种优化,性能远超我们自己写出来的C代码。

Python的超大整数计算方案,精妙在哪儿呢?仅举存储一例:普通的Python整型采用4个字节存储,当处理超大整数时,每4个字节一个存储单元,单元之间采用2^{30}

即进制,一个单元满即向上一单元进位。

Python超大整数的存储实现

上图是超大整数采用进制的存储示意图,占用了三个存储单元共计12个字节,每个单元仍然是普通的整型——这就是Python的超大整型和普通整型完全兼容的秘密。在这一点上,Python可以说完胜Java的BigInteger。不过Java还有个BigDecimal,可以无损地处理任意精度的浮点数,为Java扳回一局。

采用进制的Python的超大整数计算方案的效率如何呢?还是以计算3^{}为例,看Python代码需要多长时间。

importtimedefpower(x,base=2):t0=time.time()result=pow(base,x)print(耗时%.06f秒%(time.time()-t0))returnresultpower(,base=3)耗时0.0秒

太神奇了!居然连1微秒都不到?我有点怀疑这个结论,继续测试更大的数字,2的次方。

power()耗时0.0秒11249224976

计算2^{}所花时间同样少于1微秒,但是显示计算结果花费了较长时间。我把代码修改了一下,不再显示计算结果,只考察计算时间。

defpower(x,base=2):t0=time.time()result=pow(base,x)print(耗时%.06f秒%(time.time()-t0))#returnresultpower(0)#2的1万次方耗时0.0秒power(1)#2的10万次方耗时0.0秒power(10)#2的万次方耗时0.秒power()#2的1千万次方耗时0.秒power()#2的1亿次方耗时0.秒power(0)#2的10亿次方耗时7.秒power(1)#2的亿次方耗时77.秒

计算2的1万次方和2的10万次,所花时间仍然不足1微秒。直到计算2的万次方时,方才显示耗时5毫秒。当算完2的亿次方之后,我没有继续下去——2的亿次方,这个数字实在是太过恐怖,我已经无法想象它的大小了。要知道,地球上全部物质的原子数量,也不过是1.28E47这个量级,大约是2的次方。

那么,Python能够计算的最大整数到底有多大呢?我没有明确的概念,不过我在验证费马小定理的逆命题时,出现过一次超大整数计算错误。

a=2t=s=Traceback(mostrecentcalllast):File"huge.py",line56,inmodulemiller_rabin(x)#M61File"huge.py",line42,inmiller_rabinprint((pow(a,t*pow(2,s))-1)%huge_num)MemoryError

当我试图计算pow(a,t*pow(2,s)时,发生了内存错误。这里a等于2,s大于亿亿,t大于亿亿。显然,这个结果远远大于2的亿次方。

1
查看完整版本: 谁说Python慢来着不用Python,