【对比python】wordcount | 润乾 -欧洲杯在线开户

任务:统计某文档的单词数量

python

1 data=pd.read_csv(file,sep="\n",header=none)
2 tmp=[]
3 data=data.iloc[:,0].apply(lambda x:tmp.extend(x.split()))
4 pd.series(1,tmp).groupby(level=0).count()

这里只是对文档按空字符分割,如果要去掉其他无统计意义的标点符号则会非常麻烦。

集算器

  a  
1 =lower(file(“t.txt”).read()).words().groups(~:word;count(1):count)  

集算器提供了words()函数将串拆分成单词,只要一句就可以完成这个运算。

网站地图