【对比python】wordcount | 润乾 -欧洲杯在线开户
任务:统计某文档的单词数量
python
1 | data=pd.read_csv(file,sep="\n",header=none) |
2 | tmp=[] |
3 | data=data.iloc[:,0].apply(lambda x:tmp.extend(x.split())) |
4 | pd.series(1,tmp).groupby(level=0).count() |
这里只是对文档按空字符分割,如果要去掉其他无统计意义的标点符号则会非常麻烦。
集算器
a | ||
1 | =lower(file(“t.txt”).read()).words().groups(~:word;count(1):count) |
集算器提供了words()函数将串拆分成单词,只要一句就可以完成这个运算。