用文本统计来对比语言频率。。。

by 齐愍乐平, Thursday, November 27, 2014, 20:59 (3649 天前) @ 齐愍乐平
编辑 by 齐愍乐平, Thursday, November 27, 2014, 21:58

交作业,网速慢,弄好都半夜了,无聊找了个网页玩语
料库,把指月录一篇篇放进去分析,精神分析么,就是看个
周期性的差别为主。也看了一些聊天纪录的分析,看不同的人的词频的偏转
情况,大致上是这样的,一些量词,时方处所是有的等等,当
然,每个人频率都不一样,文献记录里,还有个记录者,
但是大致还是能看到一些东西的,就是不用程序,比如
说有的讲话里,有的人怎么怎么,有的人怎么怎么,直
接看都能看得清楚,语料分析是十分强大的工具,比如
有些话是从什么时候开始有的,那些人喜欢说,比故训
和篡诂都要进一步了,这样也能看到一些历史观念的演
进了。老实说,区区以为,一越多的,越不怎么样,虽
然我也挺喜欢用一的。ps,似乎我最喜欢用的是“的”,来
来做限定?其实这个也有限的。

分析工具
http://www.cncorpus.org/CpsTongji.aspx

演讲的词频分析:词频分析法
http://wenku.baidu.com/link?url=cfawjEGzk5kGKSjdVUTPocu1EEjTO8wZ89EKqdDLhhNCPeXnT8xJRmI...


不生亦不灭,不常亦不断,不一亦不异,不来亦不去
如果分析出来,这八类词频的偏差太多了,也许就明显有可以说不的地方。


完整帖子: