【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
凤凰传奇曾毅公开佩戴含有不雅元素的手表,这涉嫌违法吗?如何从法律角度解读?
程序员平时都是CRUD开发工作,真的需要深入理解原理性的知识点吗?
为什么全国人民都知道武汉的交通很差,但是武汉人不知道?
为什么MacBook pro不用高刷新率的屏幕?
马斯克宣布星舰将配备 42 台发动机,如何评价这一设计?
电脑有64G的物理内存(DDR5 5200),完全够用了,可以关闭系统的虚拟内存吗?
为什么盗版音乐已经被严格限制了,而中国音乐却还是没有发展起来?
Firefox是如何一步一步衰落的?
炫富真的很爽吗?
电话:
座机:
邮箱:
地址: