互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
	格式说明:
	数据格式为
	词A 词频 词性1 词性2 … 词性N
	词B 词频 词性1 词性2 … 词性N
	词C 词频 词性1 词性2 … 词性N
	
词性说明:
	
 词性说明:
		N 名词
	
		V 动词
	
		ADJ 形容词
	
		ADV 副词
	
		CLAS 量词
	
		ECHO 拟声词
	
		STRU 结构助词
	
		AUX 助词
	
		COOR 并列连词
	
		CONJ 连词
	
		SUFFIX 前缀
	
		PREFIX 后缀
	
		PREP 介词
	
		PRON 代词
	
		QUES 疑问词
	
		NUM 数词
	
		IDIOM 成语
本文来自织梦
 
                   










