字典树实现词频统计

这篇博客介绍了如何利用字典树(Trie树)实现词频统计,包括读取文件中的单词、插入字典树、打印树结构、查询单词频率以及销毁字典树的功能。提供了完整的C++代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

字典树实现词频统计

Trie树(字典树)
字典树又叫前缀树,是处理字符串常用的数据结构,最近和朋友一起粗略写了一下关于字典树的词频统计。

一、功能介绍

  1. 文件流读写单词;
  2. 将读到的单词插入树中;
  3. 打印树,打印出单词和个数以及词频;
  4. 单个单词的个数和频率查询功能;
  5. 销毁字典树(释放内存);

结构体代码

typedef struct TrieNode {

unsigned long count; //该结点终结的单词个数
struct TrieNode* next[26];  //下标 0-25 分别表示 a-z

}TrieNode;

从文本中获取单词

void GetWord(FILE* fp, int lim, char word[]) {
char* w = word;
int c;
while (isspace(c = getc(fp)) || (c == ‘-’))//跳过空格和破折
;
if (c != EOF)
*word = tolower(c);//这里tolower是为了将大写字母转为小写字母 小写字母不变
if (!isalpha(c)) { //单词第一个不是字母,退出
*word = ‘\0’;
return;
}
for (; --lim > 0; word++) {
*word = tolower(c);
if (!isalpha(c = getc(fp)))//不是字母,退出
break;
}
*++word = ‘\0’;
word = w;
}

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

山山峏川-

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值