- 博客(8)
- 问答 (1)
- 收藏
- 关注

原创 藏文字符的排序算法
摘要:本文开发了基于Python的藏文字符的排序工具,针对藏文独特的非线性组合结构(包含基字、上加字等7个层级)实现了科学的字典排序算法。工具集成了快速排序、堆排序等四种经典算法,支持升/降序排列,具有进度可视化、结果导出等功能。通过分析《藏汉大辞典》等权威词典,建立了分层循环的排序规则:以基字为核心,按构件优先级(基字→上加字→...→再后加字)逐层比较。
2025-08-17 17:40:06
626

原创 藏字构件的动态统计分析算法
本文介绍了一个基于多文件藏文语料库的动态分析工具,可统计藏文构件在连续文本中的频率分布。系统支持90个藏文特殊符号作为音节分隔符,具备多文件批量处理、实时进度显示和详细统计功能。提供可视化界面,支持多种主题切换,并能导出分析结果。
2025-08-16 15:06:40
865

原创 藏文字体预览工具
该工具提供全面的藏文排版解决方案,支持TTF/OTF字体上传与多字体切换预览,内置12种动画效果及六向渐变调色系统。用户可精细调节字号(12-72px)、行距(1.0-2.5倍)和字距(-2px-10px),实时预览修改效果。支持纯色/渐变双色模式,导出PNG/SVG格式文件,配置可保存为JSON。技术栈采用HTML5/CSS3/ES6+,配合Canvas/SVG实现图形处理,通过PythonHTTP服务器快速部署。项目结构清晰,含字体存储目录和核心前端文件,v1.0版本已实现基础功能与界面优化。
2025-08-14 22:09:34
594
原创 基于Bi-LSTM+CRF方法的藏文分词工具
摘要:该项目是由西藏大学和东北大学联合开发的藏文分词系统,基于Bi-LSTM和CRF模型,特别优化了未登录词识别。系统提供命令行和图形界面双模式,支持文本输入和文件批量处理,操作简便。安装需创建Python3.8虚拟环境并安装相关依赖,通过启动脚本或直接运行程序文件使用。研究成果需引用指定论文。系统结构清晰,包含模型、界面和资源目录,为藏文信息处理研究提供实用工具。
2025-08-19 16:46:04
371
原创 藏文字符构件识别算法
本文介绍了一个基于Python开发的藏文构件识别系统。该系统采用正则表达式和规则匹配两种算法,能够自动分析藏文字符的组成结构,包括前加字、上加字、基字等下加字等构件。系统支持1-7个构件的藏字识别,兼容多种编码格式,提供图形界面和命令行两种操作方式,并可将结果导出为CSV或JSON格式。研究基于18,785个藏字样本,按照现代藏文48种结构类型进行分类处理,为藏文信息处理技术发展提供了基础工具。项目已在GitHub开源,包含详细的使用说明和安装指南。
2022-06-04 18:10:18
3399
5
原创 藏文构字原理与算法实现
藏文字符是拼音性文字,现代藏字由30个辅音字母和4个元音符号(简称为元音)拼写组合而成,既可以前后书写,还可以上下叠加,构成二维的平面文字。现代藏字均以一个称为“基字”的辅音字母为核心,其前后添加和上下叠加,组成一个完整的字符结构。
2022-04-17 16:41:33
7365
3
原创 python爬虫里下载压缩文件后缀为(.rar),怎样下载文件才不会损坏
红色标注的地方是问题的描述。是从文件链接里下载后缀为(.rar)的压缩文件,我是从链接里取最后的(.rar)字符集,然后写到保存的文件夹里,下载完了以后所有文件都是损坏的。 import requestsfrom lxml import etreeimport os.pathdef wenjian(): if not os.path.exists('./简历模板'): os.mkdir('./简历模板')def jianli(url): heade...
2021-09-14 10:54:40
2854
11
空空如也
请问python这个错误怎么解决
2021-08-10
TA创建的收藏夹 TA关注的收藏夹
TA关注的人