- 博客(296)
- 资源 (2)
- 收藏
- 关注
原创 MCP 三种传输机制
MCP协议提供三种传输机制:Stdio用于本地高效通信,SSE支持远程单向数据传输(即将废弃),Streamable HTTP则作为新一代远程双向通信标准。
2025-09-08 09:48:15
306
原创 langgraph / openmanus / suna 对比
对比LangGraph、OpenManus与Suna三款框架的安装难度、学习曲线及适用场景。
2025-09-01 20:59:47
381
原创 RSS 和 RSSHub
RSS是一种信息聚合格式,允许用户通过订阅统一获取多个网站更新。RSSHub则是一个开源工具,为不支持RSS的网站生成RSS订阅源。其工作原理是通过爬虫抓取目标网站内容,转换为标准RSS格式输出,解决了现代网站普遍取消原生RSS支持的问题。
2025-08-21 09:19:00
933
原创 大公司比特币资产存储方式
大型公司持有巨额比特币资产时,采用多重安全策略确保资产安全。主流方式是委托专业托管机构(如CoinBase Custody、BitGo)管理,提供冷存储、多重签名、保险及合规审计服务。部分公司采用自托管方案,通过多重签名冷钱包、硬件安全模块及地理分散存储来分散风险。资产通常分散在数百个地址中,避免单一风险暴露。核心策略包括权限分散、物理隔离和专业托管,形成多层次防御体系。
2025-08-20 14:18:25
450
原创 TensorFlow 和 Transformer 的关系
PyTorch和TensorFlow是深度学习框架,提供张量计算、自动求导等基础工具,用于构建各种神经网络模型。而Transformer是一种特定的神经网络架构,基于自注意力机制设计。两者关系如同"工具箱"和"蓝图":框架是通用工具,架构是具体设计方案。开发者使用框架来实现Transformer等模型架构,类似用乐高积木按图纸搭建特定结构。这体现了工具与产品设计的不同层次关系。
2025-08-14 11:56:34
454
原创 (二)LoRA微调BERT:为何在单分类任务中表现优异,而在多分类任务中效果不佳?
将BERT替换为Llama、Mistral等大语言模型(LLM)并采用LoRA微调,能显著提升多标签分类效果。
2025-08-01 14:41:22
1147
原创 (一)LoRA微调BERT:为何在单分类任务中表现优异,而在多分类任务中效果不佳?
LoRA微调BERT在单标签分类任务表现优异,但在多标签分类中效果不佳。主要原因在于多标签任务需要学习更复杂的特征表示和标签关联性,而LoRA的低秩近似限制了参数调整自由度,难以捕捉这些复杂信号。解决方案包括:增加LoRA秩数、调整超参数、优化数据平衡和训练策略,以及尝试AdaLoRA等变体方法。建议通过建立全量微调基线,系统调整参数来提升模型性能。
2025-08-01 14:37:43
777
Navicat Premium for mac 11 汉化包
2019-11-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人