- 博客(315)
- 收藏
- 关注
原创 花了50 美元,测试大模型大海捞针能力,Qwen3_14B太惊艳了
大家好,我是Ai学习的老章作者在 H·G·威尔斯的《时间机器》中插入了几段荒谬对话,测试文本长达 1 万词元(约覆盖小说前 5 章内容),并附带简短系统提示要求大模型定位这些荒谬对话并复述。选择的模型都是可以在 32GB 显存GPU可运行的量化模型评分标准:所有模型在每个温度值下都进行了多次测试(例如在 0.0、0.1、0.2、0.3 等温度下分别进行多次测试),这些结果被汇总为最终得分。"得分"列表示 LLM 成功解决提示的测试百分比(即正确返回异常行的情况)。
2025-06-26 15:39:27
988
原创 20GB 内存,本地运行 DeepSeek-R1-0528
DeepSeek-R1-0528 是 DeepSeek 推出的最新推理模型,参数规模高达 671 亿(671B),性能据称可媲美 OpenAI 的 o3 和 o4-mini-high。原始模型需要 715GB 存储空间,对硬件要求极高。通过 Unsloth 团队的动态量化技术(如 1.78-bit、2-bit 等),模型大小压缩至 168GB(约 80% 压缩),显著降低了运行门槛,使其可在消费级设备上运行。此外,
2025-06-25 14:11:13
809
原创 本地部署大模型性能测试,DeepSeek-R1-0528-Qwen-8B 依然是我的不二之选
大家好,我是 ai 学习的老章介绍一个大模型并发性能测试工具看一下我高频使用的,在显卡上部署的 性能如何_我_特别喜欢的三个DeepSeek版本DeepSeek-R1-0528 蒸馏 Qwen3:8B 大模型,双 4090 本地部署,深得我心项目地址:LLM-Benchmark 是一个专为大语言模型(LLM)设计的并发性能测试工具,旨在为模型开发者和运维人员提供自动化压力测试和性能报告生成能力。通过该工具,用户可以在不同并发场景下全面评估 LLM 服务的响应能力与稳定性,为模型部署和优化提供数据支持。主要
2025-06-24 17:16:27
1120
原创 kimi 开源
摘要:MiniMax开源456B参数的M1系列MoE大模型,支持100万token上下文。同时Kimi开源基于Qwen2.5的72B模型"Kimi-Dev-72B",专为软件工程优化,在SWE-bench测试中以60.4%成绩刷新纪录。但实测效果被质疑不如DeepSeek-R1,存在多语言处理弱化、严重幻觉等问题。作者通过OpenRouter测试发现其中文回复效果较差,仅改变颜色而内容仍为英文。文章包含模型对比及测试方法,并提供相关技术资料链接。
2025-06-18 16:57:08
761
原创 开源大模型, 重量级选手+1
MiniMax-M1大模型重磅开源:4560亿参数支持百万token上下文 摘要:国内AI公司MiniMax发布开源的MoE架构大模型MiniMax-M1,采用混合专家模型和闪电注意力机制,具备三大技术优势:高效计算、参数激活优化和线性扩展能力。该模型总参数达4560亿,原生支持100万token超长上下文输入和8万token输出,处理效率超过同类产品。性能测评显示,其在复杂推理、长文本处理和工具调用方面表现优异,数学推理成绩达96.8%。部署需要8块H800/H20 GPU服务器,模型文件达910GB。实
2025-06-17 13:26:02
876
原创 我特别喜欢的三个DeepSeek版本
老章分享了三个高频使用的DeepSeek模型:1)DeepSeek-R1-0528-Qwen3-8B,低成本高性能,适合知识库相关任务;2)DeepSeek-R1-0528,性能强大的免费模型,常用于资料查询和代码编写;3)DeepSeek-V3-Fast,极速推理版本,适用于快速总结和翻译。文中还推荐了相关技术资料和工具,并邀请读者点赞关注。(148字)
2025-06-16 15:51:01
441
原创 一个超强的推理增强大模型,开源了,本地部署
Mistral公司发布首款推理大模型Magistral及其自研强化学习流程。Magistral包含24B参数的开源版Small和企业版Medium,采用纯RL训练方法增强多步推理能力,在GPQA等专业测试中表现优异。该模型支持128k上下文,量化后可本地部署。官方提供了llama.cpp等量化版本,并建议特定参数设置以获得最佳性能。Magistral的设计理念强调透明推理流程和多语言适应性,但中文支持相对较弱。
2025-06-11 14:23:48
895
原创 阿里牛逼,又开源两个遥遥领先的模型(向量化、重排),知识库要翻天地覆了
阿里开源家族新增Qwen3-Embedding和Qwen3-Reranker两款模型,专为文本表征、检索和排序任务设计。Qwen3-Embedding提供0.6B、4B和8B三种参数版本,其中8B版在MTEB多语言排行榜位列第一,0.6B版模型文件仅1.2GB。Qwen3-Reranker同样提供三款参数版本,在多项检索任务中表现优异。两款模型均支持指令感知和119种语言,适用于知识库、RAG等场景。Qwen3-Reranker-0.6B已超越同类产品BGE-reranker-v2-m3。目前模型可通过Mo
2025-06-06 16:07:37
1063
原创 DeepSeek-R1蒸馏Qwen3-8B模型,双 4090本地部署,深得我心
《DeepSeek-R1-0528-Qwen3-8B模型实测:2张4090部署,性能接近32B大模型》 文章介绍了DeepSeek最新开源的数学推理专用模型DeepSeek-R1-0528-Qwen3-8B,该模型通过思维链蒸馏技术训练,在AIME数学竞赛测试中86.0分,性能超越原版Qwen3-8B 10%,接近Qwen3-32B水平。作者使用2张4090显卡通过vLLM成功部署该16GB模型,推理速度达90 tokens/s(Qwen3-32B为40 tokens/s)。实测显示,该模型在自我介绍、代码
2025-06-05 14:42:19
1552
原创 用大模型,把论文吃干榨净!
大家好,我是 Ai 学习的老章大模型火热,各种论文满天飞我主要在 arxiv 看最新的 AI、大模型方面本号数次推荐过一些好用的读论文工具,有点散本文就做个总结——借助大模型,把论文精髓吃干榨净。
2025-06-04 12:16:00
661
原创 小米又开源了,一个多模态大模型,一个生不逢时的推理大模型
大家好,我是 Ai 学习的老章上月底,,它从零开始训练并专为推理任务设计的模型系列。通过优化的预训练和后训练策略,MiMo-7B 展现出了超越许多更大模型的推理潜力。昨天,小米又开源了 MiMo-VL-7B 系列多模态大模型、MiMo-7B-RL-0530 系列推理模型咱们挨个看一下情况。
2025-06-04 12:14:00
975
原创 小米又开源了,一个多模态大模型 + 一个生不逢时的推理大模型
小米开源多模态大模型MiMo-VL-7B与推理模型MiMo-7B-RL-0530。MiMo-VL-7B支持文字、图像、视频输入,包含SFT和RL两个版本,在多项基准测试中表现优异,号称超越同参数开源模型。同时发布的MiMo-7B-RL-0530专注于数学和代码推理,支持SGLang和vLLM部署。文章对比了这些模型与阿里Qwen2.5-VL-7B和DeepSeek-R1-0528的性能,但指出缺乏详细部署文档和试用体验。文末附有技术报告PPT及相关资源链接。
2025-06-04 11:57:00
796
原创 用大模型,把论文吃干榨净!
这篇文章总结了7款借助大模型高效阅读和处理AI论文的工具:1. Soarxiv可视化查找同类论文;2. MCP批量下载总结论文;3. 豆包插件实现网页端翻译总结;4. 沉浸式翻译提供双语对照阅读;5. AlphaXiv将论文转化为博客;6. Paper2Code自动生成论文代码;7. 论文转PPT工具生成专业演示文稿。这些工具涵盖了从论文检索、阅读理解到代码实现和展示的全流程,极大提升了研究效率。作者提供了详细的使用教程和工具链接,适合AI研究人员和开发者参考使用。
2025-05-30 14:21:17
935
原创 DeepSeek R1 最新版本模型,排名第三,蒸馏的Qwen3深得我心
DeepSeek-R1-0528模型迎来升级,性能显著提升,在复杂推理任务上接近顶级模型水平。新版本在AIME测试中准确率提升至87.5%,同时优化了幻觉率、代码生成等功能。此外,DeepSeek还开源了小型模型DeepSeek-R1-0528-Qwen3-8B,通过蒸馏技术获得优秀表现。虽然部署成本较高,但该模型在AIME测试中超越原Qwen3-8B性能,值得期待。文章作者计划测试该模型性能,并分享了相关技术资料。
2025-05-30 10:33:37
172
原创 实测,大模型谁更懂数据可视化?
大家好,我是 Ai 学习的老章看论文时,经常看到漂亮的图表,很多不知道是用什么工具绘制的,或者很想复刻类似图表。前文,我用 Kimi、Qwen-3-235B-A22B、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro 测试了其在 LaTeX 公式识别中的表现。本文就测试一下他们在图表识别、复刻中的表现,看看谁更擅长干这件事备注:Kimi 开启了长思考,Qwen3 未开启深度思考,因为开启之后巨慢且失败。
2025-05-29 12:53:47
1088
原创 大模型妙用,把难懂的论文变成PPT
下面咱们逐步展开:第一步 准备论文素材比如我有把非常经典的《# Attention Is All You Need》这篇论文转成 PPT在 arxiv 网页右侧找到 TeX Source,下载然后找到支持知识库问答的 IDE,比如我的是 WindSurfCursor,还有其他 chatbot 应该也可以,比如之前我推荐的 cherry Studio(我没测试)
2025-05-29 12:30:15
1019
原创 阿里又开源了,超长上下文大模型
大家好,我是Ai学习的老章阿里又开源新模型了,这次是通义千问文档团队带来的——首个通过强化学习训练、专为长上下文推理设计的大语言模型。解决的问题是:大型推理模型(LRMs)通过强化学习(RL)展现出强大的推理能力,但局限于短上下文推理任务,这个 QwenLong-L1 框架,通过渐进式上下文扩展将短上下文 LRMs 适配至长上下文场景。
2025-05-27 16:34:54
117
原创 大模型参加高考,同写2024年高考作文,及格分(通义千问、Kimi、智谱清言、Gemini Advanced、Claude-3-Sonnet、GPT-4o)
大家好,我是章北海今天高考,上午的语文结束,市面上又要来一场大模型参考的文章了。我也凑凑热闹,让通义千问、Kimi、智谱清言一起来写一下高考作文。公平起见,不加任何其他prompt,直接把题目甩过去。感觉写的都很一般,通篇口水文,都能拿个及格分吧。有点好奇,就加了几个国外选手参赛:Gemini Advanced、Claude-3-Sonnet、GPT-4o,个人认为写的还不错。大家感觉呢?看完投个票新课标I卷阅读下面的材料,根据要求写作。(60分)
2024-06-07 21:03:58
2242
3
原创 机器学习周刊第六期:哈佛大学机器学习课、Chatbot Ul 2.0 、LangChain v0.1.0、Mixtral 8x7B
大家好,欢迎收看第六期机器学习周刊本期介绍10个内容,涉及等,
2024-01-16 21:01:32
679
原创 机器学习周刊第五期:一个离谱的数据可视化Python库、可交互式动画学概率统计、机器学习最全文档、快速部署机器学习应用的开源项目、Redis 之父的最新文章
大家好,欢迎收看第五期机器学习周刊本期介绍7个内容,涉及等,
2024-01-16 21:00:18
454
原创 机器学习周刊03:如何学习深度学习?2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果 腾讯最新论文、阿里DreaMoving
机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术。
2024-01-08 12:07:57
1401
原创 机器学习周刊第二期:300个机器学习应用案例集
大家好继续分享我最近看过并觉得非常硬核的资源,包括Python、机器学习、深度学习、大模型等等。
2024-01-07 09:34:52
1379
原创 玩转Python:数据可视化,一个很高级的交互式Python库,附代码
HvPlot 是基于 HoloViews 的高层抽象绘图库,但它提供了更为直接和方便的API,使得创建复杂的交互式图表变得简单快捷。HvPlot 可以与 Pandas、xarray 等数据处理库无缝集成,并且支持 Bokeh、Matplotlib 等多种绘图后端,允许用户根据需要制作静态或交互式图表。
2024-01-07 09:29:10
1335
原创 玩转Python:用Python处理文档,5个必备的库,特别实用,附代码
请注意,这些代码示例是为了展示每个库的基本用法,实际使用时可能需要根据具体需求进行调整。此外,确保在运行代码之前已经安装了相应的库,可以使用。在Python中,有几个流行的库用于处理文档,包括解析、生成和操作文档内容。- 用于处理Microsoft Word文档(.docx)。- 用于处理Excel文件(.xlsx)。- 用于解析HTML和XML文档。- 用于处理PDF文件。- 用于生成PDF文档。
2024-01-06 14:28:23
720
原创 ChatGPT 沦为了我的打工仔
最近在折腾之前搞的R-bookdown网站、Jekyll博客,还有刚上了Astro做的周刊、Astro Starlight做的文档站。但是前端我是一窍不通,只能在现成的主题上修修改改,即便如此还是遇到了很多问题。HF语音课:https://hf-audio.zhanglearning.com/周刊:https://weekly.zhanglearning.com/博客:https://blog.zhanglearning.com/真的无法想象,没有机必替帮忙,我要花费几倍的时间才能搞定这些事情。
2024-01-06 14:24:25
461
原创 玩转Python:用Python处理文本数据,附代码
通过使用这些库,Python 程序员能够执行各种文本处理任务,从简单的字符串操作到复杂的文本分析和处理。根据项目的具体需求,正确选择合适的库对于提高效率和代码质量至关重要。Python 提供了多种库来处理纯文本数据,这些库可以应对从基本文本操作到复杂文本分析的各种需求。
2024-01-05 10:29:13
737
原创 玩转Python:处理图像,两个非常重要的库,很实用,附代码
在Python中,图像处理是一个涉及图像分析、编辑和处理的广泛领域。有几个流行的库通常用于处理图像,每个库都有其特殊的功能和优势。
2024-01-04 17:30:42
510
原创 玩转Python:处理音频文件,两个非常重要的库,很实用,附代码
如果需要进行复杂的音频处理,或者与其他底层音频库(如Librosa或SciPy)结合使用,SoundDevice可能更合适,尤其是因为它支持NumPy数组。`pyaudio`和`sounddevice`都是用于Python中音频处理和流的库,允许用户通过他们的API录制、播放和处理音频数据。PyAudio 提供了 Python 绑定到 PortAudio,这是一个跨平台的音频I/O库。`sounddevice`库是基于PortAudio的,提供了一个简洁的Pythonic接口,用于录制和播放音频。
2024-01-04 17:25:19
557
原创 非洲 AI 不发达,看看这份PPT,受益匪浅
示例代码:https://github.com/langchain-ai/langchain/tree/master/templates/rag-chroma-multi-modal。示例代码:https://github.com/langchain-ai/langchain/blob/master/cookbook/Multi_modal_RAG.ipynb。项目地址:https://github.com/mayooear/gpt4-pdf-chatbot-langchain。
2024-01-03 14:05:56
1157
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人