基于通用LLM的一次测试用例自动生成的实验

最新推荐文章于 2025-08-20 08:58:34 发布

质问

最新推荐文章于 2025-08-20 08:58:34 发布

阅读量1.7k

点赞数

CC 4.0 BY-SA版权

分类专栏： AI系统的测试入门与实践-《大模型测试技术与实践》续写文章标签：测试用例

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/crisschan/article/details/133278564

AI系统的测试入门与实践-《大模型测试技术与实践》续写专栏收录该内容

101 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了基于通用大语言模型（LLM）的测试用例自动生成实验，选用讯飞星火作为工具，通过Prompt驱动，快速构建应用。实验展示了LLM如何为地铁车票自助购票系统生成测试用例，结果表明，虽然生成的用例需要人工完善，但已能覆盖主要业务流程，为测试工程师工作提供了帮助。尽管如此，将这种方法工程化仍面临挑战。

基于通用LLM的一次测试用例自动生成的实验

选择很多，最后选择了讯飞的星火做本次实验，原因还是因为讯飞的LLM的API是有免费额度的，案例代码相对比较成熟易学易用

1 LLM和基于LLM的应用

最近这段实际LLM已经变成了一个炙手可热的词汇，现在任何技术不了到LLM都感觉好像没有彻底聊完一样。那么LLM到底是什么呢？其实LLM（大语言模型）是一种语言模型，由具有许多参数的人工神经网络组成，使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现，并在各种任务中表现出色。这里面的大其实也是相对的，那么多少参数算大、多少参数又算小确实没有一个通用的定义，通常指的是参数数量在数十亿或更多数量级的模型就算大模型。

训练一个模型一般都是通过如上三个步骤完成的，先去确定一个候选算法的集合，然后确定一种评价方法，在这种评价方法上找到优的算法，最终达到预期目标的过程就是模型训练的过程。

训练一个模型一般需要很长时间，那么构建一个基于 LLM 的应用就需要更长时间。随着 Prompt 的发展现在基于 prompt 构建一个应用系统已

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

质问 开心就好

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。