自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1829)
  • 资源 (1)
  • 收藏
  • 关注

原创 Identity-enabled Retrieval Augmented Generation (RAG) with PebbloRetrievalQA

load()

2025-07-11 13:08:25 266

原创 使用Slack导出数据加载LangChain聊天消息

load()

2025-07-10 15:27:06 563

原创 利用UpTrain提升大语言模型应用的性能与质量

Upstash是一种云端Redis服务,专为高性能和弹性设计。它提供了一种高效的限流库,通过与Redis数据库的集成,确保限流规则的实施。限流通常用于控制用户请求频率,防止滥用资源,同时优化系统性能。

2025-07-10 15:23:53 466

原创 使用Upstash Ratelimit实现请求与令牌限流

Upstash是一种云端Redis服务,专为高性能和弹性设计。它提供了一种高效的限流库,通过与Redis数据库的集成,确保限流规则的实施。限流通常用于控制用户请求频率,防止滥用资源,同时优化系统性能。

2025-07-10 15:22:55 330

原创 使用 TrubricsCallbackHandler 进行用户分析和反馈管理的实践指南

随着人工智能技术的普及,用户与模型的互动频率增高,记录、分析这些互动能够帮助开发者理解模型的表现与用户期望之间的差距。Trubrics 提供了一个简便的平台来管理这些信息,并优化模型。

2025-07-10 15:22:17 291

原创 使用 RDFLib 和 LLMs 实现语义网图数据库的自然语言查询接口

RDFLib 是一个纯 Python 库,专门用于操作 RDF 数据。它提供了丰富的功能,包括多种格式的解析和序列化(如 RDF/XML, N3, Turtle 等)、图接口、多种存储实现(如内存存储、持久化磁盘存储、SPARQL 端点存储)以及 SPARQL 1.1 的支持。LLMs 在此场景中被用作自然语言接口,能够自动生成 SPARQL 查询。

2025-07-10 15:04:27 307

原创 如何使用 Robocorp Action Server 与 LangChain 拓展 AI 能力

Robocorp 提供了一套工具,用于快速创建可以与人工智能模型交互的自定义 API 动作。通过集成 LangChain 应用,可以构建复杂的 AI 应用程序,增强 AI 的定制与执行能力。

2025-07-10 10:26:29 229

原创 使用OpenAPI工具包构建智能API代理

现代软件开发中,OpenAPI(又称Swagger)因其对RESTful APIs的规范化描述而备受欢迎。其强大的描述能力使得自动化生成客户端、服务端代码以及文档成为可能。在AI技术的驱动下,尤其是结合大语言模型(LLM),可以构建自动化的智能代理来消费这些API。这样的代理能够处理复杂的用户请求,并生成相应的API调用。

2025-07-10 10:19:58 410

原创 使用GraphQL在Python中查询数据

接下来,我们初始化一个实例并创建一个Agent在上面的代码中,我们通过创建一个Agent,并结合GraphQL查询来获取所有Star Wars电影的标题。

2025-07-10 10:10:43 322

原创 使用DataForSEO API获取搜索引擎结果的数据分析

DataForSEO API是一款专为SEO专业人士设计的数据工具,帮助他们从各大搜索引擎获取结构化的数据。这些数据包括自然搜索结果、有机结果、特色片段、知识图谱等。这使得用户能够分析竞争对手、跟踪SEO策略效果,并在国际化语言和地点设置方面有更高的灵活性。你可以控制返回的JSON结果类型和字段,指定要返回的结果数量。# 创建自定义API包装器实例# 获取比尔盖茨的搜索结果print(json_results) # 输出JSON结果。

2025-07-09 15:17:30 554

原创 Azure Cognitive Services Toolkit 深入解析与实战示例

Azure Cognitive Services 是微软推出的一系列云服务,旨在为开发者提供强大的人工智能和机器学习功能。这些功能涵盖了计算机视觉、语音识别、文本分析等多个领域,帮助开发者快速构建智能应用。本文将详细解析 Azure Cognitive Services Toolkit 中的几个重要工具,并通过代码示例展示其实际应用。

2025-07-09 15:12:52 239

原创 使用 Alpha Vantage API 获取实时金融数据

Alpha Vantage 提供了一系列强大且易于使用的数据 API,用于获取实时和历史金融市场数据。这些 API 能够帮助开发者轻松获取外汇汇率、股票时间序列数据、市场新闻情绪等信息,非常适合开发金融应用。

2025-07-09 15:10:42 486

原创 使用 Zep 开源项目实现聊天历史检索

通过 Zep 检索可以提高 AI 助手的交互质量,尤其适用于需要长期记住用户上下文的情境,比如客服机器人、教育应用等。借助 Zep 的过滤和重排序功能,还能根据特定搜索条件精确锁定目标信息。如果遇到问题欢迎在评论区交流。

2025-07-09 15:09:09 434

原创 使用SVM构建文本检索器

在这里,我们通过从OpenAI获取文本嵌入,并使用这些嵌入创建了一个SVM检索器。可以在给定的文本集上进行有效查询。

2025-07-09 15:05:52 415

原创 利用DocArray实现多模态数据检索

DocArray支持五种不同的文档索引后端,每种后端都有其独特的特性和使用场景。通过适当的设置,您可以轻松地索引数据,并使用DocArrayRetriever检索相关文档。

2025-07-02 16:35:31 357

原创 使用 SQLite-VSS 进行高效的向量搜索

随着机器学习和人工智能的快速发展,基于向量的检索技术在搜索引擎、推荐系统等领域展现出了显著优势。SQLite-VSS 扩展结合了 SQLite 的稳定性和 Faiss 的性能,为开发者提供了强大的本地向量搜索能力。

2025-07-02 16:19:00 289

原创 使用Marqo进行多模态数据向量存储和查询

随着人工智能的发展,处理复杂信息的能力需求不断增加。传统的全文搜索引擎在处理非结构化数据时表现有限,而向量搜索引擎则利用数值向量表示数据内容,可以实现高效的语义搜索。Marqo 专注于多模态数据的向量化及搜索,广泛用于图像识别、文本分析等领域。

2025-07-02 14:28:01 185

原创 使用KDB.AI进行语义搜索的实战指南

KDB.AI非常适合用于法律文档、研究论文等非结构化文本的高效语义搜索。这种技术可以为法律行业、学术研究以及商业领域中的数据分析提供支持。如果遇到问题欢迎在评论区交流。

2025-07-02 14:24:32 185

原创 使用Elasticsearch进行向量存储与检索详解

Elasticsearch是一种分布式、RESTful风格的搜索和分析引擎,基于Apache Lucene库构建,支持向量和词汇搜索。其强大的搜索能力使其在大数据分析、日志监控等领域得到了广泛应用。为了使其与现代AI技术相结合,Elasticsearch被用作向量存储来进行高效的向量相似性搜索。

2025-07-02 13:55:59 341

原创 使用RSS Feed从新闻源加载并解析文档

RSS(简单聚合)的重要性在于,它允许我们从各个网站自动地聚合并提取最新的更新信息。在AI应用中,将RSS源中的新闻文章转化为文档格式是实现文本分析、情感分析等下游任务的前提。

2025-07-01 17:12:01 363

原创 使用IPEX-LLM在Intel GPU上进行语言链嵌入任务

这种技术配置特别适用于需要快速响应的应用,如实时查询和交互式问答系统。它可以显著提升在Intel GPU上的嵌入速度,适合包括数据处理和自然语言理解等场景。如果遇到问题欢迎在评论区交流。

2025-07-01 16:07:45 209

原创 如何使用 LangChain 与 IBM Watsonx.ai 进行文本嵌入

IBM Watsonx.ai 是 IBM 提供的 AI 基础设施,支持各种 AI 模型的部署和使用。WatsonxEmbeddings 是一个用于处理文本嵌入的封装器,利用 LangChain 可以轻松与这些模型进行交互,助力于文本处理和理解任务。

2025-07-01 16:05:04 372

原创 使用LangChain进行假嵌入测试

嵌入技术在自然语言处理(NLP)领域的广泛应用,为文本数据的表示和分析提供了强大的支持。通常,嵌入模型将文本转换为数值向量,以便可以使用这些向量在机器学习模型中进行运算。LangChain中的假嵌入类允许开发者在测试阶段使用一个假的嵌入类来验证这些文本到向量的转换是否正常工作,而不需要依赖真实的嵌入模型。

2025-07-01 16:02:39 334

原创 使用LangChain与Clova Embeddings进行文本嵌入

如果遇到问题欢迎在评论区交流。

2025-07-01 16:01:32 240

原创 使用 Streamlit 快速构建和共享数据应用

Streamlit 是一个开源的 Python 库,其旨在帮助开发者快速创建数据应用。无论是展示复杂的数据集,还是构建交互式的机器学习模型展示,Streamlit 都能在短短几分钟内实现。尤其是在生成式 AI 及数据分析应用领域,Streamlit 提供了极大的便利。

2025-07-01 14:06:18 368

原创 使用MLflow跟踪LangChain实验

MLflow是一个功能强大的开源平台,用于管理机器学习生命周期中的工作流和工件。它提供了与许多流行的机器学习库的内置集成,也可以与任何库、算法或部署工具配合使用。在LangChain集成的背景下,MLflow提供以下功能:本文将演示如何使用MLflow跟踪LangChain实验。环境设置创建MLflow实验为了组织我们的运行和工件,我们建议创建一个专属的MLflow实验,而不是使用默认实验。集成方法方法1: 自动记录 (Autologging)自动记录是利用MLflow提供的无缝追踪功能,推荐

2025-07-01 11:03:28 274

原创 使用 Meilisearch 构建高效搜索系统

随着数据量的爆炸式增长,搜索引擎的功能和性能变得尤为重要。传统的搜索引擎由于使用简单的关键字匹配,无法满足复杂查询和海量数据的需求。Meilisearch 是一个新兴的解决方案,它提供了极快的搜索速度和高度相关的结果,并且支持向量搜索,使得语义查询成为可能。

2025-07-01 11:02:04 343

原创 使用EverNoteLoader实现笔记内容提取与管理

接下来是如何使用。

2025-06-30 17:21:01 359

原创 使用Dataherald API进行自然语言到SQL转换

Dataherald提供了一种将自然语言查询转换为SQL语句的便捷方法。这对需要从数据库中提取信息的业务分析和数据科学团队来说非常重要,尤其是在需要以自然语言形式进行查询时。结合LangChain框架,Dataherald可以简单集成到现有的AI系统中。

2025-06-30 17:12:20 396

原创 使用Baseten平台进行ML模型推理——快速入门教程

Baseten不仅支持开源模型(如Llama 2或Mistral),还允许您在专用GPU上运行专有或微调模型。与OpenAI等提供商不同,Baseten收费是基于GPU使用的分钟数,而不是每个token。这种定价方式对那些需要长时间推理的复杂模型尤为有利。

2025-06-30 15:20:59 382

原创 利用AINetwork构建去中心化AI模型

AINetwork是一个创新的区块链技术,专注于为AI应用提供高效的计算资源。通过去中心化的GPU网络,AINetwork能够以较低的成本提供大规模计算能力。这种架构非常适合需要高性能计算的AI模型,如大型深度学习模型和图像生成网络。

2025-06-30 15:08:27 240

原创 使用LangChain与GPT4All模型进行交互

GPT4All是由nomic-ai团队维护的开源项目,旨在提供高质量的聊天机器人模型。其训练数据集包括代码、故事和对话,使其能够在各种场景中提供出色的文本生成能力。LangChain是一个强大的库,能够帮助我们轻松地与这些大型语言模型进行交互。

2025-06-30 12:57:00 383

原创 本地运行开源大语言模型的利器——ChatOllama

Ollama的核心功能在于将模型的权重、配置和数据打包到一个Modelfile中,使得模型的部署和管理更加便捷。它充分优化了GPU的使用,并支持本地调用,极大地降低了模型应用的门槛。

2025-06-30 12:54:04 699

原创 使用Grobid与Docker解析PDF文档的实践指南

在技术文档处理领域,GROBID是一款非常强大的工具。它利用机器学习技术来从文档中提取、解析并重构数据。特别是在处理学术论文时,GROBID表现出色。然而,对于过于庞大的文档(如论文)可能会有处理限制。本文将引导你如何使用Grobid通过Docker来解析PDF文档,并将文档内容和元数据保留。

2025-06-30 12:50:38 398

原创 使用Step-Back QA Prompting技术实现更高效的复杂问题解答

在处理复杂问题时,直接回答可能不够高效或全面。Step-Back QA Prompting通过先提出一个相关的、较简单的“退一步”问题,帮助模型更好地理解并回答原始问题。这种方法适用于结合检索技术,既检索原始问题,也检索“退一步”问题,从而提升整体回答质量。

2025-06-30 10:34:10 352

原创 使用RAG-Vectara进行LangChain开发的实战指南

检索生成技术通过在生成文本前检索相关信息来增强生成效果。Vectara提供了一个强大的API,用于实现这种技术,在结合LangChain时表现尤佳。LangChain是一个用于构建复杂语言模型应用的工具,它简化了多个语言模型组件的集成过程。

2025-06-30 10:23:20 627

原创 利用LangChain实现JCVD风格聊天机器人

是一个托管的大规模AI模型平台,可以通过简单的API调用来访问各种基础AI模型。LangChain是一个强大的工具,用于构建可自定义的AI应用链条,与Bedrock结合,可以极大地简化大型AI模型的使用。我们的目标是配置一个聊天机器人,使其能够模仿JCVD的对话风格。

2025-06-27 13:14:27 328

原创 利用 Upstage 的 Solar Mini Chat 和 LangChain 集成实现高级语言处理

在人工智能领域,Upstage 是一家领先的公司,以其卓越的 LLM(大规模语言模型)组件而闻名。特别是 Solar Mini Chat,这款模型针对英语和韩语进行了优化,专注于多轮对话,并在理解长上下文的任务上表现突出,如 RAG(检索增强生成)。本文将展示如何使用 Solar Mini Chat 及其附加功能,比如 Groundedness Check 和 Layout Analysis,通过 LangChain 的集成实现以上功能。

2025-06-27 13:08:07 427

原创 深入理解Key-value存储在LangChain中的应用

Key-value存储是一种非关系型数据库,它允许通过简单的Key来快速存取Value,适用于快速查询和高并发的场景。LangChain作为一个构建和操作AI模型的框架,利用Key-value存储来优化数据的存储和检索。

2025-06-27 12:52:01 242

原创 如何创建和查询向量存储

向量存储是一种用于存储和搜索嵌入数据的技术,无论是文本、图像还是其他非结构化数据。为了更高效地查询这些数据,通常会采用向量化的方法,这允许我们在高维空间中对数据进行相似性搜索。

2025-06-27 09:24:05 268

99块买的最新打赏视频源码,亲测可用,域名防红

2018最新Thinkphp开发的视频打赏平台源码,源码可不使用微信服务号,视频打赏源码已增加短域名防封技术解决,本套打赏平台源码已配置支付接口文件

2018-09-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除