LangChain、LangGraph、LlamaIndex、CrewAI……当你开始习惯一种工具时,另一种工具就会出现。我并不是贬低或讨厌这些工具,但使用其中任何一种工具进行开发都可能是一项非常艰巨的任务,因为学习曲线太高,如果你真的想构建一些东西,而不是仅仅为了潮流而学习这些库,这可能会令人沮丧。毫无疑问,LangChain 很棒,但它内容密集。对于文档本身,我们有一个用于 Python 的文档,一个用于 JavaScript 的文档,还有一个用于 API 的父文档,我想。然后在 Python 中,有多个执行类似工作的函数。这一切都很好,但你对代码没有足够的控制权。例如,在我之前的博客中,我试图将 PDF 作为字节传递给加载器,但我做不到,因为该函数只接受文件 URL。在我看来,LangChain 应该是你在构建简单的东西时的最后选择。永远坚持 KISS(保持简单,傻瓜)。
好吧,他们可能没有我描述的那么狡猾,但最好先尝试实现一些原始的东西,如果不够的话,再转向更先进的工具。
本月相当紧张(实际上,自 2022 年 11 月以来每个月都是如此),连续两天发布了 GPT-4o 和 Gemini 更新。
GPT-4o 的 ScarJo(不,应该是“Sky”)的声音在演示中非常有影响力,在 AI 行业掀起了一股浪潮,并盖过了 Gemini 在 Google I/O 上的表现。老实说,GPT 永远领先于所有 LLM,但对于构建 MVP 和个人项目,Gemini 对像我这样的穷困开发者来说是一个福音,它的免费套餐允许以 15 rpm 的速率限制访问最新模型的 API。还不错,不是吗?
ChatGPT 的免费版本现在允许您上传 GPT-4o 文件,但如果没有代码解释器,它仍然无法解释 CSV 或 Excel