大数据产业创新服务媒体
——聚焦数据 · 改变商业
理解、生成、逻辑、记忆是人工智能的四大核心能力。
一段人类的日常对话通常可以分解为引子、记忆、分析三个部分。计算机自然语言处理的解法,AI科学家归纳出一个CPV结构:以ChatGPT为代表的大模型承担“分析”,Vector Database(向量数据库)承担“记忆”,Prompt(提示词)承担“引子”。
向量数据库,正是计算机记忆体一般的存在。AI 2.0时代,一度落寞的向量数据库又一次站在技术最前沿,成为数据库厂商竞相投入研发的对象。
向量数据库,一个计算机超级大脑
向量数据库处理和存储音频、视频、图像等非结构化数据,通过向量嵌入实现相似度检索、模糊匹配,输出概率上最符合条件的答案,在大模型兴起之前便已广泛应用于以图搜图、哼歌识曲等场景。
作为一个超级记忆体,向量数据