向量数据库
向量
向量是多维数据空间中的一个坐标点。
向量类型
图像向量 文本向量 语音向量
Embedding
非结构化数据转换为向量过程
通过深度学习训练,将真实世界离散数据,投影到高维数据空间上,通过数据在空间中间的距离体现真实世界的相似度
Vector Embedding 向量嵌入
将非数值词语符号等非结构化数据编码成数值向量
Word Embedding 词嵌入
通过NN学习,文本中词语作为NN输入,输出对应词向量 Word Vector。词向量是一个数值向量,每个数值代表词语的某个特征
向量的每个数值表示某个特征,只要向量足够大,特征区分足够明显