Embedding(嵌入) 是将离散对象(如文本、图像、单词)映射到低维连续向量空间的技术,核心作用是保留对象间的语义或结构关联,方便机器学习模型处理。
在自然语言处理中,Word Embedding(词嵌入)是典型应用,比如Word2Vec、GloVe、BERT的词向量;在图像识别领域,可通过CNN提取图像特征作为图像嵌入,用于检索、分类等任务。
嵌入向量的维度通常远低于原离散空间维度,且相似对象的嵌入向量在空间中距离更近,这是其在语义检索、推荐系统、聚类分析等场景中发挥作用的关键。
受此启发,我们每个人也可以抽象为高维向量,人以类聚物以群分可以通过这个向量的欧式距离,或者余弦函数值来求得。好朋友根据求这个值很容易证明
--
FROM 171.219.162.*