【NLP】文本相似度分析

浅析文本相似度
一文读懂Embedding的概念,以及它和深度学习的关系
深入浅出Word2Vec原理解析

把句子都进行结巴分词
分组输入word2vec,只处理前两个元素,第三个元素是标签

余弦相似度
计算两个向量的余弦值
余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似
反之,内积为0,则向量垂直,二者没有相似度

赞赏