向量化

此部分提供了简便的接口,可以直接将传入的items经过转化得到向量。当前提供了是否使用预训练模型的选项,可根据需要进行选择,如不使用预训练模型则可直接调用D2V函数,使用预训练模型则调用get_pretrained_i2v函数。

总体流程

1.对传入的item进行 语法解析 ,得到SIF格式;

2.对sif_item进行 成分分解

3.对经过成分分解的item进行 令牌化

4.使用已有或者使用提供的预训练模型,将令牌化后的item转换为向量。

学习路线图