Excel内文本模糊查询能力很弱,哪怕使用EFunction插件ETSimilarity模糊查询函数,也只能基于关键词进行模糊匹配。只能够基于字符计算距离方式进行模糊查询。模糊查询无语义级别能力。
BERT模型为基于transformer预训练模型,能够记录文本字符前后语义关系。计划集成BERT模型到Excel内,利用BERT语义能力增强Excel文本模糊匹配能力。
要实现该步骤分三步走
将已经训练好的模型转化为易于加载的方式
利用BERT序列化Excel内文本数据
近似检索,利用Excel函数作为调用序列号模型接口,函数按近似程度返回模型。
模型转化,利用ONNX,将已经预训练好的模型转化为脱离Python环境模型