前沿消息

本地化一个bert模型,老板再也不怕模糊查询了

Excel内文本模糊查询能力很弱,哪怕使用EFunction插件ETSimilarity模糊查询函数,也只能基于关键词进行模糊匹配。只能够基于字符计算距离方式进行模糊查询。模糊查询无语义级别能力。

BERT模型为基于transformer预训练模型,能够记录文本字符前后语义关系。计划集成BERT模型到Excel内,利用BERT语义能力增强Excel文本模糊匹配能力。

要实现该步骤分三步走

将已经训练好的模型转化为易于加载的方式

利用BERT序列化Excel内文本数据

近似检索,利用Excel函数作为调用序列号模型接口,函数按近似程度返回模型。

模型转化,利用ONNX,将已经预训练好的模型转化为脱离Python环境模型