专利号:ZL.9
短信为什么被拦截?
研发背景
为避免用户收到各种诈骗、骚扰类短信,各手机厂商会在手机的系统消息应用中嵌入短信拦截模块。用户手机收到的短信会经过短信拦截模块,来确定短信是否拦截。而短信拦截模块的主要实现技术包括关键词、正则过滤以及文本分类模型。由于模型、规则的局限性,常常会出现将正常短信误拦截情况,进而导致用户无法正常接收、浏览企业发送的正常短信。
短信拦截模块的设置,一方面确实大幅提升了用户的体验,降低了用户收到垃圾短信的可能性,但另一方面也存在企事业单位正常发送的、为用户提供服务的部分正常短信被误拦截的情况,因信息缺失导致沟通不畅,为企业、用户带来了额外的沟通成本。
我们的方案
如何防止企事业单位正常发送的短信被误拦截?我司提供了一种对抗消息样本生成的方法。将短信文本中拦截指数较高的词汇替换为拦截指数较低的词汇,更加针对性的进行对抗消息样本生成,可有效的防止短信被误拦截。
该方法主要有以下几点贡献:
1.统计量化:本发明利用NLP技术,从大量数据样本中计算词汇拦截指数,以此衡量词汇被短信拦截模块拦截的程度。构建带拦截指数消息同义词库、消息反义转换词库、高拦截词库。
2.针对性强:本发明将消息文本中拦截指数较高的词汇替换为拦截指数较低的词汇,进行对抗消息文本生成,更加有效的防止短信被误拦截。
3.人机结合:本发明可以根据量化计算后的信息,给运营人员提供具体短信文本优化内容和目标,避免关键短信的发送失败。在持续使用过程中可以不断完善高拦截词同义词库,从而更加智能的生成有效的对抗文本。本发明合理使用了对抗文本技术,充分发挥了技术优势和人工优势,是一个人机结合的应用方案。
产品能力
本发明专利技术已经集成到我司产品“消息保镖”中。产品界面如下所示:标注的“同义词”表示拦截指数较高的词汇,可以替换为拦截指数较低的同义词汇。通过自动生成和人工干预相结合的方式进行词汇替换达到防止短信被误拦截的目的。
扫码