NLP技术在营业选址中的实践与探索

传统营业选址面临的问题

在电信业务的服务流程中,用户装机地址的准确性和清晰度对于整个服务体验和运营效率起着至关重要的作用。然而,在实际操作中,装机地址的确定往往面临诸多挑战,这些问题不仅影响用户的服务体验,也对电信运营商的资源配置和服务质量提出了考验。以下是在电信业务中,装机地址选址过程中所面临的一些主要问题:

01 客户描述地址找不到

客户描述的装机地址搜索不到,或者客户描述不清详细的地址,缺乏GIS地图等辅助手段,导致无法直接受理,耗费较多装维人员地址核查工作量。

02 语义理解能力不足

完全基于文本匹配算法进行搜索,缺乏对相同语义的近似地址的理解能力譬如4-1-902与4栋1单元902室、威尼斯水城与北外滩水城等。

03 输入容错能力不足

标准地址维护及搜索输入过程中对于同音字、近音字的容错能力不足,地址录入或搜索输入错误导致搜索不出来。

04 多渠道支撑能力不足

针对前台营业、电商渠道、公众号、小程序等多种不同的业务办理渠道对地图选址服务的诉求不一致,缺乏面向不同用户的高效个性化选址服务。

智能化的转型,创新的智能选址理念

大模型等技术趋势正在深刻改变我们的工作与生活,带来多方面的变革与优势。利用深度学习技术,大模型能更好地理解用户需求和偏好,提供个性化的服务和体验,比如定制化推荐、智能客服对话等,促进了不同行业和技术领域的交叉融合,为解决综合性问题提供了新途径。

结合传统营业选址所面临的问题,通过大模型或者小模型等技术,为选址提供了创新思路,催生出来智能化选址的整体解决方案。

图片

                                                

数据层:对地址及其关联数据进行管理,包括原生的标准地址数据、图商提供的POI\AOI数据、位置坐标数据、地址和资源覆盖数据等。这些数据一方面为训练模型提供输入;另外一方面又是上层应用的使用数据集。

服务层:构建地址大模型或者地址小模型的服务,结合搜索引擎服务,为上层应用提供服务能力支撑,包括文本选址能力、GIS选址能力。

应用层:根据业务场景,分别提供营业厅选址、电商渠道选址、微信小程序选址、客户自助选址等应用。

智能选址的关键举措

01 提升地址准确性,构建相似关系

标准地址是客户接入网络的关键衔接点;是业务受理的第一入口,关系着业务是否能正常受理;是维系客户的关键点,关系着是否可以及时上门安装和修障;是网络能力对外开放的风向标,关系着网络覆盖范围;是保障网络质量的枢纽站,关系着重点区域、重点客户的服务质量。

引入图数据库构建地址知识图谱,用于分析标准地址的规范性、完整性;引入地址相似度算法,构建相似度分析模型,用于分析标准地址的一致性和重复性。

通过使用图数据库技术,将千万级的标准地址按照点-线的结构进行存储,构建出如下的地址图谱,基于此图谱上进行标准地址级别规范性、完整性的诊断和稽核。

图片

在图谱中除了展示上下级之间的地址关系外,同时还记录文字相似的地址关系、位置相近的地址关系,从而可以直接在图谱中查找。

地址相似度计算方法有如下两种:

文本相似度:

在传统通过词频进行分析的基础上,扩展增加NLP技术叠加语义的理解,实现更精准的文本相似分析。

位置相似度:

将标准地址转换到地图上的经纬度坐标点,通过对坐标点之间进行距离计算,从而实现位置相似度分析。

  • 二维地图上计算两点之间的距离,最常用的就是欧几里德公式:

图片

  • 当两点之间的距离很近(如<10米)时,或者等于0时,可以判断为这2个地址相似/相同。

图片

02 基于NLP通用模型的智能选址服务

针对微信小程序、电渠等多样化的渠道选址特点,用户描述的装机地址与标准地址存在较大差异,对地址一次匹配成功率要求高,借助NLP通用模型的语义理解和智能分词能力,有效提升用户地址与标准地址匹配准确性。整体解决思路如下所示:

图片

根据已有地址数据进行训练,地址语义模型训练相关主要语料如下:

  • 地名(全国地名)

  • 机构(全国机构)

  • 数词(阿拉伯、中文)

  • 量词(地址相关)

  • 简称(地址相关)

  • 方位词(如东南、西北等)

  • 名词(建筑物、交通设施、商业名称、历史地点等等)

  • 描述词(如旧、新、内、外、上、下、中等)

选址过程NLP切入应用:

图片

  • 用户输入生活地址或描述地址,输入过程中地址自动补全

  • 基于NLP通用模型的语义理解,实现精准地址分词

  • 根据同义词库、忽略词库、错别词库智能化完成语义转换和标准化,补齐缺失地址级别

  • 基于不同的选址场景,对敏感地址进行过滤和脱敏,根据地址覆盖类型缩小选址范围

  • 通过搜索引擎的搜索能力,对多源地址数据进行综合搜索

  • 根据匹配到的标准地址,结合覆盖场景及分级匹配权重,对不同地址的匹配进行综合评分

  • 基于评分及搜索配置进行智能化的搜索排序

03 基于地址领域模型的智能选址服务

基于结合省内地址库数据和地图POI数据进行预训练的定制化地址领域模型,实现地址基于文本的模糊检索,并支持基于POI的地址近似度排序,有效解决传统选址基于固定规则不支持语义和位置理解的问题,提升用户一次选址成功率。

地址领域模型的训练:

图片

  • 基于省内地址库地址数据的模型定制化训练

  • 基于异常匹配反馈的微调调优

  • 搜索结果基于POI近似度算法排序

地址领域模型的选址应用:

图片

  • 场景1:用户输入“威尼斯水城12街区4-102”,准确匹配标准地址“**省**市**区**路**号北外滩水城十二街区4栋102室” 

  • 场景2:用户输入“**商场旁边的花圆小区”,准确匹配标准地址“**省**市**区**街道123号花园小区”

  • 场景3:用户输入“花园小区1-3-201”,该地址实际不存在,自动匹配到多个附近的近似地址给用户,“**省**市**区花园小区1号楼”等

带来的成效

极致用户搜索体验:通过用户输入地址的输入纠错、智能化分词,并应用大模型的能力,实现高度容错的智能化搜索体验。

一次选址成功率大于95%:应用大模型技术,对传统选址能力进行有效补充,并通过自学习能力,有效提升一次选址成功率。

降低地址运维工作量:通过地址别名挖掘、地址补全、地址自学习覆盖等智能化的能力,有效降低地址及覆盖数据维护工作量。

图片

某智能选址项目中通过引入NLP智能选址能力,同时实现了PC端和微信小程序的高效选址和资源能力预判,用户在输入地址信息时更加的简便,无需人为进行空格分割短语,地址搜索更加精准。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/883261.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

wireshark使用要点

目录 IP过滤 端口过滤 内容过滤 过滤udp 过滤tcp IP过滤 ip.src XXX.XXX.XXX.XXX 只显示消息源地址为XXX.XXX.XXX.XXX的信息 ip.dst XXX.XXX.XXX.XXX 只显示消息目的地址为XXX.XXX.XXX.XXX的信息 ip.addr XXX.XXX.XXX.XXX显示消息源地址为XXX.XXX.XXX.XXX&#xff0…

通过 OBD Demo 体验 OceanBase 4.3 社区版

本文作者&#xff1a;马顺华 引言 OceanBase 4.3 是一个专为实时分析 AP 业务设计的重大更新版本。它基于LSM-Tree架构&#xff0c;引入了列存引擎&#xff0c;实现了行存与列存数据存储的无缝整合。这一版本不仅显著提升了AP场景的查询性能&#xff0c;同时也确保了TP业务场景…

抽象类、比较器和接口

一.抽象类 1.抽象类的概念&#xff1a;如果一个类中没有包含足够的信息来描述一个具体的对象&#xff0c;这样的类就是抽象类。&#xff08;图例说明&#xff1a;&#xff09; 2.抽象方法的概念&#xff1a;当一个方法被abstract来修饰&#xff0c;此时代表着这个方法可以不进…

leetcode-189:轮转数组

给定一个整数数组 nums&#xff0c;将数组中的元素向右轮转 k 个位置&#xff0c;其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转 3 步: [5,6,7,1,2,3,4…

毕业设计选题:基于ssm+vue+uniapp的自助购药小程序

开发语言&#xff1a;Java框架&#xff1a;ssmuniappJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;M…

828华为云征文|使用Flexus X实例集成ES搜索引擎

目录 一、应用场景 1.1 Flexus X实例概述 1.2 ES搜索引擎 二、安装相关服务 2.1 安装Elasticsearch7.17.0 2.2 安装kibana7.17.0 三、开通安全组规则 四、整体感受 4.1 Flexus X实例 4.2 使用感觉 一、应用场景 1.1 Flexus X实例概述 Flexus X实例是华为云推出的一款…

Cisco Packet Tracer的安装加汉化

这个工具学计算机网络的同学会用到 1.下载安装 网盘链接&#xff1a;https://pan.baidu.com/s/1CmnxAD9MkCtE7pc8Tjw0IA 提取码&#xff1a;frkb 点击第一个进行安装&#xff0c;按步骤来即可。 2.汉化 &#xff08;1&#xff09;复制chinese.ptl文件 &#xff08;2&…

Redisson分布式锁的概念和使用

Redisson分布式锁的概念和使用 一 简介1.1 什么是分布式锁&#xff1f;1.2 Redisson分布式锁的原理1.3 Redisson分布式锁的优势1.4 Redisson分布式锁的应用场景 二 案例2.1 锁竞争案例2.2 看门狗案例2.3 参考文章 前言 这是我在这个网站整理的笔记,有错误的地方请指出&#xff…

如何在 macOS 上恢复未保存的 Excel 文件 – 文件恢复的最佳方法

Microsoft Excel 主要用于学生、员工和组织创建电子表格、报告和许多其他内容。我们是人&#xff0c;我们也容易忘记事情。因此&#xff0c;您想要在 macOS 上恢复未保存的 Excel 文件并不罕见。 虽然在 Excel 上恢复未保存的电子表格很容易&#xff0c;但在 macOS 上就有些棘…

AWS注册时常见错误处理

引言 创建AWS账号是使用AWS云服务的第一步&#xff0c;但在注册过程中可能会遇到一些常见的问题。本文中九河云将帮助您排查和解决在创建AWS账户时可能遇到的一些常见问题&#xff0c;包括未接到验证电话、最大失败尝试次数错误以及账户激活延迟等。 常见问题及解决方法 1. …

VSCode编程配置再次总结

VScode 中C++编程再次总结 0.简介 1.配置总结 1.1 launch jsion文件 launch.json文件主要用于运行和调试的配置,具有程序启动调试功能。launch.json文件会启用tasks.json的任务,并能实现调试功能。 左侧任务栏的第四个选项运行和调试,点击创建launch.json {"conf…

String类常用的方法

源代码&#xff1a; 输出结果&#xff1a;

卡码网KamaCoder 108. 冗余连接

题目来源&#xff1a;108. 冗余连接 C题解&#xff08;思路来源代码随想录&#xff09;&#xff1a;并查集。因为原来是树&#xff0c;所以加入边之前肯定不是一个根&#xff0c;如果是一个根&#xff0c;再加一条边&#xff0c;肯定成环。所以只要找到根一致的两个点组成的边即…

前端工程化4:从0到1构建完整的前端监控平台

前言 一套完整的前端监控系统的主要部分&#xff1a; 数据上报方式数据上送时机性能数据采集错误数据采集用户行为采集定制化指标监控sdk 监控的目的&#xff1a; 一、数据上报方式 本文的方案是&#xff0c;优先navigator.sendBeacon&#xff0c;降级使用1x1像素gif图片…

网站建设中,JavaScript为什么现在可以做后台了?

JavaScript&#xff0c;作为一种最初为浏览器端脚本设计的语言&#xff0c;已经逐渐发展成为可以在服务器端运行的强大工具。以下是JavaScript可以做后台开发的原因分析&#xff1a; Node.js的崛起 事件驱动与非阻塞I/O&#xff1a;Node.js的事件驱动和非阻塞I/O模型使得JavaSc…

[WMCTF2020]Make PHP Great Again 2.01

又是php代码审计,开始吧. 这不用审吧&#xff0c;啊喂. 意思就是我们要利用require_once()函数和传入的file的value去读取flag的内容.&#xff0c;貌似呢require_once()已经被用过一次了&#xff0c;直接读取还不行&#xff0c;看一下下面的知识点. require_once() require…

2.1 HuggingFists系统架构(一)

系统架构 HuggingFists的前端主体开发语言为HtmlJavascript&#xff0c;后端的主体开发语言为Java。在算子部分有一定份额的Python代码&#xff0c;用于整合Python在数据处理方面强大能力。 功能架构 HuggingFists的功能架构如上&#xff0c;由下向上各层为&#xff1a; 数据存…

鸿蒙OpenHarmony【轻量系统芯片移植】轻量系统STM32F407芯片移植案例

轻量系统STM32F407芯片移植案例 介绍基于STM32F407IGT6芯片在拓维信息[Niobe407]开发板上移植OpenHarmony LiteOS-M轻量系统&#xff0c;提供交通、工业领域开发板解决方案。移植架构采用Board与SoC分离方案&#xff0c;使用arm gcc工具链Newlib C库&#xff0c;实现了lwip、l…

windows11环境安装lua及luarocks(踩坑篇)

一、lua安装及下载 官方地址&#xff1a; Lua Binaries Download 从这里就有坑了&#xff0c;下载后先解压win64_bin.zip&#xff0c;之后解压lib&#xff0c;用lib中的文件替换win64的&#xff0c;并把include文件夹复制过去&#xff0c;之后复制并重命名lua54&#xff0c;方…

初识Jenkins持续集成系统

随着软件开发复杂度的不断提高&#xff0c;团队成员之间如何更好地协同工作以确保软件开发的质量&#xff0c;已经慢慢成为开发过程中不可回避的问题。Jenkins 自动化部署可以解决集成、测试、部署等重复性的工作&#xff0c;工具集成的效率明显高于人工操作;并且持续集成可以更…