数据集笔记:Telecom Shanghai Dataset

0 数据地址

📱Telecom Shanghai Dataset (kaggle.com)

1 数据描述

  • 该数据集由上海电信提供,包含超过720万条记录,记录了9481部手机通过3233个基站访问互联网的情况,时间跨度为六个月。
  • 例如,下图显示了基站的分布情况。每个节点代表中国上海的一个基站。
  • 这个数据集可以帮助研究人员评估他们在移动边缘计算主题上的解决方案,如边缘服务器部署、服务迁移、服务推荐等。

2 数据介绍

  • 电信数据集展示了6个参数,例如月份、数据、开始时间、结束时间、基站位置、手机ID。
  • 通过数据集可以找到用户的轨迹。

每15天一个表

3 python读取+可视化

3.1 读取数据

import pandas as pd

data=pd.read_excel('Downloads/Telecom Shanghai Dataset/data_10.110.15.xlsx',names=['Data','start time','end time','cell station lon','cell station lat','user id'])

3.2 剔除经纬度为NaN的record 

data1=data.dropna()
data1

3.3 选择某一天的数据

import datetime
data2=data1[(data1['start time']>=datetime.datetime(2014,10,15)) & (data1['start time']<datetime.datetime(2014,10,16))]
data2

 

3.4 根据user id和时间排序

data2=data2.sort_values(by=['user id','start time'])
data2

 

3.5 停留的记录只保留第一条

 3.5.1 首先确定哪些时刻在移动

记录当前位置和前一时刻的位置

data2['location']=data2['cell station lon'].astype(str)+'_'+data2['cell station lat'].astype(str)
data2

data2['prev_location']=data2['location'].shift(1)
data2

 

data2['location_changed']=(data2['location']!=data2['prev_location'])
data2

 

3.5.2 保留当前时刻在移动的记录 

data3=data2[data2['location_changed']==True]
data3

 

data3=data3[[ 'start time', 'end time', 'cell station lon',
       'cell station lat', 'user id']]
data3

 

3.6 保留轨迹长度大于10的轨迹

计算每一个用户id出现的次数

iid=data3.groupby('user id').size().reset_index(name='count')
iid

iid['count'].describe()
'''
count    2956.000000
mean        4.675237
std         4.769128
min         1.000000
25%         2.000000
50%         3.000000
75%         6.000000
max        69.000000
Name: count, dtype: float64
'''
iid=iid[iid['count']>10]
iid

data4=data3[data3['user id'].isin(iid['user id'])]
data4

3.7 绘制一条轨迹(使用folium)

import numpy as np
tmp=data4[data4['user id']=='00a05a4f2b937fd38888c03213c4deb2'].reset_index()
tra_lst=[]
for j in range(tmp.shape[0]):
        tra_lst.append([tmp.at[j,'cell station lon'],tmp.at[j,'cell station lat']])
tra_lst=np.array(tra_lst)
m=folium.Map(location=tra_lst.mean(axis=0),zoom_start=13)
for i in tra_lst:
    folium.Marker(location=i).add_to(m)
folium.PolyLine(locations=tra_lst).add_to(m)
    
m

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/128065.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Visual Components应用解决方案 衡祖仿真

Visual Components可为客户量身设计及规划自动化产线系统&#xff0c;作为全方位的数位规划工具&#xff0c;它能够从制程规划、生产到销售皆能够整合在单一平台&#xff0c;有助于内部的技术沟通及外部销售。此外利用Visual Components整合物流及机器人模拟功能&#xff0c;可…

【Python3】【力扣题】242. 有效的字母异位词

【力扣题】题目描述&#xff1a; 【Python3】代码&#xff1a; 1、解题思路&#xff1a;若字符串长度相同&#xff0c;依次遍历元素&#xff0c;比较两个字符串的该元素个数是否相同。【耗时长】 知识点&#xff1a;len(...)&#xff1a;获取序列&#xff08;字符串、列表等&…

新零售时代,传统便利店如何转型?

在零售批发业&#xff0c;如何降低各环节成本、提高业务运转效率、更科学地了解客户服务客户&#xff0c;是每家企业在激烈竞争中需要思考的课题。 对零售批发企业来说&#xff0c;这些问题或许由来已久&#xff1a; &#xff08;1&#xff09;如何对各岗位的员工进行科学的考…

若依框架前后端分离版,集成数据库版本控制flyway

在admin模块的pom.xml增加依赖 <!-- 数据库版本控制 --><dependency><groupId>org.flywaydb</groupId><artifactId>flyway-core</artifactId><version>7.15.0</version></dependency>在admin模块下的resources 的配置文…

微信机器人接口开发

E云 是一套完整的的第三方服务平台&#xff0c;包含微信API服务、企微API服务、SCRM系统定制、企微系统定制、服务类软件定制等模块&#xff0c;本文档主要讲述个微API服务相关&#xff0c;以下简称API&#xff0c;它能处理用户微信中的各种事件&#xff0c;提供了开发者与个微…

OceanMind海睿思再次携手中冶华天,持续助力数字化转型升级!

近日&#xff0c;中新赛克海睿思 再次与 世界500强企业旗下重要骨干企业——中冶华天工程技术有限公司&#xff08;以下简称“中冶华天”&#xff09;达成深度战略合作&#xff0c;为中冶华天提供智能风控分析平台、智能数仓及指标管理平台等服务&#xff0c;携手推进中冶华天“…

Mac电脑Visio文件编辑查看软件推荐Visio Viewer for Mac

mac版Visio Viewer功能特色 在Mac OS X上查看Visio绘图和图表 在Mac OS X上轻松查看MS Visio文件 在Mac上快速方便地打开并阅读Visio文件&#xff08;.vsd&#xff0c;.vsdx&#xff09;。 支持通过放大&#xff0c;缩小&#xff0c;旋转&#xff0c;文本选择和复制&#xff0…

创新,无处不在的便利体验——基于智能视频技术的安防监控系统EasyCVR

随着科技的迅猛发展&#xff0c;基于智能视频和语音技术的EasyCVR智能安防监控系统正以惊人的速度改变我们的生活。EasyCVR通过结合先进的视频分析、人工智能和大数据技术&#xff0c;为用户提供了更加智能、便利的安全保护体验&#xff0c;大大提升了安全性和便利性。本文将介…

web应用程序、Django框架的学习

web应用程序 什么是web? Web应用程序是一种可以通过Web访问的应用程序,用户只需要有浏览器即可&#xff0c;不需要再安装其他软件 案例&#xff1a; 淘宝网、京东网、博客园、等都是基于web应用的程序 应用程序有两种模式C/S、B/S。C/S是客户端/服务器端程序&#xff0c…

2011年03月31日 Go生态洞察:Godoc —— Go代码的文档化

&#x1f337;&#x1f341; 博主猫头虎&#xff08;&#x1f405;&#x1f43e;&#xff09;带您 Go to New World✨&#x1f341; &#x1f984; 博客首页——&#x1f405;&#x1f43e;猫头虎的博客&#x1f390; &#x1f433; 《面试题大全专栏》 &#x1f995; 文章图文…

list部分接口模拟实现(c++)

List list简介list基本框架list构造函数list_node结构体的默认构造list类的默认构造 push_back()iteartor迭代器迭代器里面的其他接口const迭代器通过模板参数实现复用operator->() insert()erase()clear()析构函数迭代器区间构造拷贝构造operator() list简介 - list可以在…

一篇简述 Linux 移植与系统启动

1、Linux系统启动与U-Boot 所谓移植就是把程序代码从一种运行环境转移到另一种运行环境。对于内核移植来说&#xff0c;主要是从一种硬件平台转移到另一种硬件平台上运行。 体系结构级别的移植是指在不同体系结构平台上Linux内核的移植&#xff0c;例如&#xff0c;在ARM、MI…

前端项目导入vue和element

1.安装nodejs 下载链接https://cdn.npmmirror.com/binaries/node/v18.18.0/node-v18.18.0-x64.msi 进入cmd 命令行模式 管理员身份运行 输入 &#xff08;node -v&#xff09;能看到版本号 npm config set prefix "C:\Program Files\nodejs" 默认路径 npm config…

补偿 IIR 滤波器引入的延迟

补偿 IIR 滤波器引入的延迟 对信号进行滤波会引入延迟。这意味着相对于输入&#xff0c;输出信号在时间上有所偏移。 无限冲激响应滤波器对某些频率分量的延迟可能比其他频率分量更长。它们会使输入信号呈现明显失真。函数 filtfilt 可补偿此类滤波器引入的延迟&#xff0c;从…

asp.net校园招聘管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net 校园招聘管理系统是一套完善的web设计管理系统&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为vs2010&#xff0c;数据库为sqlserver2008&#xff0c;使用c#语言开发 应用技术&#xff1a;asp.net c#s…

PHP编写采集药品官方数据的程序

在 PHP 中编写爬虫程序&#xff0c;首先我们需要引入一些必要的库&#xff0c;如 curl 和 file_get_contents。然后&#xff0c;我们需要设置爬虫ip信息&#xff0c;以便我们可以从指定的爬虫ip服务器上获取数据。 // 引入必要的库 require_once curl.php;// 设置爬虫ip信息 $p…

【vue+el-upload+vue-cropper】vue图片上传,vue-cropper图片裁剪后上传

一. 先看效果演示 二. 图片上传 用的el-upload加el-image组件 html部分 <el-dialog> ...//无关代码已省略<div v-for"item in imgArr" :key"item.index"><span>{{ item.name }}</span><el-upload action"#" list-t…

客服呼叫中心的语音质检工作

语音质检是呼叫中心运营中必不可缺少的一个环节&#xff0c;呼叫中心语音质检对坐席起着直接监督的作用&#xff0c;也正是这种监督约束推动着客服人员不断提升自身的业务能力。 而客服呼叫中心的质检结果中还蕴藏了大量有价值的信息&#xff0c;可以通过日常的质检工作真正发现…

EtherCAT超高速实时运动控制卡XPCIE1032H上位机C#开发(一):驱动安装与建立连接

XPCIE1032H功能简介 XPCIE1032H是一款基于PCI Express的EtherCAT总线运动控制卡&#xff0c;可选6-64轴运动控制&#xff0c;支持多路高速数字输入输出&#xff0c;可轻松实现多轴同步控制和高速数据传输。 XPCIE1032H集成了强大的运动控制功能&#xff0c;结合MotionRT7运动…

OTA包添加自定义内容

起因 新开一条线&#xff0c;需要上传的OTA包里加点内容&#xff0c;好让后台校验它是否是当前这条线(短期最小改动)。 开整 之前看过ota包结构&#xff0c;整包和差分包里都有一个payload_properties.txt文件&#xff0c;所以最简单的就是给这个txt文件里追加点自定义内容&…