transdata笔记:手机数据处理

1 mobile_stay_duration 每个停留点白天和夜间的持续时间

transbigdata.mobile_stay_duration(
    staydata, 
    col=['stime', 'etime'], 
    start_hour=8, 
    end_hour=20)

1.1 主要参数

staydata停留数据(每一行是一条数据)
col  列名,顺序为[‘starttime’,’endtime’]
start_hour白天的开始时间
end_hour白天的结束时间

 1.2 返回内容

duration_night  一个panda的Series,表示夜间持续时间
duration_day 一个panda的Series,表示白天持续时间

1.3 举例

import pandas as pd
from transbigdata import mobile_stay_duration

# 示例数据
data = {
    'stime': ['2024-01-01 07:00', '2024-01-01 22:00', '2024-01-02 11:00', '2024-01-02 03:00'],
    'etime': ['2024-01-01 10:00', '2024-01-02 02:00', '2024-01-02 15:00', '2024-01-02 05:00']
}
staydata = pd.DataFrame(data)
staydata['stime'] = pd.to_datetime(staydata['stime'])
staydata['etime'] = pd.to_datetime(staydata['etime'])
staydata

每一行表示在一个staypoint的开始-结束时间

result = mobile_stay_duration(staydata, col=['stime', 'etime'], start_hour=8, end_hour=20)
result
'''
(0     3600.0
 1    14400.0
 2        0.0
 3     7200.0
 dtype: float64,
 0     7200.0
 1        0.0
 2    14400.0
 3        0.0
 dtype: float64)
'''

两个pandas.Series,分别表示夜间/白天持续时间

2 mobile_identify_work 识别工作地点

transbigdata.mobile_identify_work(
    staydata, 
    col=['uid', 'stime', 'etime', 'LONCOL', 'LATCOL'], 
    minhour=3, 
    start_hour=8, 
    end_hour=20, 
    workdaystart=0, 
    workdayend=4)

从手机停留数据中识别工作地点。规则是确定工作日白天持续时间最长的位置(平均持续时间应超过“minhour”)

2.1 参数

staydata停留数据
col

列名,按 [‘uid’、stime’、’etime’、’locationtag1’、’locationtag2’, …] 的顺序排列。

可以有多个“locationtag”列来指定位置

minhour工作日的最短持续时间(小时)
workdaystart一周中工作日的开始(0表示周一)
workdayend 一周中工作日的结束
start_hour工作一天的开始时间
end_hout工作一天的结束时间

2.2 举例

import pandas as pd
from transbigdata import mobile_identify_work

# 示例数据
data = {
    'uid': [1, 1, 1, 2, 2],
    'stime': ['2024-01-01 09:00', '2024-01-02 09:30', '2024-01-03 08:45', '2024-01-06 09:15', '2024-01-07 09:45'],
    'etime': ['2024-01-01 17:00', '2024-01-02 16:30', '2024-01-03 18:00', '2024-01-06 17:15', '2024-01-07 16:45'],
    'LONCOL': [116.38, 116.39, 116.38, 116.40, 116.40],
    'LATCOL': [39.90, 39.91, 39.90, 39.92, 39.92]
}
staydata = pd.DataFrame(data)
staydata['stime'] = pd.to_datetime(staydata['stime'])
staydata['etime'] = pd.to_datetime(staydata['etime'])
staydata

 

work_locations = mobile_identify_work(
    staydata, 
    col=['uid', 'stime', 'etime', 'LONCOL', 'LATCOL'], 
    minhour=3, 
    start_hour=8, 
    end_hour=20, 
    workdaystart=0, 
    workdayend=4
)
work_locations

 

对于uid=2,他的两个停留记录(1月6日 & 1月7日是周六周日,不是工作日,所以不记录用户2的工作位置)

3 mobile_identify_home 识别居住地位置

从手机停留数据中识别居住地位置。规则是确定夜间持续时间最长的位置

staydata停留数据
col

列名,按 [‘uid’, ‘stime’, ‘etime’, ‘locationtag1’, ‘locationtag2’, …] 的顺序排列。

可以有多个“位置标签”列来指定位置

start_hour 白天时间的开始时间
end_hour白天时间的结束时间

3.1 举例

import pandas as pd
from transbigdata import mobile_identify_home

# 示例数据
data = {
    'uid': [1, 1, 2, 2],
    'stime': ['2024-01-01 22:00', '2024-01-02 23:00', '2024-01-01 22:30', '2024-01-02 21:00'],
    'etime': ['2024-01-02 06:00', '2024-01-03 07:00', '2024-01-02 05:30', '2024-01-03 06:00'],
    'LONCOL': [116.38, 116.39, 116.40, 116.41],
    'LATCOL': [39.90, 39.91, 39.92, 39.93]
}
staydata = pd.DataFrame(data)
staydata['stime'] = pd.to_datetime(staydata['stime'])
staydata['etime'] = pd.to_datetime(staydata['etime'])
staydata

home_locations = mobile_identify_home(staydata, 
                                      col=['uid', 'stime', 'etime', 'LONCOL', 'LATCOL'], 
                                      start_hour=8, 
                                      end_hour=20)
home_locations

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/339140.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

终极解决Flutter项目运行ios项目报错Without CocoaPods, plugins will not work on iOS or macOS.

前言 最近在开发Flutter项目,运行ios环境的时候报错没有CocoaPods,安卓环境可以正常运行,当时一脸懵逼,网上搜索了一下,有给我讲原理的,还有让我安装这插件那插件的,最终把电脑搞得卡死&#x…

代码随想录算法训练DAY25|回溯2

算法训练DAY25|回溯2 216.组合总和III 力扣题目链接 找出所有相加之和为 n 的 k 个数的组合。组合中只允许含有 1 - 9 的正整数,并且每种组合中不存在重复的数字。 说明: 所有数字都是正整数。 解集不能包含重复的组合。 示例 1: 输入: k 3, n …

Docker安装启动、常用命令、应用部署、迁移备份、Dockerfile、Docker私有仓库

目录 1.Docker安装与启动 1.1 安装Docker 1.2 设置ustc的镜像 1.3 Docker的启动与停止 2.常用命令 2.1 镜像相关命令 2.1.1 查看镜像 2.1.2 搜索镜像 2.1.3 拉取镜像 2.1.4 删除镜像 2.2 容器相关命令 2.2.1 查看容器 2.2.2 创建与启动容器 2.2.3 停止与启动容器 2.…

分享flask_socketio配置时遇到的一些问题

flask_socketio 1.前言 flask_socketio应用启动后,在控制台中,存在着flask_socketio这些烦人的log 一堆的get和post几秒一个让我什么都看不清,因此想要关掉log 结果没想到,找了很多办法半天去不掉flask_socketio的log 试过了…

互联网未来的 3 个愿景

互联网可能是现代技术最伟大的创造,而且它是一项正在进行中的工作。其持续发展的核心是对互联网未来发展的三种不同愿景。在本文中,我们将探讨指导互联网技术和架构未来的三个想法:Web 3.0、Web3 和语义 Web。 Web 3.0:互联网的未…

自然语言处理研究的内容

一.基础技术 1.1 词法分析 词法分析(Lexical Analysis),也称为词法扫描或扫描器,是自然语言处理(NLP)中的基础步骤之一,用于将输入的文本分割成词法单元(Token)。词法单…

Proxmox VE 8 试装Oracle 23c

作者:田逸(formyz) Oracle 当前的最新版本是23c,虽然官方网站下载不了它的正式版本,但是却提供了一个性能受限的免费版本“Oracle Database 23.3 Free”(存储容量受限、内存使用受限)。这里就只…

【llm 使用llama 小案例】

huggingfacehttps://huggingface.co/meta-llama from transformers import AutoTokenizer, LlamaForCausalLMPATH_TO_CONVERTED_WEIGHTS PATH_TO_CONVERTED_TOKENIZER # 一般和模型地址一样model LlamaForCausalLM.from_pretrained(PATH_TO_CONVERTED_WEIGHTS) tokenize…

CGLIB动态代理(AOP原理)(面试重点)

推荐先看JDK 动态代理(Spring AOP 的原理)(面试重点) JDK 动态代理与 CGLIB 动态代理的区别 JDK 动态代理有⼀个最致命的问题是其只能代理实现了接⼝的类. 有些场景下,我们的业务代码是直接实现的,并没有接⼝定义.为了解决这个问…

一.初识Linux 1-3操作系统概述Linux初识虚拟机介绍

目录 一.初识Linux 1.操作系统概述 计算机组成 硬件: 软件: 操作系统: 操作系统工作流程 操作系统作用 常见的操作系统 PC端: 移动端:(掌上操作系统) 一.初识Linux 2.Linux初识 linu…

HTML 入门手册(一)

目录 HTML 1-基础语法 单标签 双标签 整体结构 2-标题和水平线 标题 水平线 3-段落和换行 段落 换行 4-列表 无序列表 有序列表 嵌套列表 5-div和span div span 6-格式化标签 粗体 斜体 下划线中划线 上标和下标 7-超链接(a标签) 链接到URL 链接到本…

php基础学习之代码框架

一&#xff0c;标记 脚本标记&#xff08;已弃用&#xff09;&#xff1a;<script language"php"> php代码 </script> 标准标记&#xff1a;<?php php代码 ?> 二&#xff0c;基础输出语句 不是函数&#xff0c;…

nginx基于IP的多虚拟主机

结合这篇文章一起&#xff1a;nginx虚拟主机-CSDN博客文章浏览阅读63次。虚拟主机指的就是一个独立的站点配置&#xff0c;是nginx默认支持的一个功能&#xff0c;它能够有自己独立的域名&#xff0c;独立的ip&#xff0c;独立的端口配置&#xff0c;能够配置完整的www服务&…

SpringSecurity+OAuth2.0 搭建认证中心和资源服务中心

目录 1. OAuth2.0 简介 2. 代码搭建 2.1 认证中心&#xff08;8080端口&#xff09; 2.2 资源服务中心&#xff08;8081端口&#xff09; 3. 测试结果 1. OAuth2.0 简介 OAuth 2.0&#xff08;开放授权 2.0&#xff09;是一个开放标准&#xff0c;用于授权第三方应用程序…

【Kaggle】泰坦尼克号生存预测 Titanic

文章目录 前言案例背景数据集介绍加载数据集探索性数据分析&#xff08;EDA&#xff09;可视化特征和目标值之间关系缺失值分析 数据预处理数据清洗缺失值处理去除噪声并且规范化文本内容 数据转换 数据划分建模逻辑回归模型决策分类树模型随机森林模型梯度提升树模型 预测LR 完…

imgaug库图像增强指南(34):揭秘【iaa.Clouds】——打造梦幻般的云朵效果

引言 在深度学习和计算机视觉的世界里&#xff0c;数据是模型训练的基石&#xff0c;其质量与数量直接影响着模型的性能。然而&#xff0c;获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此&#xff0c;数据增强技术应运而生&#xff0c;成为了解决这一问题的…

当 OpenTelemetry 遇上阿里云 Prometheus

作者&#xff1a;逸陵 背景 在云原生可观测蓬勃发展的当下&#xff0c;想必大家对 OpenTelemetry & Prometheus 并不是太陌生。OpenTelemetry 是 CNCF&#xff08;Cloud Native Computing Foundation&#xff09;旗下的开源项目&#xff0c;它的目标是在云原生时代成为应…

第十五届蓝桥杯单片机组——DS1302

文章目录 一、DS1302介绍二、使用DS1302需要注意的点2.1 写保护2.2 写入的时间需要以BCD码形式2.3 12小时模式 or 24小时模式 三、代码编写3.1 初始化时间3.2 读取RTC时间 一、DS1302介绍 1.时钟数据&#xff1a;DS1302可以提供秒、分钟、小时、天、日期、月份和年份数据&#…

即插即用篇 | 超越自注意力:面向医学图像分割的可变形大卷积核注意力

医学图像分割在转换器模型的应用下取得了显著的进展,这些模型擅长捕捉广泛的上下文和全局背景信息。然而,这些模型随着标记数量的平方成比例增长的计算需求限制了它们的深度和分辨率能力。大多数当前的方法通过逐层处理D体积图像数据(称为伪3D),在处理过程中错过了关键的跨…

MySQL与PostgreSQL对比

对比 许可证 License MySQL 社区版采用 GPL 许可证。Postgres 发布在 PostgreSQL 许可下&#xff0c;是一种类似于 BSD 或 MIT 的自由开源许可。 即便 MySQL 采用了 GPL&#xff0c;仍有人担心 MySQL 归 Oracle 所有&#xff0c;这也是为什么 MariaDB 从 MySQL 分叉出来。 …