目录
数据集1:GEFCom2014负荷数据
数据集2:爱奇艺用户留存预测挑战赛数据集
数据集1:GEFCom2014负荷数据
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1PgCWHx8vYUfGB9UGtCmaVA?pwd=ktn0 提取码:ktn0
- 官方下载:https://ars.els-cdn.com/content/image/1-s2.0-S0169207016000133-mmc1.zip
数据集简介:
GEFCom2014 “负荷预测数据”为竞赛的公共数据集,GEFCom2014 的负荷预测轨迹为概率负荷预测。数据集的可视化如下:
# 导入相应的库文件
import os
import shutil
import matplotlib.pyplot as plt
from common.utils import load_data, extract_data, download_file
%matplotlib inline
#加载数据集
ts_data_load = pd.read_excel('./data/energy.xlsx')
#可视化数据集
ts_data_load.plot(y='load',subplots=True, figsize=(15, 8), fontsize=14)
plt.ylabel('load', fontsize=16)
ts_data_load.plot(y='T', subplots=True, color="#01a2d9", figsize=(15, 8), fontsize=14)
plt.ylabel('Temperature', fontsize=16)
plt.xlabel('timestamp', fontsize=16)
plt.show()
数据集2:爱奇艺用户留存预测挑战赛数据集
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1UQWmIN7P6vcBmYxfZxu_1g?pwd=5ywi 提取码:5ywi
- 官方下载:http://challenge.ai.iqiyi.com/detail?raceId=61600f6cef1b65639cd5eaa6
赛题描述:
爱奇艺是中国和世界领先的高品质视频娱乐流媒体平台,每个月有超过5亿的用户在爱奇艺上享受娱乐服务。爱奇艺秉承“悦享品质”的品牌口号,打造涵盖影剧、综艺、动漫在内的专业正版视频内容库,和“随刻”等海量的用户原创内容,为用户提供丰富的专业视频体验。
爱奇艺手机端APP,通过深度学习等最新的AI技术,提升用户个性化的产品体验,更好地让用户享受定制化的娱乐服务。我们用“N日留存分”这一关键指标来衡量用户的满意程度。例如,如果一个用户10月1日的“7日留存分”等于3,代表这个用户接下来的7天里(10月2日~8日),有3天会访问爱奇艺APP。预测用户的留存分是个充满挑战的难题:不同用户本身的偏好、活跃度差异很大,另外用户可支配的娱乐时间、热门内容的流行趋势等其他因素,也有很强的周期性特征。
本次大赛基于爱奇艺APP脱敏和采样后的数据信息,预测用户的7日留存分。参赛队伍需要设计相应的算法进行数据分析和预测。
数据描述:
本次比赛提供了丰富的数据集,包含视频数据、用户画像数据、用户启动日志、用户观影和互动行为日志等。针对测试集用户,需要预测每一位用户某一日的“7日留存分”。7日留存分取值范围从0到7,预测结果保留小数点后2位。
User portrait data | |
Field name | Description |
user_id | |
device_type | iOS, Android |
device_rom | rom of the device |
device_ram | ram of the device |
sex | |
age | |
education | |
occupation_status | |
territory_code |
App launch logs | |
Field name | Description |
user_id | |
date | Desensitization, started from 0 |
launch_type | spontaneous or launched by other apps & deep-links |
Video related data | |
Field name | Description |
item_id | id of the video |
father_id | album id, if the video is an episode of an album collection |
cast | a list of actors/actresses |
duration | video length |
tag_list | a list of tags |
User playback data | |
Field name | Description |
user_id | |
item_id | |
playtime | video playback time |
date | timestamp of the behavior |
User interaction data | |
Field name | Description |
user_id | |
item_id | |
interact_type | interaction types such as posting comments, etc. |
date | timestamp of the behavior |