写在前面:最近在群里看到一个这样的直播电商的场景觉得还是挺有趣的,于是就想用Python来实现。
需求描述:根据主播直播时间段结合销售订单的付款时间判断所属销售的归属
生成主播在线直播时间段数据
from datetime import datetime, timedelta
import random
import pandas as pd
def generate_live_data(start_time, live_duration, anchors, num_repeats=4):
"""
生成直播数据。
参数:
start_time (datetime): 直播开始时间。
live_duration (timedelta): 直播时长。
anchors (list): 主播列表。
num_repeats (int): 每个主播重复直播的次数,默认为 4。
返回:
DataFrame: 包含生成的直播数据的 DataFrame,每行包括开始时间、结束时间和主播。
"""
live_data = []
current_time = start_time
for anchor in anchors:
for _ in range(num_repeats): # 每人直播指定次数
end_time = current_time + live_duration # 计算直播结束时间
live_data.append((current_time, end_time, anchor))
current_time = end_time
# 将列表转换为 DataFrame
df = pd.DataFrame(live_data, columns=["Start Time", "End Time", "Anchor"])
return df
# 定义开始时间
start_time = datetime(2024, 4, 11, 0, 0) # 2024年4月11日凌晨
# 定义直播时长
live_duration = timedelta(hours=3) # 每人直播三小时
# 定义主播列表
anchors = ["Anchor 1", "Anchor 2", "Anchor 3", "Anchor 4"]
# 生成直播数据
live_data_df = generate_live_data(start_time, live_duration, anchors)
# 将数据写出到 Excel 文件
excel_file_path = "live_data.xlsx"
live_data_df.to_excel(excel_file_path, index=False)
主播数据展示
生成销售订单数据
import pandas as pd
from datetime import datetime, timedelta
import random
def generate_purchase_data(start_time, end_time, time_interval, customers, products):
"""
生成模拟购买数据,并导出到 Excel 文件。
参数:
start_time (datetime): 数据开始时间。
end_time (datetime): 数据结束时间。
time_interval (timedelta): 时间间隔。
customers (list): 模拟客户姓名列表。
products (list): 模拟商品列表。
返回:
str: 导出的 Excel 文件路径。
"""
# 生成时间列表
time_list = []
current_time = start_time
while current_time < end_time:
time_list.append(current_time)
current_time += time_interval
# 生成模拟购买数据
purchase_data = []
for time in time_list:
for customer in customers:
product = random.choice(products) # 随机选择一个商品
quantity = random.randint(1, 5) # 随机生成购买数量
purchase_data.append((time, customer, product, quantity))
# 将购买数据转换为 DataFrame
df = pd.DataFrame(purchase_data, columns=["Time", "Customer", "Product", "Quantity"])
# 导出到 Excel 文件
excel_file = "purchase_data.xlsx"
df.to_excel(excel_file, index=False)
return excel_file
# 定义开始时间和结束时间
start_time = datetime(2024, 4, 11, 0, 0) # 2024年4月11日凌晨
end_time = datetime(2024, 4, 13, 0, 0) # 2024年4月12日凌晨
# 定义时间间隔
time_interval = timedelta(minutes=30) # 每隔半小时
# 定义模拟的客户姓名列表和商品列表
customers = ["Alice", "Bob", "Charlie", "David", "Emma"]
products = ["Product A", "Product B", "Product C", "Product D", "Product E"]
# 生成购买数据并导出到 Excel 文件
excel_file_path = generate_purchase_data(start_time, end_time, time_interval, customers, products)
print("数据已成功导出到 Excel 文件:", excel_file_path)
销售订单数据展示
根据销售数据匹配主播直播时间段并保存到Excel文件
有时候我们需要根据销售数据来匹配主播的直播时间段,以便进行更深入的分析。
1. 导入必要的模块
import pandas as pd
from datetime import datetime
2. 从Excel文件中读取销售数据和主播直播时间数据
# 从Excel文件中读取销售数据
sales_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\purchase_data.xlsx")
# 将时间列转换为datetime类型
sales_data['Time'] = pd.to_datetime(sales_data['Time'])
# 从Excel文件中读取主播直播时间数据
anchor_time_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\live_data.xlsx")
# 将时间列转换为datetime类型
anchor_time_data['Start Time'] = pd.to_datetime(anchor_time_data['Start Time'])
anchor_time_data['End Time'] = pd.to_datetime(anchor_time_data['End Time'])
3. 初始化结果列表并遍历销售数据
# 初始化一个空列表,用于存储结果
result = []
# 遍历销售数据,判断每笔销售属于哪个主播的直播时间段
for index, row in sales_data.iterrows():
sale_time = row['Time']
customer = row['Customer']
product = row['Product']
quantity = row['Quantity']
# 判断销售时间在哪个主播的直播时间段内
for _, anchor_row in anchor_time_data.iterrows():
start_time = anchor_row['Start Time']
end_time = anchor_row['End Time']
anchor = anchor_row['Anchor']
if start_time <= sale_time <= end_time:
result.append((start_time, end_time, anchor,sale_time, customer, product, quantity))
break
4. 将结果转换为DataFrame并保存到Excel文件
# 将结果转换为DataFrame
result_df = pd.DataFrame(result, columns=['Start Time', 'End Time', 'Anchor','sale_time', 'Customer', 'Product', 'Quantity'])
# 将结果保存到Excel文件
excel_file_path = "live_data2.xlsx"
result_df.to_excel(excel_file_path, index=False)
5. 完整代码
import pandas as pd
from datetime import datetime
# 从Excel文件中读取销售数据
sales_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\purchase_data.xlsx")
# 将时间列转换为datetime类型
sales_data['Time'] = pd.to_datetime(sales_data['Time'])
# 从Excel文件中读取主播直播时间数据
anchor_time_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\live_data.xlsx")
# 将时间列转换为datetime类型
anchor_time_data['Start Time'] = pd.to_datetime(anchor_time_data['Start Time'])
anchor_time_data['End Time'] = pd.to_datetime(anchor_time_data['End Time'])
# 初始化一个空列表,用于存储结果
result = []
# 遍历销售数据,判断每笔销售属于哪个主播的直播时间段
for index, row in sales_data.iterrows():
sale_time = row['Time']
customer = row['Customer']
product = row['Product']
quantity = row['Quantity']
# 判断销售时间在哪个主播的直播时间段内
for _, anchor_row in anchor_time_data.iterrows():
start_time = anchor_row['Start Time']
end_time = anchor_row['End Time']
anchor = anchor_row['Anchor']
if start_time <= sale_time <= end_time:
result.append((start_time, end_time, anchor,sale_time, customer, product, quantity))
break
# 将结果转换为DataFrame
result_df = pd.DataFrame(result, columns=['Start Time', 'End Time', 'Anchor','sale_time', 'Customer', 'Product', 'Quantity'])
# 打印结果
print(result_df)
excel_file_path = "live_data2.xlsx"
result_df.to_excel(excel_file_path, index=False)