专栏链接:https://blog.csdn.net/qq_41921826/category_12495091.html
专栏内容
所有文章提供源代码、数据集、效果可视化
文章多次上领域内容榜、每日必看榜单、全站综合热榜
时间序列预测存在的问题
现有的大量方法没有真正的预测未来值,只是用历史数据做验证
利用时间序列分解算法存在信息泄露的问题:有人用emd+lstm对时间序列进行预测,是否存在原理上的问题? - 知乎
目录
数据集1:GEFCom2014负荷数据
数据集2:爱奇艺用户留存预测挑战赛数据集
数据集3:电力变压器数据集 (ETDataset)
数据集4:2016年电工数学建模竞赛负荷预测数据集
数据集5:风电机组运行数据集
数据集6:澳大利亚电力负荷与价格预测数据
数据集7:常州普利司通光伏数据集
数据集8:新疆光伏风电数据集
数据集1:GEFCom2014负荷数据
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/1PgCWHx8vYUfGB9UGtCmaVA?pwd=ktn0 提取码:ktn0 官方下载:https://ars.els-cdn.com/content/image/1-s2.0-S0169207016000133-mmc1.zip
数据集简介:
GEFCom2014 “负荷预测数据”为竞赛的公共数据集,GEFCom2014 的负荷预测轨迹为概率负荷预测。数据集的可视化如下:
数据集2:爱奇艺用户留存预测挑战赛数据集
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/1UQWmIN7P6vcBmYxfZxu_1g?pwd=5ywi 提取码:5ywi 官方下载:http://challenge.ai.iqiyi.com/detail?raceId=61600f6cef1b65639cd5eaa6
赛题描述:
爱奇艺是中国和世界领先的高品质视频娱乐流媒体平台,每个月有超过5亿的用户在爱奇艺上享受娱乐服务。爱奇艺秉承“悦享品质”的品牌口号,打造涵盖影剧、综艺、动漫在内的专业正版视频内容库,和“随刻”等海量的用户原创内容,为用户提供丰富的专业视频体验。
爱奇艺手机端APP,通过深度学习等最新的AI技术,提升用户个性化的产品体验,更好地让用户享受定制化的娱乐服务。我们用“N日留存分”这一关键指标来衡量用户的满意程度。例如,如果一个用户10月1日的“7日留存分”等于3,代表这个用户接下来的7天里(10月2日~8日),有3天会访问爱奇艺APP。预测用户的留存分是个充满挑战的难题:不同用户本身的偏好、活跃度差异很大,另外用户可支配的娱乐时间、热门内容的流行趋势等其他因素,也有很强的周期性特征。
本次大赛基于爱奇艺APP脱敏和采样后的数据信息,预测用户的7日留存分。参赛队伍需要设计相应的算法进行数据分析和预测。
数据描述:
本次比赛提供了丰富的数据集,包含视频数据、用户画像数据、用户启动日志、用户观影和互动行为日志等。针对测试集用户,需要预测每一位用户某一日的“7日留存分”。7日留存分取值范围从0到7,预测结果保留小数点后2位。
User portrait data Field name
Description
user_id
device_type
iOS, Android
device_rom
rom of the device
device_ram
ram of the device
sex
age
education
occupation_status
territory_code
App launch logs Field name
Description
user_id
date
Desensitization, started from 0
launch_type
spontaneous or launched by other apps & deep-links
Video related data Field name
Description
item_id
id of the video
father_id
album id, if the video is an episode of an album collection
cast
a list of actors/actresses
duration
video length
tag_list
a list of tags
User playback data Field name
Description
user_id
item_id
playtime
video playback time
date
timestamp of the behavior
User interaction data Field name
Description
user_id
item_id
interact_type
interaction types such as posting comments, etc.
date
timestamp of the behavior
数据集3:电力变压器数据集 (ETDataset)
数据集下载:
Github下载:https://github.com/zhouhaoyi/ETDataset/blob/main/README_CN.md
数据描述:
数据提供了两年的数据,每个数据点每分钟记录一次(用 m 标记),它们分别来自中国同一个省的两个不同地区,分别名为ETT-small-m1和ETT-small-m2。每个数据集包含2年 * 365天 * 24小时 * 4 = 70,080数据点。 此外,我们还提供一个小时级别粒度的数据集变体使用(用 h 标记),即ETT-small-h1和ETT-small-h2。 每个数据点均包含8维特征,包括数据点的记录日期、预测值“油温”以及6个不同类型的外部负载值。
数据集4:2016年电工数学建模竞赛负荷预测数据集
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/1h3sGqebtLp1XGK9kmN53Zg?pwd=jx5p 提取码:jx5p
数据简介:
数据集5:风电机组运行数据集
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/13-YLcvuOP6-ev6XdGtQbGQ?pwd=levp 提取码:levp
数据简介:
数据集包括风速、风向、温度、湿度、气压和真实功率等共30万余条。
WINDSPEED:预测风速WINDDIRECTION:风向TEMPERATURE:温度HUMIDITY:湿度PRESSURE:气压PREPOWER:预测功率ROUND(A.WS,1):实际风速ROUND(A.POWER,0):实际功率YD15:已有实际功率预测目标
数据集6:澳大利亚电力负荷与价格预测数据
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/1ehm9aJQqzbGOITnz3LwyLw?pwd=k4s1 提取码:k4s1
数据简介:
数据集包括日期、小时、干球温度、露点温度、湿球温度、湿度、电价、电力负荷特征,时间间隔30min。
数据集7:常州普利司通光伏数据集
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/1vXRjtf2gen_-2b1jDwYLXA?pwd=loam 提取码:loam
数据简介:
数据集包括时间、场站名称、辐照强度(Wh/㎡)、 环境温度(℃)、全场功率(kW)等5个特征,时间间隔5min。(注意:辐照强度(Wh/㎡)、 环境温度(℃)、全场功率(kW)特征名前有个空格)
数据集8:新疆光伏风电数据集
数据集下载:
百度网盘:链接:https://pan.baidu.com/s/1q1SCc64JpEs78tpJr9SqIA?pwd=time 提取码:time
光伏数据简介:
光伏数据集包括组件温度(℃) 、温度(°) 气压(hPa)、湿度(%)、总辐射(W/m2)、直射辐射(W/m2)、散射辐射(W/m2)、实际发电功率(mw)特征,时间间隔15min。