1.什么是转化回流时间?

App 的激活定义为用户下载后启动了该App,即发生激活行为。从用户点击广告到广告系统得知用户激活了App(如果有),通常会有较长的时间间隔,主要由以下两方面原因导致:

1) 用户可能在下载之后过了很久才启动App;

2) 用户启动App的行为需要广告主上报回传给广告系统,通常会有一定的延时。

这里回流时间表示了广告主把App激活数据上报给广告系统的时间,回流时间超过5天的数据会被系统忽略。

值得注意的是,本次竞赛的训练数据提供的截止第31天0点的广告日志,因此,对于最后几天的训练数据,某些label=0并不够准确,可能广告系统会在第31天之后得知label实际上为1。

2.原始时间信息抹掉了,关键数据源时间关系是什么?

为了直观起见,如下图所示:

3.初赛和复赛数据是如何选取的?

从复赛数据中根据appID随机采样得到初赛数据。

4.用户个人资料和App安装数据来源?

数据来自腾讯业务产品历史上一段时间真实数据集合的小量随机采样,关键字段均经过加密处理,只提供ID字段表示,不提供具体含义。数据处理上为比赛用途单独设计,不考虑、也不作为其他用途。

5.app_categories.csv 中的非三位数字非0的表示什么意思?
app_categories.csv 中 appCategory 除 0 外的一位数字,如1,2,表示只有一级类目,没有二级类目;
6.请问 train.csv 中出现的安装和用户安装流水 user_app_actions.csv 是什么关系?我发现在 user_app_actions.csv 中,27日只有两位用户安装3个应用,而在 train.csv 中则是多很多。
user_app_actions.csv 中用户的安装流水是通过腾讯的其他产品收集,采样和加密处理得到,是作为 train.csv 中用户安装数据的一个补充。27号数据较稀疏(其他日期的数据也有可能出现类似的情况),是由于上游任务延迟导致的,也是广告业务场景会碰到的真实场景,对特征抽取和模型训练来说会是一个挑战。
7.训练集最后几天的label可能是不准的,那测试集的label是准确的吗?
测试集的label是准确的,表示最终是否有转化。
8.本次比赛是否允许使用外部数据?
不允许使用外部数据。
9.我本地已经有王者荣耀这个APP了,我在广告位点击了王者荣耀广告,一会儿我去玩,算不算转化?
点击后安装并打开的才算激活,点击广告之前已经安装的不算。