面向电信行业存量用户的智能套餐个性化匹配模型(top6)

算法云阙使
• 阅读 2153

1、赛题链接:面向电信行业存量用户的智能套餐个性化匹配模型

2、赛题任务: 利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。

3、数据解读及预处理:

  • 多分类任务-->11分类;根据service_type来划分套餐 ,一类8个,另外一类3个(下文图片里面的大宝卡以及腾讯王卡系列)。
  • 11个套餐表所对应的卡,通过对1_total_fee进行value_counts和网上套餐比较可以大致推出来。

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

  • 数据预处理---->清洗数据以及对1234_total_fee进行类似3sigma的进行标记。

4、特征工程:

  • 对1-2-3-4_total_fee进行min ,max ,std ,mean等操作;最后发现四个月话费的最小值是比较强的特征,从EDA来看对套餐区分是比较明显的。

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

  • 本月流量以及上个月流量的差值特征;并且发现某些用户上个月的流量是一个完整的数值,比方说1024,2048,3072这种数值,对这种用户进行了简单的标记。

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

  • 用当月费用减去超出通话时长的钱。1_total_fee - (service1_caller_time)*0.15
  • 计算每个用户的基本费用(base_fee)

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

  • 判断四个月的话费是否是一个整数。比方说套餐36的用户如果账单里面出现了36和36.0的话,那么后者36.0可能是其他base_fee通过开加油包等超出套餐费用叠加上来的。
  • 四个月的费用分别groupby("complaint_fee")进行count。

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

5、搭建模型:

模型: 十折的lightgbm模型 + 五折的xgboost模型

xgboost实在是太慢了,没有GPU加成的话貌似要跑差不多一个白天,但是用上GPU精度就降低了。

6、模型融合: 通过林有夕大神分享的投票代码进行融合,有一点收益但是不大。

7、处理:

  • 我们队伍是失败了,大概思路就是对模型分不开的两个套餐加一个权重。决赛队伍应该都是有分享的。
  • 还有就是植物之前ijcai2018所用过的"食之无味,弃之可惜",惜的是我们也失败了。

最后附上我们队的github链接(记得点个星星哦~)

开源代码地址:2018_CCF_BDCI_ChinaUnicom_Package_Match_Rank6

这个比赛第一名,第二名,第四名貌似都有开源,还有砍手豪大佬对植物嫁接的进一步深入在知乎上都有文章,可以进行参考。

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
4年前
Java面向对象之多态(来源于身边的案例)
2019年1月3日 星期四Java面向对象之多态(来源于身边的案例)1\.为什么要用多态?1.1 多态是面向对象的三大特性之一1.2 多态是基于接口设计的模型1.3 多态具有横向扩展特性1.4 可以非常标准匹配“依赖倒置原则”,降低前端与后端间的耦合2.不一样的多态案例2.1 UML静态模型图!
天翼云4.0首亮相!
11月11日,以“云网融合数智相生”为主题的2021天翼智能生态博览会在广州顺利开幕。作为全球三大顶级智能(通信)展之一的行业权威展会,天翼智能生态博览会历经十二年发展,如今已成为引领全球智能生态发展的极具风向标意义的国际化平台,是中国电信一张重要的行业名片。在同期举办的天翼智能生态高峰论坛现场,中国电信集团有限公司党组副书记邵广禄发布了天翼云4.0分布式
数据堂 数据堂
2年前
车企提“智”升级,车载语音识别技术成就语音交互新体验
近年来,随着人工智能和语音技术的不断发展,汽车行业加速变革,自动驾驶、智能网联、语音控制等全新体验,日益成为消费者选购高端智能电动汽车的核心出发点。为了顺应消费需求多元化趋势,为了提供更加智能、便捷、个性化的用户体验,车企提“智”升级,对车载语音交互系统的
构建强大算力基础,奠定AI时代基石!
7月6日,2023世界人工智能大会在上海拉开序幕。由中国电信主办的“算网一体融创未来”主题论坛也于当日在上海世博中心举行。上海市经济和信息化委员会副主任戎之勤、上海市金山区人民政府副区长葛钧、中国电信数字智能科技分公司副总经理何忠江、中国电信上海公司副总经理胡伟良、天翼云科技有限公司副总经理黄洪波、中国电信数字智能科技分公司副总经理张鑫和超过500位智库专家及企业嘉宾共同出席。会上,中国电信发布了最新研发的行业大模型TeleChat,并与多家人工智能领军企业共同启动中国电信大模型生态合作联盟。
智能边缘云安全专区简介
天翼云智能边缘云安全专区产品为用户提供二级等保、三级等保以及其他自定义安全套餐。整体架构参见下图:
点燃数字引擎,天翼云助力汽车行业云上加速跑!
近日,由中国电信主办的汽车行业数字化转型大会,以及中国电信和中汽中心联合主办的“汽车产业数字化培训班”在海南举行。中国电信领导、众多行业头部客户与生态伙伴出席本次会议,聚焦车路云一体化、智能网联汽车、汽车SaaS云服务等热点,共谋汽车产业数字化发展。
幂简集成 幂简集成
12个月前
2024年最受欢迎的医疗服务API接口
随着医疗健康行业的快速发展,医疗服务API已成为连接患者、医生、医疗机构和药企的重要桥梁。在数字化转型的浪潮中,API不仅提高了医疗服务的效率和质量,也为患者带来了更加便捷和个性化的医疗体验。从早期的简单查询功能到现在的智能分析和个性化推荐,医疗服务API的技术演进反映了医疗健康行业的创新和进步。随着大数据、人工智能等技术的应用,医疗服务API正变得越来越智能,能够提供更加精准和高效的服务。
国产AI生态新突破!“息壤”+DeepSeek王炸组合来了!
近日,中国电信天翼云自主研发的“息壤”智算平台率先完成国产算力与DeepSeekR1/V3系列大模型的深度适配优化,成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。此次突破标志着国产AI生态建设迈入新阶段,为行业提供了性能卓越、安全可控的智能算力基座。
数字先锋 | 强强联合,天翼云携手中国物流为行业数智转型树立央企新标杆!
作为物流行业的“国家队”,中国物流积极把握人工智能发展方向,与中国电信等合作伙伴共同研发、上线2780亿参数“流云”大模型,有力推动了物流行业数智化升级与“人工智能”生态发展,为降低全社会物流成本提供了强有力的技术支撑。
算法云阙使
算法云阙使
Lv1
还君明珠双泪垂,恨不相逢未嫁时。
文章
3
粉丝
0
获赞
0