Member-only story
classification如何用 Python 和决策树预测广告点击行为?(云环境视频教程)
本文用一个完整的样例,给你介绍机器学习决策树分类的全过程。
Photo by Jaelynn Castillo on Unsplash
这周,我给新设立的「大数据管理与应用」专业一年级本科生授课。这是一门 5 名老师共同讲授的数据科学导论课程。我这一部分,讲了机器学习。
为了让同学们更好地理解机器学习的方法步骤,我用了一个分类应用的实际例子,让大家现场分组上机实践。
实践的环境,是百度飞桨 AI Studio 。翟羽佳老师率先使用后,推荐给了大伙儿。对于经典机器学习问题,这个免费云环境够用了,而且能保证所有学生的环境完全一致。这样避免了不同操作系统、不同平台安装软件包时候可能出现的千奇百怪问题,而且和样例对比运行结果,也更加方便。
为了演示操作步骤,避免现场联网可能出现的问题,我提前录制了一系列的视频。事实证明,这是很有必要的。因为当天显示器的连线有问题。好险。
教学效果不错。课后同学们纷纷跑过来跟我问问题,有的甚至都不是这节课上的内容。说明他们学习的兴趣被激发起来了。
既然代码、运行环境和视频教程都齐备,我决定把这次的课程内容,也分享给你,我亲爱的读者。
这个例子,最初来源自 Yuxi (Hayden) Liu 的《Python Machine Learning By Example》第三版。
这书不错,我在 Kindle 上面买了一本。可惜目前还没有见到中文译本。
提到买书,顺便说一句 — — 双十一到了。
我的新书《数亦有道》在京东和拼多多都有不同幅度的优惠。优惠力度嘛,满减加上叠券,居然打到了五折以下。反正我自己是没忍住,又下单买了一批。如果你也想以这个价格买的话,请抓紧吧。
本例中的数据来自于 Kaggle 竞赛平台。主题是广告点击预测。
广告这东西,你应该并不陌生。每天你浏览各种内容的时候,广告都会伴随你。