Member-only story
我的新书上市了
不好意思,让你久等了。快来一起享受用 Python 分析数据的乐趣吧
看到这本书终于印刷了出来,我非常开心。
这本书的内容,来源于我从 2017 年夏天开始,在网络上写的一系列数据科学教程。
写这些教程的时候,我没想过出书的事,只是打算把一个个基础的数据分析功能,给学生们讲明白。很多人觉得我的文章对象感强烈。那是因为我要面对的读者,一开始真的就是我课堂上的学生。
说来也有些尴尬,「第四范式」已经喊出来许多年,许多学生整天念叨起「大数据」,也是头头是道。但是作为情报专业的研究生或者信管高年级本科生,真让他们分析数据,往往双手一摊,告诉我:
老师,数据分析得编程啊。太难,我学不会。
没办法,我首先要讲解给他们的,并不是具体的编程操作和分析流程,而是让他们扭转观念:
看,写这几行代码,你就能把一个复杂的词云做出来。
一旦发现了这种「低投入」与「高产出」的强烈反差,他们的兴趣立即被激发起来。原本的行动障碍,也会被消弭于无形。
词云那个教程,我当初是在课堂上当场编程演示的。学生们都跟着学(玩)得特高兴。我觉得这种喜悦和希望应该分享给更多人,于是就有了数据科学教程的第一篇。
几年下来,日积月累,数据科学的教程,我写了好几十篇。其间 2018–2019 年,我去了美国访学,依然没有间断教程的输出。教程的内容,是越来越深入的。从一开始的描述性统计分析与可视化,简单的文本处理与情感分析,一直到深度神经网络,甚至是 Transformers 预训练模型。