Member-only story
如何不编程用 ChatGPT 爬取网站数据?
敢于大胆设想,才能在 AI 时代提出好问题。
9 min readApr 2, 2024
需求
很多小伙伴,都需要为研究获取数据。从网上爬取数据,是其中关键一环。以往,这都需要编程来实现。
可最近,一位星友在知识星球提问:
这里涉及到一些个人隐私,我就打了码。他的意思很清楚:
第一,他不想编程;
第二,他要获取数据。
在以前,这基本上算是空想。但现在可就不一样了。我觉得敢于设想,是很必要的。这是个好问题。
我之前在知识星球里就为你写过一篇相关的文章,叫做《如何用 ChatGPT 的 Advanced Data Analysis 帮你采集数据》。
ChatGPT 的 Advanced Data Analysis 模式(也叫做 Code Interpreter)可以自动编程并执行程序,曾经是数据分析的不二之选。好在现在我们有了更多选择。那篇文章对应的是一个活动网站的爬取(见下图),感兴趣的朋友 可以去看看。
只不过,当时这篇文章里,咱们处理的方式,还少不了跟技术打交道。例如你需要获取一些文本的路径信息。
时隔数月,我在想,现在是不是有更简单直接的方法来处理数据呢?
工具
我就到 OpenAI 的 GPTs Store 查看一番。