【ChatGPT系列】ChatGPT+Python,无限可能的应用拓展:以数据处理为例

什么是Python?
Python是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。
 
Python通常应用于各种领域,是一种通用语言,无论是从网站、游戏开发、机器人,人工智能,大数据,云计算或是一些高科技的航天飞机控制都可以用到python语言。
 
实际案例:

有人利用Python在网络上爬取了春节档期间国内电影的票房数据,但是他作为Python的新手并不知道如何通过它实现“把数据处理成第一列是采集时间,后面每一栏都是一部电影,表格的值是每部电影每10分钟的票房增量”这么一个难题,以下是以他为第一视角的实例。

我知道这个东西处理起来很容易,但是我不会;不管是SQL查询还是Python,我都不会;我最擅长的仍然是Excel。

而且任何一本书,都不会告诉你在你遇到这个问题的时候,应该用什么函数、什么方法去解决。

所以我上周用的是最笨的手工办法,先做出数据透视表,然后把数据透视表的数据复制到新的Excel里面,再手工写公式处理。

Excel处理两万多行数据是很煎熬的,而且涉及到多种计算的时候,真的是又卡又慢;而且做的图又不好看,所以我完全没有勇气处理第二遍数据,更没有再次从中发掘问题的兴趣。

然而,在chatGPT的帮助下,我迅速掌握了新的技能。我先是研究了Python的Bar_chart_race库;这个库的官方文档写得有点问题,我之前多次尝试均失败了。

3983480752.png
然后我的下一个问题,是如何读取我的数据源文件,这个非常基础,所以没人教我,同样问AI好了:
4002255307.png

我的数据文件是一个Excel文件,在D盘下,于是我问AI:如何使用pd.read 读取本地D盘下的data.xlsx文件,AI回复后,我才发现是我的反斜杠写错了。

df = pd.read_excel(“D:/data.xlsx”)
pip install openpyxl
pip install xlrd

数据导入之后,就需要对这3万多条数据进行处理。我继续问AI傻问题:

1702695775.png

我:「我希望把数据转换,行为”采集时的时间”,列为不同的”影片名称”」,AI直接给了我答案:

你可以使用 pandas 中的 pivot 函数来实现。具体如下:
df = df.pivot(index=’采集时的时间’, columns=’影片名称’, values=’实时票房’)
然后AI继续教我如何把不想要的数据行删掉,比如《满江红》
478600752.png

再问得深一点,AI仍然是个很好的教练,而且给我换了一种方法:

如果想要删除指定行,可以使用Pandas中的DataFrame.drop方法:
df.drop(df[df[‘影片名称’].isin([‘满江红’, ‘黑豹2’])].index, inplace=True)

大家可以看看我都问了多少基础知识类问题:

  • 我想从 采集时的时间 提取出日期
  • 我想把 采集时的时间 和 最近更新两列 拼接在一起,中间用空格连接
  • 我把Pycharm(开发工具)中的错误代码发给AI
  • 我希望把pandas中的数据导出为excel
  • 我希望删除pandas中的重复数据
  • 把数据从pandas中导出到csv
  • 解释一下正则表达式 {r^\x00-\x7F]+’:”}
  • 把pandas中的一列转化为日期时间格式
  • 把pandas中的第一列,只保留前10个字符
  • 把pandas的df 复制到df2
  • pandas 中的数据是1,534,包括了千分位,如何去掉千分位,显示为1534
  • 上面是一组pandas数据,我希望用bar_chart_race 将他变成bar chart race
  • pandas中有如下实时票房数据,我希望计算每个影片相比上一个时间段之间的增量——Diff()函数
  • pandas中的diff()如何使用
  • pd.read_csv index 怎么使用
  • 如何用pandas中的diff()计算每一行的差值

然后,一切问题迎刃而解,一个截至到2月12日的中国票房竞赛图,在2分钟里完成了,再花1分钟配个音乐,Mission Complete!

 
从个人体验上来看,chatGPT的确是非常优秀的个人助理,他既能让聪明人快速地掌握各行各业的通识,又能让聪明人快速掌握各种加快效率的工具,然后,就可以期待人类大脑的进一步创新了。
ChatGPT专栏:

【图文】【认知】ChatGPT究竟是什么?
【溯源】AI是如何进化成如今的样子?为什么是ChatGPT实现了颠覆?
【影响】ChatGPT如何改变了今天的商业与科技格局?
【ChatGPT系列】AI会怎么占据未来的主导权
【ChatGPT系列】ChatGPT一站式注册以及常见注册问题答疑ChatGPT的付费升级功能介绍与开通方式
【ChatGPT系列】ChatGPT的基础属性与运行原理
【ChatGPT实战】让ChatGPT更聪明:内容前提、身份赋予以及产出目标三要素方法论
【ChatGPT系列】让ChatGPT听懂你的需要:Prompt指令
【ChatGPT系列】ChatGPT的变现逻辑与优势,ChatGPT各行业应用案例
【ChatGPT系列】ChatGPT变现实战案例
【ChatGPT系列】ChatGPT+MidJourney,人人都可以成为绘画大师
RIPRO主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
D3资源 » 【ChatGPT系列】ChatGPT+Python,无限可能的应用拓展:以数据处理为例

提供最优质的资源集合

立即查看 了解详情