本文列举了一些提升或加速日常数据分析工作的技巧,包括:
创新互联公司服务项目包括镶黄网站建设、镶黄网站制作、镶黄网页制作以及镶黄网络营销策划等。多年来,我们专注于互联网行业,利用自身积累的技术优势、行业经验、深度合作伙伴关系等,向广大中小型企业、政府机构等提供互联网行业的解决方案,镶黄网站推广取得了明显的社会效益与经济效益。目前,我们服务的客户以成都为中心已经辐射到镶黄省份的部分城市,未来相信会继续扩大服务区域并继续获得客户的支持与信任!
创新互联公司是专业的荔浦网站建设公司,荔浦接单;提供网站设计制作、成都网站设计,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行荔浦网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!
成都创新互联专业为企业提供广陵网站建设、广陵做网站、广陵网站设计、广陵网站制作等企业网站建设、网页设计与制作、广陵企业网站模板建站服务,10多年广陵做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。
创新互联公司主要从事成都做网站、网站建设、网页设计、企业做网站、公司建网站等业务。立足成都服务贵池,十年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:18982081108
创新互联坚持“要么做到,要么别承诺”的工作理念,服务领域包括:网站设计制作、成都做网站、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的确山网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!
专注于为中小企业提供成都网站设计、成都网站制作、外贸网站建设服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业平乐免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了上千家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。
1. Pandas Profiling
该工具效果明显。下图展示了调用 df.profile_report() 这一简单方法的结果:
使用该工具只需安装和导入 Pandas Profiling 包。
本文不再详述这一工具,如欲了解更多,请阅读:
https://towardsdatascience.com/exploring-your-data-with-just-1-line-of-python-4b35ce21a82d
2. 使用 Cufflinks 和 Plotly 绘制 Pandas 数据
「经验丰富的」数据科学家或数据分析师大多对 matplotlib 和 pandas 很熟悉。也就是说,你只需调用 .plot() 方法,即可快速绘制简单的 pd.DataFrame 或 pd.Series:
有点无聊?
这已经很好了,不过是否可以绘制一个交互式、可缩放、可扩展的全景图呢?是时候让 Cufflinks* *出马了!(Cufflinks 基于 Plotly 做了进一步的包装。)
在环境中安装 Cufflinks,只需在终端中运行! pip install cufflinks --upgrade 即可。查看下图:
效果好多了!
注意,上图唯一改变的是 Cufflinks cf.go_offline() 的导入和设置,它将 .plot() 方法变为 .iplot()。
其他方法如 .scatter_matrix() 也可以提供非常棒的可视化结果:
需要做大量数据可视化工作的朋友,可以阅读 Cufflinks 和 Plotly 的文档,发现更多方法。
3. IPython 魔术命令
IPython 的「魔术」是 IPython 基于 Python 标准语法的一系列提升。魔术命令包括两种方法:行魔术命令(line magics):以 % 为前缀,在单个输入行上运行;单元格魔术命令(cell magics):以 %% 为前缀,在多个输入行上运行。下面列举了 IPython 魔术命令提供的一些有用功能:
(1) %lsmagic:找出全部命令
如果你只记得一个魔术命令,那必须得是这一个。执行 %lsmagic 命令将提供所有可用魔术命令的列表:
(2) %debug:交互式 debug
这可能是我最常使用的魔术命令了。
大部分数据科学家都遇到过这种情况:执行的代码块一直 break,你绝望地写了 20 个 print() 语句,想输出每个变量的内容。然后,当你最终修复问题后,你还得返回并再次删除所有 print() 语句。
不过以后再也不用这样了。遇到问题后只需执行 %debug 命令,即可执行想要运行的任意代码部分:
上图中发生了什么?
这对于更复杂的函数非常有用。
(3) %store:在 notebook 之间传递变量
这个命令也很酷。假设你花了一些时间清洗 notebook 中的数据,现在你想在另一个 notebook 中测试一些功能,那么你是在同一个 notebook 中实现该功能,还是保存数据并在另一个 notebook 中加载数据呢?使用%store 命令后,这些操作都不需要!该命令将存储变量,你可以在其他任意 notebook 中检索该变量:
%who:列出所有全局变量。
你是否遇到过,为变量赋值后却忘记变量名的情况?或者不小心删掉了负责为变量赋值的单元格?使用%who 命令,你可以得到所有全局变量的列表:
%%time:计时魔法命令
使用该命令可以获取所有计时信息。只需对任意可执行代码应用%%time 命令,你就可以得到如下输出:
%%writefile:向文件写入单元格内容
在 notebook 中写复杂函数或类,且想将其保存到专属文件中时,该魔法命令非常有用。只需为函数或类的单元格添加 %%writefile 前缀和想要保存到的文件名即可:
如上所示,我们可以将创建的函数保存到 utils.py 文件中,然后就可以随意导入了。在其他 notebook 中也可以这样,只要与 utils.py 文件属于同一个目录即可。
4. Jupyter 中的格式编排
这个工具很酷!Jupyter 考虑到 markdown 中存在 HTML / CSS 格式。以下是我最经常使用的功能:
蓝色、时尚:
- This is fancy!
红色、轻微慌张:
- This is baaaaad!
绿色、平静:
- This is gooood!
下图展示了它们的运行过程:
当你想以 Notebook 格式呈现一些发现时,这非常有用!
5. Jupyter 快捷键
想了解和学习键盘快捷键,你可以使用命令面板:Ctrl + Shift + P,获取 notebook 所有功能的列表。下面选取了几个最基础的命令:
在命令模式内:
在编辑模式内:
选择多个单元格:
注意,选中多个单元格后,你可以批量执行删除/复制/剪切/粘贴/运行操作。
6. 在 Jupyter(或 IPython)中使一个单元同时有多个输出
想展示 pandas DataFrame 的 .head() 和 .tail(),但由于创建运行 .tail() 方法的额外代码单元过于麻烦而不得不中途放弃,你是否有过这样的经历?现在不用怕了,你可以使用以下代码行展示你想展示的输出:
- from IPython.core.interactiveshell import InteractiveShell
- InteractiveShell.ast_node_interactivity = "all"
下图展现了多个输出的结果:
7. 为 Jupyter Notebook 即时创建幻灯片
使用 RISE,你可以仅通过一次按键将 Jupyter Notebook 即时转变为幻灯片。而且 notebook 仍然处于活跃状态,你可以在展示幻灯片的同时执行实时编码!
要想使用该工具,你只需通过 conda 或 pip 安装 RISE 即可。
- conda install -c conda-forge rise
或者
- pip install RISE
现在,你可以点击新按钮,为 notebook 创建不错的幻灯片了:
【本文是专栏机构“机器之心”的原创译文,微信公众号“机器之心( id: almosthuman2014)”】
当前文章:7个Python特殊技巧,助力你的数据分析工作之路
网站路径:http://www.csdahua.cn/qtweb/news49/518049.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网