pandas是python下最有力的数据挖掘和数据分析的工具之一,支持类似于SQL的数据库的增、删、查、改,并且带有丰富的数据处理函数,支持时间序列的分析功能,支持灵活处理缺失数据。pandas基本的数据结构是Series和DataFrame,series就是序列,类似于一维数组,dataframe相当于一张二维的表格,类似于二维数组,它的每一列都相当于一个series,为了定位series中的元素,pandas提供了index对象,每个series都会带有一个对应的index,用来标记不同的元素,index的内容不一定是数字,也可以是字母、中文等,类似于SQL的主键,类似的,dataframe相当于带有多个同样的index的series的组合(本质上是series的容器),每个series都带有唯一的表头,用来标识不同的series。

import pandas as pd s = pd.Series([1, 2, 3], index=['a', 'b', 'c']) d =
pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c']) d2 =
pd.DataFrame(s) d.head() d.describe() print(d) print(d2)
#pd.read_excel('data.xls') #pd.read_csv('data.csv', encoding='utf-8')

技术
©2019-2020 Toolsou All rights reserved,
vue+elementui表格导出为Excel文件JAVA写简单桌面小游戏小游戏45岁的老程序员被拒,是职场错了吗?数据库基础-修改表结构(命令)仿抖音小球刷新进度条(两个小球转动),代码很简单XCTF攻防世界web新手练习_ 9_command_executionjavascript事件(零基础详解)yolov5模型框架详解C语言中数据的存储错误集:redis重启服务出错(Waiting for Redis to shutdown ...)