博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据规整
阅读量:4332 次
发布时间:2019-06-06

本文共 2164 字,大约阅读时间需要 7 分钟。

1.丢弃指定轴上的数据

data=pd.DataFrame(np.arange(16).reshape(4,4),index=['Shenzhen','Guangzhou','Beijing','Shanghai'],columns=['one','two','three','four'])data
  one two three four
Shenzhen 0 1 2 3
Guangzhou 4 5 6 7
Beijing 8 9 10 11
Shanghai 12 13 14 15

 

 

 

 

 

data.drop(['Shenzhen','Guangzhou'])
  one two three four
Beijing 8 9 10 11
Shanghai 12 13 14 15

 

 

 

data.drop(['two'],axis=1)

删除第二列

2.函数映射

  Numpy的也可以用于操作pandas对象。

  例如:np.fabs(frame)

  

  DataFrame.apply

    DataFrame.apply(funcaxis=0broadcast=Noneraw=Falsereduce=Noneresult_type=Noneargs=()**kwds)

    Apply a function along an axis of the DataFrame.

  DataFrame.applymap

    DataFrame.applymap(func)

  Series.map

    Series.map(argna_action=None)

    Map values of Series using input correspondence (a dict, Series, or function).

  

def f1(s):    x=s.max()-s.min()    return xf = lambda x : x.max()-x.min()frame.apply(f1)#列方向
one      3.168231two      3.324250three    2.111743dtype: float64
f = lambda x: '%.2f' %xframe.applymap(f)
  one two three
Shenzhen 1.55 -2.59 -1.21
Guangzhou 0.42 -0.16 0.17
Shanghai -1.62 0.73 -0.87
Beijing 0.33 0.00 0.90

 

 

 

 

 

3.排序

  sort_index / sort_value

4.数据合并

  pandas.merge

    DataFrame.merge(righthow='inner'on=Noneleft_on=Noneright_on=Noneleft_index=Falseright_index=Falsesort=Falsesuffixes=  ('_x''_y')copy=Trueindic      ator=Falsevalidate=None)

    Merge DataFrame objects by performing a database-style join operation by columns or indexes.

    类似数据库表连接,左连、右连、内联、外联

    例子:

    

df1 = pd.DataFrame({
'key1':['foo','bar','baz','foo'],'data1':list(np.arange(1,5))})df2 = pd.DataFrame({
'key2':['foo','bar','qux','bar'],'data2':list(np.arange(5,9))})print(df1)print(df2)

  

key1  data10  foo      11  bar      22  baz      33  foo      4  key2  data20  foo      51  bar      62  qux      73  bar      8
df1.merge(df2, left_on='key1', right_on='key2', how='right')#参数how代表连接方式,有'inner'、'left'、‘right’、‘outer’
  key1 data1 key2 data2
0 foo 1.0 foo 5
1 foo 4.0 foo 5
2 bar 2.0 bar 6
3 bar 2.0 bar 8
4 NaN NaN qux 7

  

 

 

 

 

 

  pandas.concat

  pandas.combine_first

5.数据重塑

  DataFrame.stack/unstack

  

  

转载于:https://www.cnblogs.com/yitiaodahe/p/9267813.html

你可能感兴趣的文章
程序员最想得到的十大证件,你最想得到哪个?
查看>>
我的第一篇CBBLOGS博客
查看>>
【MyBean调试笔记】接口的使用和清理
查看>>
07 js自定义函数
查看>>
jQueru中数据交换格式XML和JSON对比
查看>>
form表单序列化后的数据转json对象
查看>>
[PYTHON]一个简单的单元測试框架
查看>>
iOS开发网络篇—XML数据的解析
查看>>
[BZOJ4303]数列
查看>>
一般处理程序在VS2012中打开问题
查看>>
C语言中的++和--
查看>>
thinkphp3.2.3入口文件详解
查看>>
POJ 1141 Brackets Sequence
查看>>
Ubuntu 18.04 root 使用ssh密钥远程登陆
查看>>
Servlet和JSP的异同。
查看>>
虚拟机centOs Linux与Windows之间的文件传输
查看>>
ethereum(以太坊)(二)--合约中属性和行为的访问权限
查看>>
IOS内存管理
查看>>
middle
查看>>
[Bzoj1009][HNOI2008]GT考试(动态规划)
查看>>