Skip to content

Latest commit

 

History

History
113 lines (90 loc) · 3.59 KB

File metadata and controls

113 lines (90 loc) · 3.59 KB

1 列表生成式和生成器

from numpy import random
a = random.random(10000)

lst = []
for i in a:
    lst.append(i * i)  # 不推荐做法

lst = [i * i for i in a]  # 使用列表生成式

gen = (i * i for i in a)  # 生成器更节省内存

2 字典推导式创建子集

a = {'apple': 5.6, 'orange': 4.7, 'banana': 2.8}
da = {key: value for key, value in a.items() if value > 4.0}
print(da)  # {'apple': 5.6, 'orange': 4.7}

3 使用itemgetter多字段排序

from operator import itemgetter
a = [{'date': '2019-12-15', 'weather': 'cloud'},
     {'date': '2019-12-13', 'weather': 'sunny'},
     {'date': '2019-12-14', 'weather': 'cloud'}]

a.sort(key=itemgetter('weather', 'date'))
print(a)
# [{'date': '2019-12-14', 'weather': 'cloud'}, {'date': '2019-12-15', 'weather': 'cloud'}, {'date': '2019-12-13', 'weather': 'sunny'}]

4 使用itemgetter分组

from operator import itemgetter
from itertools import groupby
a.sort(key=itemgetter('weather', 'date'))  # 必须先排序再分组
for k, items in groupby(a, key=itemgetter('weather')):
    print(k)
    for i in items:
        print(i)

5 sum类聚合函数与生成器

Python中的聚合类函数sum,min,max第一个参数是iterable类型,一般使用方法如下:

a = [4,2,5,1]
sum([i+1 for i in a]) # 16

使用列表生成式[i+1 for i in a]创建一个长度与a一样的临时列表,这步完成后,再做sum聚合。

试想如果你的数组a长度是百万级,再创建一个这样的临时列表就很不划算,最好是一边算一边聚合,稍改动为如下:

a = [4,2,5,1]
sum(i+1 for i in a) # 16

此时i+1 for i in a(i+1 for i in a)的简写,得到一个生成器(generator)对象,如下所示:

In [8]:(i+1 for i in a)
OUT [8]:<generator object <genexpr> at 0x000002AC7FFA8CF0>

生成器每迭代一步吐出(yield)一个元素并计算和聚合后,进入下一次迭代,直到终点。

6 ChainMap逻辑上合并多个字典

dic1 = {'x': 1, 'y': 2 }
dic2 = {'y': 3, 'z': 4 }
merged = {**dic1, **dic2} # {'x': 1, 'y': 3, 'z': 4}

修改merged['x']=10,dic1中的x不变

ChainMap 只在逻辑上合并,在内部创建了一个容纳这些字典的列表。

from collections import ChainMap
merged = ChainMap(dic1,dic2)
print(merged)
# ChainMap({'x': 1, 'y': 2}, {'y': 3, 'z': 4})

使用ChainMap合并字典,修改merged['x']=10,dic1中的x改变

7 namedtuple让代码更易维护

from collections import namedtuple

# 一般写法
lst = [(1.5, 2, 3.0), (-0.3, -1.0, 2.1), (1.3, 2.8, -2.5)]
print(lst[0][1] - lst[1][1])

# namedtuple
Point = namedtuple('Point', ['x', 'y', 'z'])  # 定义名字为Point的元祖,字段属性有x,y,z
lst = [Point(1.5, 2, 3.0), Point(-0.3, -1.0, 2.1), Point(1.3, 2.8, -2.5)]
print(lst[0].y - lst[1].y)


# 命名的元祖,写出来的代码相比第一种写法可读性更好,当属性变多时,我们甚至很难按照index方式访问元素。

# 更重要的是,当需要增加或删除一个维度时,命名元祖代码改动量比第一种要小。

# 如在属性x和y间增加一个维度k时:
Point = namedtuple('Point', ['x', 'k', 'y',  'z'])
lst = [Point(1.5, 2, 0.0, 3.0), Point(-0.3, -1.0, 0.0, 2.1),
       Point(1.3, 2.8, 0.0, -2.5)]

# 命名元祖不需要重写下面代码,
print(lst[0].y - lst[1].y)

# 但是普通元祖就得如下修改:
print(lst[0][2] - lst[1][2])