python强大的字典-IT家园

摘要

无论什么编程语言，都有自己一套强大的数据结构，java有自己的容器和集合类，但是python的集合类确强大和灵活多了，不论是存入数据值，还是取数据，都相当的灵活

无论什么编程语言，都有自己一套强大的数据结构，java有自己的容器和集合类，但是python的集合类确强大和灵活多了，不论是存入数据值，还是取数据，都相当的灵活。

字典

映射（mapping），一种可通过名字引用值得数据结构。

字典是python中唯一内建的映射类型。

字典中的值没有特殊的顺序，但都存储在一个特定的键（key）里。键可以是数字、字符串甚至是元组。

字典的使用

某些情况下，字典比列表更加适用，比如：

表征游戏棋盘的状态，每个键都是由坐标值组成的元组；

存储文件修改数，用文件名作为键；

数字电话/地址簿；

假如有一个人名列表如下：

>>>names=['Alice','Beth','Cecil','Dee-Dee','Earl']

如果要创建一个可以存储这些人的电话号码的小型数据库，应该怎么做呢？

一种方法是建立一个新的列表，依次存储这些人的电话号码：

>>>teles=['2341','0102','3158','3291','5551']

建立了这些列表后，可以通过如下方式查找Cecil的电话号码：

>>> teles[names.index('Cecil')]

'3158'

为什么用字符串而不用整数表示电话号码呢？我们来试试如果用整数表示会怎样？

>>>names=['Alice','Beth','Cecil','Dee-Dee','Earl']

>>>teles=[2341,0102,3158,3291,5551]

>>> teles[names.index('Cecil')]

3158

>>> teles[names.index('Beth')]

Beth的电话号码显然不是我们想要的结果。因为以0开头的是八进制数字，返回的结果是十进制数字。

创建和使用字典

字典可以通过以下方式创建：

phonebook={'Alice':'2341','Beth':'9102','Cecil':'3258'}

字典由多个键以及其对应的值构成的对组成（也把键值对成为项）。每个键和它的值之间用冒号隔开，项之间用逗号隔开，而整个字典由一对大括号括起来。

空字典（不包括任何项）由两个大括号组成，像这样：{}。

注意：字典中的键是唯一的，而值并不唯一。

dict函数

可以用dict函数，通过其他映射（比如其他字典）或者（键、值）这样的序列对建立字典。

>>>items=[('name','Gumby'),('age',42)]

>>> d=dict(items)

>>> d

{'age': 42, 'name': 'Gumby'}

>>> d['name']

'Gumby'

dict函数也可以通过关键字参数来创建字典：

>>> d=dict(name='signjing',age=28)

>>> d

{'age': 28, 'name': 'signjing'}

如果不带任何参数，则dict函数返回一个新的空字典。

>>> d=dict()

>>> d

{}

基本字典操作

字典的基本行为在很多方面与序列类似：

len(d)返回d中项（键值对）的数量；

>>>phonebook={'Alice':'2341','Beth':'9102','Cecil':'3258'}

>>> len(phonebook)

d[k]返回关联到键k上的值；

>>> phonebook['Cecil']

'3258'

d[k]=v将值关联到键k上；

>>> phonebook['Cecil']='8888'

>>> phonebook

{'Beth': '9102', 'Alice': '2341', 'Cecil':'8888'}

del d[k]删除键为k的值；

>>> del phonebook['Alice']

>>> phonebook

{'Beth': '9102', 'Cecil': '8888'}

k in d检查d中是否含有键为k的项；

>>> 'signjing' in phonebook

False

>>> 'Beth' in phonebook

True

尽管字典和列表有很多特性相同，但也有下面一些重要的区别：

键类型：字典的键不一定为整数数据，也可能是其他不可变类型。

自动添加：即使那个键起初在字典中不存在，也可以为它分配一个值，这样字典就会自动建立该项。而不能将值关联到列表范围之外的索引上。

成员资格：表达式k in d（字典）查找的是键，而不是值。表达式v in l（列表）则用来查找值，而不是索引。（在字典中检查键的成员资格比在列表中检查值的成员资格更高效，数据结构的规模越大，两者的效率差距越明显。）

第一点：键可以为任何不可变类型——是字典最强大的地方。

第二点，也很重要：那个键起初在字典中不存在，也可以为它分配一个值，这样字典就会自动建立该项。

>>> x=[]

>>> x[4]=5

Traceback (most recent call last):

File "<pyshell#30>", line 1, in <module>

x[4]=5

IndexError: list assignment index out ofrange

>>> x={}

>>> x[42]='fool'

>>> x

{42: 'fool'}

字典的格式化字符串

在每个转换说明符中的%字符后面，可以加上（用圆括号括起来的）键，后面再跟上其他说明元素。

>>>phonebook={'Alice':'2341','Beth':'9102','Cecil':'3258'}

>>> "Cecil's phone number is%(Cecil)s." % phonebook

"Cecil's phone number is 3258."

除了增加的字符串键之外，转换说明符还是像以前一样工作。当以这种方式使用字典的时候，只要所有给出的键都能在字典中找到，就可以获得任意数量的转换说明符。这类字符串格式化在模板系统中非常有用。

字典方法

像其他内建类型一样，字典也有方法。这些方法非常有用，但可能不会像使用列表或者字符串方法那样频繁地使用。

clear

clear方法清除字典中所有的项。这是个原地操作（类似于list.sort），所以无返回值（或者返回None）。

>>> return_value=d.clear()

>>> d

{}

>>> print return_value

None

copy

copy方法返回一个具有相同键-值对的新字典（实现的是浅复制），因为值本身就是相同的，而不是副本）。

>>>x={'Alice':'2341','Beth':'9102','Cecil':'3258'}

>>> y=x.copy()

>>> y

{'Beth': '9102', 'Alice': '2341', 'Cecil':'3258'}

>>> y['Beth']='1111'

>>> y

{'Beth': '1111', 'Alice': '2341', 'Cecil':'3258'}

>>> x

{'Beth': '9102', 'Alice': '2341', 'Cecil':'3258'}

可以看到，当在副本中替换值的时候，原始字典不受影响。但是，如果修改了某个值（原地修改，而不是替换），原始字典也会改变，因为同样的值也存储在原字典中。

>>>x={'Alice':'2341','Beth':'9102','Cecil':'3258'}

>>> y=x

>>> y

{'Beth': '9102', 'Alice': '2341', 'Cecil':'3258'}

>>> y['Beth']='1111'

>>> y

{'Beth': '1111', 'Alice': '2341', 'Cecil':'3258'}

>>> x

{'Beth': '1111', 'Alice': '2341', 'Cecil':'3258'}

避免这个问题的一种方法是使用深复制，复制其包含所有的值。可以使用copy模块的deepcopy函数来完成操作：

>>> from copy import deepcopy

>>> d={}

>>>d['names']=['Alfred','Bertrand']

>>> c=d.copy()

>>> dc=deepcopy(d)

>>> d

{'names': ['Alfred', 'Bertrand']}

>>> dc

{'names': ['Alfred', 'Bertrand']}

>>> c

{'names': ['Alfred', 'Bertrand']}

>>> d['names'].append('Clive')

>>> c

{'names': ['Alfred', 'Bertrand', 'Clive']}

>>> dc

{'names': ['Alfred', 'Bertrand']}

>>> d

{'names': ['Alfred', 'Bertrand', 'Clive']}

fromkeys

fromkeys方法使用给定的键建立新的字典。每个键默认对应的值为None。

>>> {}.fromkeys(['name','age'])

{'age': None, 'name': None}

也可以在所有字典的类型dict上调用方法：

>>> dict.fromkeys(['name','age'])

{'age': None, 'name': None}

如果不想使用None作为默认值，可以自己提供默认值。

>>>dict.fromkeys(['name','age','weight'],'(something)')

{'age': '(something)', 'name':'(something)', 'weight': '(something)'}

get

get方法是一个更宽松的访问字典项的方法。一般来说，项不存在时会出错：

>>> d={}

>>> d['name']='signjing'

>>> print d['name']

signjing

>>> print d['age']

Traceback (most recent call last):

File "<pyshell#81>", line 1, in <module>

print d['age']

KeyError: 'age'

如果使用get方法则不出错（string的find方法也不出错，但返回值是-1）：

>>> print d.get('age')

None

>>> print d.get('name')

signjing

还可以自定义“默认”值，替换None：

>>> print d.get('age','unknown')

unknown

has_key

has_key方法可以检查字典中是否含有给出的键。表达式d.has_key(k)相当于表达式k in d。使用哪个方式很大程度上取决于个人喜好，但有的版本并不支持它。

>>> d={}

>>> d.has_key('age')

False

>>> d['age']=18

>>> d.has_key('age')

True

items和iteritems

items方法将所有的字典项以列表方式返回，这些列表项的每一项都来自于（键，值）。但是项在返回时并没有特殊的顺序。

>>>phonebook={'Alice':'2341','Beth':'9102','Cecil':'3258'}

>>> phonebook.items()

[('Beth', '9102'), ('Alice', '2341'),('Cecil', '3258')]

iteritems方法的作用大致相同，但会返回一个迭代器对象而不是列表：

>>> it=phonebook.iteritems()

>>> it

<dictionary-itemiterator object at0x01232B10>

>>> list(it)

[('Beth', '9102'), ('Alice', '2341'),('Cecil', '3258')]

很多情况下使用iteritems更高效（尤其是想要迭代结果的情况下）。

keys和iterkeys

keys方法将字典中的键以列表形式返回，而iterkeys则返回针对键的迭代器。

pop

pop方法用来获得对应于给定键的值，然后将这个键-值对从字典中移除。

>>> d={'x':1,'y':2}

>>> d.pop('x')

>>> d

{'y': 2}

popitem

popitem方法类似于list.pop，后者弹出列表的最后一个元素，不同的是popitem弹出随机的项（因为字典并没有“最后的元素”或者其他有关顺序的概念。）

>>>phonebook={'Alice':'2341','Beth':'9102','Cecil':'3258'}

>>> phonebook

{'Beth': '9102', 'Alice': '2341', 'Cecil':'3258'}

>>> phonebook.popitem()

('Beth', '9102')

>>> phonebook

{'Alice': '2341', 'Cecil': '3258'}

>>> phonebook.popitem()

('Alice', '2341')

>>> phonebook

{'Cecil': '3258'}

>>> phonebook.popitem()

('Cecil', '3258')

>>> phonebook

{}

尽管popitem和列表的pop方法很类似，但字典中并没有与append等价的方法，因为字典是无序的，类似于append的方法没有任何意义。

setdefault

setdefault方法在某种程度上类似于get方法，也就是能够获得与给定键相关联的值，除此之外，setdefault还能在字典中不含有给定键的情况下设定相应的键值。

>>> d={}

>>> d.setdefault('name','N/A')

'N/A'

>>> d

{'name': 'N/A'}

>>> d['name']='signjing'

>>> d

{'name': 'signjing'}

>>> d.setdefault('name','NULL')

'signjing'

>>> d

{'name': 'signjing'}

>>> d.setdefault('age','NULL')

'NULL'

>>> d

{'age': 'NULL', 'name': 'signjing'}

当键不存在时，setdefault返回默认值并相应地更新字典。

如果键存在，则返回与其对应的值，但不改变字典。默认值是可选的，这点同get一样。如果不设定，则默认使用None。

update

update方法可以利用一个字典项更新另外一个字典：

>>>people1={'name':'A','age':'20','weight':'100'}

>>>people2={'name':'B','length':'175'}

>>> people1

{'length': '175', 'age': '20', 'name': 'B','weight': '100'}

>>> people2

{'length': '175', 'name': 'B'}

>>> people1={'name':'A','age':'20','weight':'100'}

>>>people2={'name':'B','length':'175'}

>>> people2.update(people1)

>>> people1

{'age': '20', 'name': 'A', 'weight': '100'}

>>> people2

{'age': '20', 'length': '175', 'name': 'A','weight': '100'}

values和itervalues

values方法以列表的形式返回字典中的值（itervalues返回值的迭代器）。与返回键的列表不同的是，返回值的列表中可以包含重复的元素（因为字典的值是可以相同的）：

>>> d={}

>>> d[1]=1

>>> d[2]=2

>>> d[3]=1

>>> d

{1: 1, 2: 2, 3: 1}

>>> d.values()

[1, 2, 1]

网友最新评论 (0)