Python 字典是功能强大且用途广泛的数据结构,允许存储键值对。它们在 Python 编程中无处不在,用于从简单数据存储到复杂算法实现的所有内容。但是,字典的一个限制是它们不维护其元素的任何特定顺序。当需要按特定顺序处理字典项目时,这可能会有问题,尤其是基于它们的值。

Python 中的字典是键值对的无序集合。它的定义是用大括号 {} 括起来以逗号分隔的键值对列表。下面是一个简单的示例:

# Creating a simple dictionarystudent = {    "name": "Alice",    "age": 22,    "major": "Computer Science",    "gpa": 3.8}# Accessing valuesprint(student["name"])  # Output: Aliceprint(student.get("age"))  # Output: 22# Adding a new key-value pair (if it exists it will modify it else create it)student["graduation_year"] = 2024# Modifying an existing valuestudent["gpa"] = 3.9# Removing a key-value pairdel student["major"]


通常,键必须是唯一且不可变的(字符串、数字或元组),但通过使用库,可以修改它。值可以是任何类型,并且可以复制。字典是可变的,允许动态修改。从 Python 3.7+ 开始,字典保持插入顺序,但出于向后兼容性,它们仍被视为无序。


# A dictionary of student scoresscores = {    "Alice": 92,    "Bob": 85,    "Charlie": 78,    "David": 95,    "Eve": 88}# Trying to find the top scorerprint(max(scores))  # Output: Eve

在这个例子中,我们不能直接确定得分最高的球员,因为 max() 默认对键进行操作。这就是按值排序变得至关重要的地方。


虽然 Python 中的字典因其快速的查找时间和灵活的键值结构而非常有用,但在许多情况下,我们需要根据其值按特定顺序处理字典项。以下是一些常见的用例:

排名和排行榜 在涉及分数、评级或与实体关联的任何数值的应用程序中,排序变得至关重要。例如,为游戏创建排行榜或根据学生的成绩对学生进行排名。数据分析和可视化 在处理数据时,通常需要对结果进行排序以进行有意义的分析,或者创建可视化效果,例如条形图,其中数据需要按特定顺序排列。优先级队列 在需要根据优先级(由字典值表示)处理任务或项目时,排序可确保首先处理高优先级的项目。频率分析 在对出现的项目进行计数时(其中键是项目,值是计数),按值排序有助于识别最常见或最不常见的元素。资源分配 在需要根据特定指标(存储为字典值)分配资源的情况下,排序有助于实现高效分配。


# Word frequency countertext = "The quick brown fox jumps over the lazy dog"word_freq = {}# Count word frequenciesfor word in text.lower().split():    # If 'word' is already in the dictionary, increment its count by 1    # Otherwise, create a new entry with 'word' as the key and set the count to 1    word_freq[word] = word_freq.get(word, 0) + 1print("Unsorted dictionary:")print(word_freq)# Attempt to find most common wordsprint("\nMost common words (incorrect method):")print(list(word_freq.items())[:3])  # This doesn't give us the most common words# Output:# Unsorted dictionary:# {'the': 2, 'quick': 1, 'brown': 1, 'fox': 1, 'jumps': 1, 'over': 1, 'lazy': 1, 'dog': 1}## Most common words (incorrect method):# [('the', 2), ('quick', 1), ('brown', 1)]




在 Python 中按字典的值对字典进行排序的最直接方法涉及使用 sorted() 函数和自定义函数。以下是我们是如何做到的:

# Our example dictionary of word frequenciesword_freq = {    'the': 2, 'quick': 1, 'brown': 1, 'fox': 1,     'jumps': 1, 'over': 1, 'lazy': 1, 'dog': 1}# Sorting the dictionary by valuesorted_word_freq = sorted(word_freq.items(), key=lambda x: x[1], reverse=True)print("Sorted word frequencies:")for word, freq in sorted_word_freq:    print(f"{word}: {freq}")# Output:# Sorted word frequencies:# the: 2# quick: 1# brown: 1# fox: 1# jumps: 1# over: 1# lazy: 1# dog: 1

word_freq.items():这将返回字典的键值对作为元组的视图。sorted():此函数返回一个新的元素排序列表。key=lambda x: x[1]:这是一个键函数,它告诉 sorted() 使用每个元组的第二个元素(值)进行比较。lambda 函数创建一个匿名函数,该函数接受项目 x 并返回 x[1](值)。reverse=True:此参数按降序对项目进行排序。将其删除或将其设置为 False 以表示升序。


# Converting the sorted list back to a dictionarysorted_dict = dict(sorted_word_freq)print("\nSorted dictionary:")print(sorted_dict)# Output:# Sorted dictionary:# {'the': 2, 'quick': 1, 'brown': 1, 'fox': 1, 'jumps': 1, 'over': 1, 'lazy': 1, 'dog': 1}

请注意,在 Python 3.7+ 中,这个新字典在迭代时将保持排序顺序,但从技术上讲,它仍然不是“排序字典”的数据结构。


def sort_dict_by_value(d, reverse=True):    return dict(sorted(d.items(), key=lambda x: x[1], reverse=reverse))# Using the functionsorted_word_freq = sort_dict_by_value(word_freq)print("\nSorted using function:")print(sorted_word_freq)# Output:# Sorted using function:# {'the': 2, 'quick': 1, 'brown': 1, 'fox': 1, 'jumps': 1, 'over': 1, 'lazy': 1, 'dog': 1}

这种基本方法用途广泛,适用于大多数方案。但是,它会创建一个新的字典,这对于非常大的数据集或内存是一个问题时可能并不理想。在这种情况下,可能需要考虑更节省内存的方法,或使用专门的数据结构(如 heapq)进行部分排序。


虽然我们在基本方法中简要提到了反向排序,但让我们更深入地研究这个概念并探索一些细微差别。当希望将项目从最高值到最低值(降序)或从最低到最高(升序)排列时,反向排序非常有用。在 Python 中,可以通过修改排序函数轻松实现这一点。


inventory = {    "apple": 0.50,    "banana": 0.75,    "orange": 0.80,    "pear": 0.90,    "grape": 2.50}# Function to sort dictionary by value with flexible orderingdef sort_dict_by_value(d, reverse=True):    return dict(sorted(d.items(), key=lambda x: x[1], reverse=reverse))# Sorting in descending order (most expensive to least expensive)desc_sorted = sort_dict_by_value(inventory, reverse=True)print("Products sorted from most expensive to least expensive:")for product, price in desc_sorted.items():    print(f"{product}: ${price:.2f}")print("\n")# Sorting in ascending order (least expensive to most expensive)asc_sorted = sort_dict_by_value(inventory, reverse=False)print("Products sorted from least expensive to most expensive:")for product, price in asc_sorted.items():    print(f"{product}: ${price:.2f}")# Output:# Products sorted from most expensive to least expensive:# grape: $2.50# pear: $0.90# orange: $0.80# banana: $0.75# apple: $0.50## Products sorted from least expensive to most expensive:# apple: $0.50# banana: $0.75# orange: $0.80# pear: $0.90# grape: $2.50

在此示例中,我们创建了一个灵活的排序函数,该函数可以根据 reverse 参数按升序和降序进行排序。


sorted() 函数中的 reverse 参数确定排序顺序。reverse=True 按降序(从高到低)排序。reverse=False(或省略参数)按升序(从低到高)排序。高级提示:稳定排序

在处理具有相等值的项目的字典时,可能需要考虑稳定排序。稳定的排序可保持值相等的项的相对顺序。Python 的 sorted() 函数保证稳定。这意味着,当两个项目具有相同的值时,将保留其原始顺序。当您根据多个条件进行排序时,这尤其有用。


products = {    "apple": 0.50,    "banana": 0.75,    "orange": 0.75,  # Note: same price as banana    "pear": 0.90,    "grape": 2.50}# First, sort by name (alphabetically)alphabetical = dict(sorted(products.items()))# Then, sort by price (this sort will be stable)price_sorted = dict(sorted(alphabetical.items(), key=lambda x: x[1], reverse=True))print("Products sorted by price (descending) and then by name:")for product, price in price_sorted.items():    print(f"{product}: ${price:.2f}")# Output:# Products sorted by price (descending) and then by name:# grape: $2.50# pear: $0.90# banana: $0.75# orange: $0.75# apple: $0.50





有时,可能需要根据更复杂的条件对字典进行排序,而不仅仅是值本身。Python 的灵活性使我们能够定义用于排序的自定义键函数,能够根据值的特定属性、多个条件甚至外部因素进行排序。



employees = {    "E001": {"name": "Alice", "age": 30, "salary": 50000},    "E002": {"name": "Bob", "age": 25, "salary": 45000},    "E003": {"name": "Charlie", "age": 35, "salary": 60000},    "E004": {"name": "David", "age": 28, "salary": 55000}}# Sorting by salarysorted_by_salary = dict(sorted(employees.items(), key=lambda x: x[1]['salary'], reverse=True))print("Employees sorted by salary (highest to lowest):")for emp_id, details in sorted_by_salary.items():    print(f"{emp_id}: {details['name']} - ${details['salary']}")# Output:# Employees sorted by salary (highest to lowest):# E003: Charlie - $60000# E004: David - $55000# E001: Alice - $50000# E002: Bob - $45000


该代码根据每个员工的工资对员工词典进行排序。它使用 sorted() 函数和由 lambda 函数提供的自定义排序键。lambda 函数从与每个员工 ID 关联的字典值中提取工资值 (x[1]['salary'])。reverse=True 参数确保按降序排序(从最高到最低的工资)。按多个条件排序


# Sorting by age (ascending) and then by salary (descending)sorted_by_age_and_salary = dict(sorted(employees.items(),                                        key=lambda x: (x[1]['age'], -x[1]['salary'])))print("\nEmployees sorted by age (youngest to oldest) and then by salary (highest to lowest):")for emp_id, details in sorted_by_age_and_salary.items():    print(f"{emp_id}: {details['name']} - Age: {details['age']}, Salary: ${details['salary']}")# Output:# Employees sorted by age (youngest to oldest) and then by salary (highest to lowest):# E002: Bob - Age: 25, Salary: $45000# E004: David - Age: 28, Salary: $55000# E001: Alice - Age: 30, Salary: $50000# E003: Charlie - Age: 35, Salary: $60000


该代码首先按年龄(升序)对员工词典进行排序,然后按薪水(降序)排序。它使用 sorted() 函数和由 lambda 函数提供的自定义排序键。lambda 函数为每个员工提取两个值:age (x[1]['age']) 和 salary 的否定 (-x[1]['salary'])。否定可确保工资按降序排序。使用自定义函数进行排序


def custom_sort_key(employee):    # Sort by salary-to-age ratio (higher is better)    return employee[1]['salary'] / employee[1]['age']sorted_by_custom = dict(sorted(employees.items(), key=custom_sort_key, reverse=True))print("\nEmployees sorted by salary-to-age ratio (highest to lowest):")for emp_id, details in sorted_by_custom.items():    ratio = details['salary'] / details['age']    print(f"{emp_id}: {details['name']} - Ratio: {ratio:.2f}")# Output:# Employees sorted by salary-to-age ratio (highest to lowest):# E004: David - Ratio: 1964.29# E003: Charlie - Ratio: 1714.29# E002: Bob - Ratio: 1800.00# E001: Alice - Ratio: 1666.67


该代码定义了一个名为 custom_sort_key 的自定义排序键函数。此功能计算每个员工的工资与年龄之比。该比率是通过将工资(雇员[1]['工资'])除以年龄(雇员[1]['年龄'])得出的。


该代码根据 custom_sort_key 提供的自定义排序键对 employees 字典进行排序。它使用 sorted() 函数和自定义键函数。reverse=True 参数确保按降序排序(最高到最低的比率)。

这些示例演示了 Python 中自定义排序的强大功能和灵活性。通过利用自定义键函数,您可以根据几乎任何条件对词典进行排序,从而可以处理数据处理任务中的复杂排序要求。


