Python教程：将字典列表按键分组转换为NumPy数组

新闻中心 NEWS CENTER

您当前位置：首页 > 新闻中心 > 网络学院

Python教程：将字典列表按键分组转换为NumPy数组

2025-11-12

浏览次数：次

返回列表

Python教程：将字典列表按键分组转换为NumPy数组

本教程详细介绍了如何将包含单个键值对的字典列表，根据其键进行分组，并最终转换为一个以键为索引、值为对应numpy数组的字典。通过逐步构建中间数据结构，实现高效的数据聚合与转换，特别适用于需要对同类数据进行批量数值处理的场景。

在数据处理和科学计算中，我们经常会遇到需要将特定格式的原始数据转换为更便于分析和计算的结构。一个常见的场景是将一个由多个字典组成的列表，根据字典中的键进行分组，并将每个键对应的所有值聚合到一个NumPy数组中。本文将详细讲解如何通过Python实现这一转换过程。

1. 问题描述与目标

假设我们有一个包含多个字典的列表，每个字典通常只包含一个键值对。我们的目标是根据这些字典的键，将所有相同键的值收集起来，并最终生成一个字典，其中键是原始数据的键，值是包含所有对应值的NumPy数组。

输入数据示例：

data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]

期望输出格式：

"Cool": [128, 51] (转换为np.array)
"Hot": [75, 62] (转换为np.array)
"Archive": [144, 12] (转换为np.array)

最终会得到一个类似 {'Cool': np.array([128, 51]), 'Hot': np.array([75, 62]), 'Archive': np.array([144, 12])} 的字典。

2. 实现步骤与代码示例

我们将分两个主要步骤完成这个转换：首先按键对值进行分组，然后将分组后的列表转换为NumPy数组。

2.1 导入必要的库

首先，我们需要导入NumPy库，因为它提供了高效的数组操作功能。

import numpy as np

2.2 准备原始数据

将我们的示例数据定义为一个Python列表：

data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]

2.3 按键分组数据

这一步的目标是创建一个中间字典，它的键是原始数据中的键（例如 'Cool', 'Hot'），而值是包含所有对应数值的Python列表。

我们通过遍历原始 data 列表中的每个字典来完成分组。对于每个字典，我们提取其键和值。如果这个键已经在我们的 grouped_data 字典中，我们就将当前值添加到对应的列表中；如果键是第一次出现，我们就为它创建一个新的列表。

grouped_data = {}

for item in data:
    for key, value in item.items(): # 遍历每个字典中的键值对
        if key in grouped_data:
            grouped_data[key].append(value) # 如果键已存在，添加值到列表中
        else:
            grouped_data[key] = [value]    # 如果键不存在，创建一个新列表

执行完此步骤后，grouped_data 将会是 {'Cool': [128, 51], 'Hot': [75, 62], 'Archive': [144, 12]}。

千鹿Pr助手

智能Pr插件，融入众多AI功能和海量素材

128 查看详情千鹿Pr助手

2.4 转换为NumPy数组

现在，grouped_data 字典中的每个值都是一个Python列表。我们需要遍历这个字典，将每个列表转换为NumPy数组。

for key in grouped_data:
    grouped_data[key] = np.array(grouped_data[key])

这一步会原地修改 grouped_data 字典的值，将它们从列表类型变为NumPy数组类型。

2.5 完整代码示例

将上述步骤整合，形成一个完整的可运行脚本：

import numpy as np

# 原始数据
data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]

# 步骤1: 按键分组值
# 初始化一个空字典用于存储分组后的数据
grouped_data = {}
for item in data:
    # 假设每个字典只包含一个键值对
    for key, value in item.items():
        if key in grouped_data:
            grouped_data[key].append(value)
        else:
            grouped_data[key] = [value]

# 步骤2: 将分组后的列表转换为NumPy数组
for key in grouped_data:
    grouped_data[key] = np.array(grouped_data[key])

# 打印结果验证
print("转换后的数据结构：")
for key, value in grouped_data.items():
    print(f'"{key}": {value}')
    print(f'  数据类型: {type(value)}')
    print(f'  元素类型: {value.dtype}')

输出结果：

转换后的数据结构：
"Cool": [128  51]
  数据类型: <class 'numpy.ndarray'>
  元素类型: int32
"Hot": [75 62]
  数据类型: <class 'numpy.ndarray'>
  元素类型: int32
"Archive": [144  12]
  数据类型: <class 'numpy.ndarray'>
  元素类型: int32

3. 优化与注意事项

3.1 使用 collections.defaultdict 简化分组逻辑

Python的 collections 模块提供了 defaultdict，它可以大大简化分组逻辑，避免了每次检查键是否存在。

from collections import defaultdict
import numpy as np

data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]

# 使用 defaultdict(list) 自动处理键不存在的情况
grouped_data_optimized = defaultdict(list)

for item in data:
    for key, value in item.items():
        grouped_data_optimized[key].append(value)

# 转换为NumPy数组
for key in grouped_data_optimized:
    grouped_data_optimized[key] = np.array(grouped_data_optimized[key])

print("\n使用 defaultdict 优化后的结果：")
for key, value in grouped_data_optimized.items():
    print(f'"{key}": {value}')

这种方法更加简洁高效，推荐在实际开发中使用。

3.2 假设条件

本教程的解决方案建立在一个核心假设之上：输入列表中的每个字典都只包含一个键值对。如果字典可能包含多个键值对，那么在 for key, value in item.items(): 循环中，所有键值对都会被处理，这可能不是期望的行为。在这种情况下，你需要根据具体需求修改提取键和值的逻辑。

3.3 数据类型一致性

NumPy数组的优势之一是其同构性，即所有元素都具有相同的数据类型。在将列表转换为NumPy数组时，NumPy会自动推断最佳数据类型。如果原始值的数据类型不一致（例如，同时包含整数和浮点数），NumPy会向上转型以容纳所有数据（例如，所有整数都会转换为浮点数）。请确保你的原始数据值是数值类型，以便顺利转换为NumPy数组。

4. 总结

通过上述步骤，我们成功地将一个包含单个键值对的字典列表，转换为了一个以键为索引、值为NumPy数组的字典。这种数据转换在数据清洗、特征工程以及需要对同类数据进行批量数值运算的场景中非常实用。使用 collections.defaultdict 可以进一步简化代码，提高可读性和效率。掌握这种转换技巧，将有助于你更高效地处理和分析结构化数据。

以上就是Python教程：将字典列表按键分组转换为NumPy数组的详细内容，更多请关注其它相关文章！

# 不存在 # 喜子seo # seo攻防战视频 # 网络营销推广10个技能 # seo全省项目 # 界首网站建设推广 # 营销推广ppt模板免费下载网站 # 福建效果好的seo优化 # 济南网站推广员培训班 # 辽源企业seo技巧有哪些 # 泰和县网站建设设计 # 显存 # python # 列表中 # 创建一个 # 遍历 # 多个 # 原始数据 # 数据结构 # 键值 # 转换为 # 键值对 # 数据清洗 # app

相关栏目：【科技资讯46185 】【网络学院92790 】

上一篇：Go语言切片陷阱：深入理解append操作与底层数组共享机制

下一篇：Pandas中高效实现组内时间窗口事件检测

首页

关于我们

产品展示

咨询研究

新闻中心

留言板

联系我们

新闻中心 NEWS CENTER

Python教程：将字典列表按键分组转换为NumPy数组

1. 问题描述与目标

2. 实现步骤与代码示例

2.1 导入必要的库

2.2 准备原始数据

2.3 按键分组数据

2.4 转换为NumPy数组

2.5 完整代码示例

3. 优化与注意事项

3.1 使用 collections.defaultdict 简化分组逻辑

3.2 假设条件

3.3 数据类型一致性

4. 总结