新闻中心

将 DataFrame 中的数组元素转换为新的行

2025-11-02
浏览次数:
返回列表

将 dataframe 中的数组元素转换为新的行

本文介绍如何将 DataFrame 中包含数组的列,转换为每个数组元素占据一行的新 DataFrame。通过使用 itertools.combinations 创建元素对,并结合 explode 函数,可以有效地将数组列拆分为多行,从而重塑数据结构,使其更易于分析和使用。

在数据处理中,经常会遇到 DataFrame 的某一列包含列表或数组的情况。有时,我们需要将这些列表中的每个元素拆分到单独的行中,以便进行更细粒度的分析。本文将提供一个解决方案,将 DataFrame 中数组列的元素转换为新的行,并生成元素对,解决类似“将 DataFrame 中数组元素转换为新的行”的问题。

解决方案

以下代码提供了一个通用的函数 make_pairs,用于处理包含列表的列,并将其转换为包含元素对的新列。

from itertools import combinations
import pandas as pd

def make_pairs(df: pd.DataFrame, col: str) -> pd.DataFrame:
    """
    将 DataFrame 中指定列的列表元素转换为元素对,并返回新的 DataFrame。

    Args:
        df: 输入的 DataFrame。
        col: 包含列表的列名。

    Returns:
        包含元素对的新 DataFrame。
    """
    pairs = (
        df[col]
        # 创建每个列表中元素的 2-pair 组合
        .apply(lambda x: [*combinations(iterable=x, r=2)])
        # 将其展开为包含 2 个元素的列表的 Series
        .explode()
    )
    # 使用原始索引构建 DataFrame 以进行连接
    return pd.DataFrame(
        data=pairs.to_list(),
        index=pairs.index,
        columns=[f"{col}{i}" for i in range(1, 3)]
    )

# 示例 DataFrame
df = pd.DataFrame(
    data=[
        [0, 4, 9, [8, 7, 3], [-10, 5, 2]],
        [0, 1, 2, [8, 7, 3], [-10, 5, 2]],
        [1, 3, 3, [1, 2], [-5, 1]],
    ],
    columns=['Group', 'A_x', 'A_y', 'B_m', 'B_n'],
)

# 连接所有内容。
out = (
    df.join(
        other=[
            make_pairs(df=df, col="B_m"),
            make_pairs(df=df, col="B_n"),
        ],
    )
    # 删除不需要的列。
    .drop(columns=["B_m", "B_n"])
)
print(out)

代码解释:

电子手机配件网站源码1.0 电子手机配件网站源码1.0

电子手机配件网站源码是一个响应式的织梦网站模板,软件兼容主流浏览器,且可以在PC端和手机端中进行浏览。模板包含安装说明,并包含测试数据。本模板基于DEDECms 5.7 UTF-8设计,需要GBK版本的请自己转换。模板安装方法:1、下载最新的织梦dedecms5.7 UTF-8版本。2、解压下载的织梦安装包,得到docs和uploads两个文件夹,请将uploads里面的所有文件和文件夹上传到你的

电子手机配件网站源码1.0 12 查看详情 电子手机配件网站源码1.0
  1. make_pairs(df: pd.DataFrame, col: str) -> pd.DataFrame 函数:
    • 该函数接收一个 DataFrame df 和一个列名 col 作为输入。
    • df[col].apply(lambda x: [*combinations(iterable=x, r=2)]):对 col 列的每个列表应用 itertools.combinations 函数,生成所有可能的 2 个元素的组合。[*...] 用于将 combinations 返回的迭代器转换为列表。
    • .explode():将列表中的每个元素对展开为单独的行。
    • pd.DataFrame(...):使用展开后的元素对创建一个新的 DataFrame,其中 index 设置为原始 DataFrame 的索引,columns 设置为 B_m1 和 B_m2 (或 B_n1 和 B_n2)。
  2. 示例代码:
    • 创建了一个示例 DataFrame df,其中 B_m 和 B_n 列包含列表。
    • df.join(...):使用 make_pairs 函数处理 B_m 和 B_n 列,并将结果与原始 DataFrame 连接起来。
    • .drop(columns=["B_m", "B_n"]):删除原始的 B_m 和 B_n 列。

运行结果

运行上述代码将生成以下 DataFrame:

   Group  A_x  A_y  B_m1  B_m2  B_n1  B_n2
0      0    4    9     8     7   -10     5
0      0    4    9     8     7   -10     2
0      0    4    9     8     7     5     2
0      0    4    9     8     3   -10     5
0      0    4    9     8     3   -10     2
0      0    4    9     8     3     5     2
0      0    4    9     7     3   -10     5
0      0    4    9     7     3   -10     2
0      0    4    9     7     3     5     2
1      0    1    2     8     7   -10     5
1      0    1    2     8     7   -10     2
1      0    1    2     8     7     5     2
1      0    1    2     8     3   -10     5
1      0    1    2     8     3   -10     2
1      0    1    2     8     3     5     2
1      0    1    2     7     3   -10     5
1      0    1    2     7     3   -10     2
1      0    1    2     7     3     5     2
2      1    3    3     1     2    -5     1

总结

本文提供了一种将 DataFrame 中包含数组的列转换为新行的方法。通过使用 itertools.combinations 和 explode 函数,我们可以有效地重塑数据,使其更适合分析。这种方法可以应用于各种数据处理场景,例如处理包含标签列表、特征列表或任何需要分解到单独行的数组数据的 DataFrame。

以上就是将 DataFrame 中的数组元素转换为新的行的详细内容,更多请关注其它相关文章!


# 是一个  # 甘肃seo软件  # seo优化怎样进行霸屏  # 东莞网站建设谁家好  # 外贸seo黑帽  # 宁阳网站seo推广  # 六安SEO找工作  # seo重要标签  # 网站推广叫什么名字  # 简述seo的含义  # 吕梁口碑好网站排名优化  # app  # 如何用  # 列表中  # 设置为  # 有效地  # 使其  # 数据处理  # 数据结构  # 自定义  # 转换为  # ai 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: MAC如何将整个网页截长图_MAC使用Safari的导出为PDF或第三方工具  厨房不锈钢水槽发黑生锈怎么处理_水槽用可乐+锡纸2分钟抛亮如新  怎么在mac上运行html代码_mac运行html代码方法【指南】  Win11文件资源管理器卡顿怎么修 Win11重置资源管理器进程优化响应速度【修复方法】  天猫双十一预售商品怎么退款_天猫双十一预售退款操作指南  PDO预处理语句中冒号的正确处理:区分SQL函数格式与命名占位符  mysql如何设置表访问权限_mysql表访问权限配置  vivo浏览器自带的下载器速度慢怎么办 vivo浏览器提升文件下载速度的技巧  电脑屏幕颜色不舒服怎么办_Windows夜间模式与色彩校准教程【护眼技巧】  火狐浏览器占用内存高卡顿怎么办 火狐浏览器性能优化设置技巧  如何在CSS中使用visited与link控制链接颜色_visited link伪类配合  《刺客信条:影》PS5 Pro和Switch 2画面对比  Windows电脑怎么截图最方便_系统自带截图工具的5种神仙用法【技巧】  漫蛙漫画官方主页入口 漫蛙MANWA网页直达访问链接  单12V-2×6实现为RTX 5090供电750W!甚至都没敢跑分  圆通快递查询实时追踪 圆通物流包裹状态快速查看  Golang并发任务中错误如何聚合_Golang goroutine error收集方式  qq游戏网页版直接玩_qq游戏免下载快速入口  LINUX的perf命令入门_LINUX官方性能分析工具的使用与解读  Win11截图该按哪些键 Win11截屏完整流程解析【教程】  Windows 11怎么彻底关闭定位_Windows 11服务中禁用Geolocation  Win10怎么设置静态IP地址 Win10手动配置IP地址步骤【指南】  漫蛙网页登录入口 漫蛙漫画官方授权网址  J*a递归快速排序中静态变量导致数据累积问题的解决方案  163邮箱注册官网 免费申请163个人邮箱  凉拌黄瓜怎么拌更入味 凉拌黄瓜简单家常做法  如何使用CaptainHook和Composer管理Git钩子_在提交前自动运行代码检查的Composer配置  使用Pandas转换并合并DataFrame:多列映射至统一结构  sublime怎么预览Markdown渲染效果_Markdown Preview插件 for sublime教程  Archive of Our Own官网直达 AO3最新可用地址一览  淘宝网网页版登录入口 淘宝官方网页版快捷登录  抖音创作助手登录入口_抖音创作辅助工具官网直达  漫蛙Manwa2官网入口地址分享 漫蛙漫画PC版永久访问通道  192.168.1.1管理中心入口 192.168.1.1路由器网页设置平台  Windows10怎么开启存储感知 Windows10系统设置自动清理临时文件释放C盘空间【教程】  Lar*el如何正确地在控制器和模型之间分配逻辑_Lar*el代码职责分离与架构建议  谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法  J*aScript中安全有效地处理localStorage字符串数据  期待已久:小米17 Ultra、小米首款NAS本月登场  NVIDIA股价11月重挫12%:下月有望好转 但难回5万亿美元巅峰  如何创建独立于主系统的J*a运行环境_隔离式环境搭建策略  Python vgamepad库按键模拟:正确使用XUSB_BUTTON常量  Android Studio计算器C键功能异常排查与修复教程  4399免费游戏网址入口 4399小游戏免费入口点开即玩  如何高效处理PHP中的Excel数据导入导出?PortPHP/Spreadsheet助你轻松搞定!  C++ typeid如何获取类型信息_C++ RTTI运行时类型识别用法  小猿搜题在线学习页面在哪_小猿搜题在线学习中心入口  Win11怎么合并任务栏图标 Win11开启任务栏合并减少图标占空间【方法】  内存检查:在VS Code中调试C++时的内存视图  Pyrogram与g4f集成:异步编程实践与常见错误解决 

搜索