新闻中心

将DataFrame中的数组元素转换为新的行

2025-11-02
浏览次数:
返回列表

将dataframe中的数组元素转换为新的行

本文介绍了如何将DataFrame中包含数组的列,通过提取数组元素的组合,转换为新的行。通过使用itertools.combinations生成元素对,并结合Pandas的explode和join操作,实现数据的重塑,最终将数组元素展开为新的列。

在数据处理中,经常会遇到DataFrame的某一列包含列表或数组的情况。有时,我们需要将这些数组中的元素展开,并将它们与其他列的数据进行组合,生成新的行。本教程将演示如何使用Python的pandas和itertools库来实现这一目标。

示例数据

首先,我们创建一个示例DataFrame,其中包含Group、A_x、A_y以及包含列表的B_m和B_n列。

import pandas as pd
from itertools import combinations

df = pd.DataFrame(
    data=[
        [0, 4, 9, [8, 7, 3], [-10, 5, 2]],
        [0, 1, 2, [8, 7, 3], [-10, 5, 2]],
        [1, 3, 3, [1, 2], [-5, 1]],
    ],
    columns=['Group', 'A_x', 'A_y', 'B_m', 'B_n'],
)
print(df)

输出:

   Group  A_x  A_y        B_m          B_n
0      0    4    9  [8, 7, 3]  [-10, 5, 2]
1      0    1    2  [8, 7, 3]  [-10, 5, 2]
2      1    3    3     [1, 2]      [-5, 1]

我们的目标是将B_m和B_n列中的列表元素两两组合,并生成新的列B_m1、B_n1、B_m2和B_n2,每个新行包含一个组合。

实现方法

以下是实现此目标的函数:

电子手机配件网站源码1.0 电子手机配件网站源码1.0

电子手机配件网站源码是一个响应式的织梦网站模板,软件兼容主流浏览器,且可以在PC端和手机端中进行浏览。模板包含安装说明,并包含测试数据。本模板基于DEDECms 5.7 UTF-8设计,需要GBK版本的请自己转换。模板安装方法:1、下载最新的织梦dedecms5.7 UTF-8版本。2、解压下载的织梦安装包,得到docs和uploads两个文件夹,请将uploads里面的所有文件和文件夹上传到你的

电子手机配件网站源码1.0 12 查看详情 电子手机配件网站源码1.0
def make_pairs(df: pd.DataFrame, col: str) -> pd.DataFrame:
    """
    将DataFrame中指定列的列表元素两两组合,生成新的DataFrame。

    Args:
        df: 输入DataFrame。
        col: 要处理的列名。

    Returns:
        包含组合元素的DataFrame。
    """
    pairs = (
        df[col]
        # Create 2-pair combinations of each list in the series 
        .apply(lambda x: [*combinations(iterable=x, r=2)])
        # Explode into a series of 2-item lists
        .explode()
    )
    # Construct a dataframe of the using the original index for joining
    return pd.DataFrame(
        data=pairs.to_list(),
        index=pairs.index,
        columns=[f"{col}{i}" for i in range(1, 3)]
    )

该函数首先使用itertools.combinations生成指定列中每个列表的元素对组合。然后,使用explode方法将这些组合展开为单独的行。最后,创建一个新的DataFrame,其中包含这些组合元素,并使用原始DataFrame的索引进行连接。

应用函数并生成结果

现在,我们可以应用该函数来处理B_m和B_n列,并将结果连接回原始DataFrame。

out = (
    df.join(
        other=[
            make_pairs(df=df, col="B_m"),
            make_pairs(df=df, col="B_n"),
        ],
    )
    # Drop the unneeded columns.
    .drop(columns=["B_m", "B_n"])
)
print(out)

输出:

   Group  A_x  A_y  B_m1  B_m2  B_n1  B_n2
0      0    4    9     8     7   -10     5
0      0    4    9     8     7   -10     2
0      0    4    9     8     7     5     2
0      0    4    9     8     3   -10     5
0      0    4    9     8     3   -10     2
0      0    4    9     8     3     5     2
0      0    4    9     7     3   -10     5
0      0    4    9     7     3   -10     2
0      0    4    9     7     3     5     2
1      0    1    2     8     7   -10     5
1      0    1    2     8     7   -10     2
1      0    1    2     8     7     5     2
1      0    1    2     8     3   -10     5
1      0    1    2     8     3   -10     2
1      0    1    2     8     3     5     2
1      0    1    2     7     3   -10     5
1      0    1    2     7     3   -10     2
1      0    1    2     7     3     5     2
2      1    3    3     1     2    -5     1

总结

本教程展示了如何使用itertools.combinations和Pandas的explode和join操作,将DataFrame中包含数组的列展开为新的行,并将数组元素两两组合。这种方法在数据处理和分析中非常有用,可以帮助我们更好地理解和利用数据。

以上就是将DataFrame中的数组元素转换为新的行的详细内容,更多请关注其它相关文章!


# 中非  # 有趣代餐网站推广  # 营销推广表情包怎么做的  # 杭州求推荐英文网站推广  # 旅游攻略营销推广方案模板  # 英语听力网站建设素材  # 团购网seo  # 东营关键词排名哪家强  # 福保中文网站推广  # 济南网站建设框架设计  # 包装网站优化咨询  # 如何实现  # python  # 创建一个  # 如何使用  # 解决方法  # 重写  # 自定义  # 数据处理  # 并将  # 转换为  # ai  # app 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: J*a里如何实现订单支付与库存同步功能_支付库存同步项目开发方法说明  C#中解析不规范的HTML为XML 常见的坑与解决办法  蛙漫移动版在线看 蛙漫手机浏览器直达入口  虫虫漫画精品漫画官网_虫虫漫画精品漫画官网进入精品漫画  圆通快递查询实时追踪 圆通物流包裹状态快速查看  拼多多视频播放卡顿如何处理 拼多多视频播放优化技巧  HTML空白字符处理机制:渲染、DOM与编码实践  J*a应用集成GitHub CLI与API认证指南  c++如何使用Catch2编写单元测试_c++简洁易用的BDD风格测试框架  C++如何实现线程池_C++11手动实现一个简单的固定大小线程池  一加 14R 快充无反应_一加 14R 充电优化  J*aScript map 迭代中检测空数组元素的有效方法  MongoDB Aggregation:在嵌套对象数组中精确匹配ObjectId  PHP中SSG-WSG API的AES加密实践:正确使用初始化向量  MAC怎么安装Homebrew包管理器_MAC为开发者和高级用户安装命令行工具  C++如何检测键盘输入_C++ _kbhit与_getch函数非阻塞输入  1688商家版怎样分析买家画像精准供货_1688商家版分析买家画像精准供货【供货策略】  多闪网页版在线观看免费入口_多闪官网访问入口  TikTok国际版网页端快速入口 TikTok全球版短视频浏览教程  Lar*el如何正确地在控制器和模型之间分配逻辑_Lar*el代码职责分离与架构建议  极兔快递快件信息查询系统 极兔快递官网运单号追踪  win11如何卸载Windows更新补丁 Win11解决更新导致系统不稳定的问题【修复】  QQ邮箱网页版入口页面 QQ邮箱在线登录入口官网  怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】  使用 Pandas 高效处理 .dat 文件:数据清洗与数值计算实战  mc.js官网登录入口 mc.js官方登录入口最新版  LINUX怎么设置定时任务_LINUX crontab配置教程  ArrayList与LinkedList操作复杂度详解:遍历与修改  蛙漫限时开放最深处链接_蛙漫全站漫画会员同款秒开地址  谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法  Django表单提交验证失败后保持字段值不刷新  消息称三星明年 2 月正式发布 HBM4,与 SK 海力士同台竞技  押井守高度称赞《辐射4》:玩了八年都停不下来!  C++的std::mdspan是什么_C++23中用于操作多维数组的非拥有视图  漫蛙2正版漫画站 漫蛙2网页版快速访问入口  如何在 Windows 11 中启动游戏手柄设置  QQ邮箱官网登录入口 QQ邮箱网页版邮箱快速登录  Angular响应式表单:实现提交后表单及按钮的禁用与只读化  高德地图总提示网络异常怎么办 高德地图离线导航设置与网络排查方法  机构:以往存储涨价周期小米利润率实际上有所改善 能转嫁给消费者等  没有大陆身份证/银行卡如何实名微信? 亲测有效的几种方法分享  C++如何打印当前代码行号与文件名_C++预定义宏FILE与LINE的使用  怎么去除衣服上的口红印_生活小妙招教你用酒精轻松擦除  Excel中VLOOKUP的第四个参数是干什么用的_Excel VLOOKUP第四参数作用解析  AO3最新入口2025公告_AO3中文官网合集  飞书妙记怎样用语音转文字速记_飞书妙记用语音转文字速记【速记方法】  4399体育竞技小游戏_4399小游戏赛事入口  Lar*el的路由模型绑定怎么用_Lar*el Route Model Binding简化控制器逻辑  win11怎么查看应用耗电情况 Win11电池设置查看应用能耗排行榜【优化】  在J*aScript中复现SciPy的B样条拟合与求值:关键考量 

搜索