新闻中心
将DataFrame中的数组元素转换为新的行

本文介绍了如何将DataFrame中包含数组的列,通过提取数组元素的组合,转换为新的行。通过使用itertools.combinations生成元素对,并结合Pandas的explode和join操作,实现数据的重塑,最终将数组元素展开为新的列。
在数据处理中,经常会遇到DataFrame的某一列包含列表或数组的情况。有时,我们需要将这些数组中的元素展开,并将它们与其他列的数据进行组合,生成新的行。本教程将演示如何使用Python的pandas和itertools库来实现这一目标。
示例数据
首先,我们创建一个示例DataFrame,其中包含Group、A_x、A_y以及包含列表的B_m和B_n列。
import pandas as pd
from itertools import combinations
df = pd.DataFrame(
data=[
[0, 4, 9, [8, 7, 3], [-10, 5, 2]],
[0, 1, 2, [8, 7, 3], [-10, 5, 2]],
[1, 3, 3, [1, 2], [-5, 1]],
],
columns=['Group', 'A_x', 'A_y', 'B_m', 'B_n'],
)
print(df)输出:
Group A_x A_y B_m B_n 0 0 4 9 [8, 7, 3] [-10, 5, 2] 1 0 1 2 [8, 7, 3] [-10, 5, 2] 2 1 3 3 [1, 2] [-5, 1]
我们的目标是将B_m和B_n列中的列表元素两两组合,并生成新的列B_m1、B_n1、B_m2和B_n2,每个新行包含一个组合。
实现方法
以下是实现此目标的函数:
电子手机配件网站源码1.0
电子手机配件网站源码是一个响应式的织梦网站模板,软件兼容主流浏览器,且可以在PC端和手机端中进行浏览。模板包含安装说明,并包含测试数据。本模板基于DEDECms 5.7 UTF-8设计,需要GBK版本的请自己转换。模板安装方法:1、下载最新的织梦dedecms5.7 UTF-8版本。2、解压下载的织梦安装包,得到docs和uploads两个文件夹,请将uploads里面的所有文件和文件夹上传到你的
12
查看详情
def make_pairs(df: pd.DataFrame, col: str) -> pd.DataFrame:
"""
将DataFrame中指定列的列表元素两两组合,生成新的DataFrame。
Args:
df: 输入DataFrame。
col: 要处理的列名。
Returns:
包含组合元素的DataFrame。
"""
pairs = (
df[col]
# Create 2-pair combinations of each list in the series
.apply(lambda x: [*combinations(iterable=x, r=2)])
# Explode into a series of 2-item lists
.explode()
)
# Construct a dataframe of the using the original index for joining
return pd.DataFrame(
data=pairs.to_list(),
index=pairs.index,
columns=[f"{col}{i}" for i in range(1, 3)]
)该函数首先使用itertools.combinations生成指定列中每个列表的元素对组合。然后,使用explode方法将这些组合展开为单独的行。最后,创建一个新的DataFrame,其中包含这些组合元素,并使用原始DataFrame的索引进行连接。
应用函数并生成结果
现在,我们可以应用该函数来处理B_m和B_n列,并将结果连接回原始DataFrame。
out = (
df.join(
other=[
make_pairs(df=df, col="B_m"),
make_pairs(df=df, col="B_n"),
],
)
# Drop the unneeded columns.
.drop(columns=["B_m", "B_n"])
)
print(out)输出:
Group A_x A_y B_m1 B_m2 B_n1 B_n2 0 0 4 9 8 7 -10 5 0 0 4 9 8 7 -10 2 0 0 4 9 8 7 5 2 0 0 4 9 8 3 -10 5 0 0 4 9 8 3 -10 2 0 0 4 9 8 3 5 2 0 0 4 9 7 3 -10 5 0 0 4 9 7 3 -10 2 0 0 4 9 7 3 5 2 1 0 1 2 8 7 -10 5 1 0 1 2 8 7 -10 2 1 0 1 2 8 7 5 2 1 0 1 2 8 3 -10 5 1 0 1 2 8 3 -10 2 1 0 1 2 8 3 5 2 1 0 1 2 7 3 -10 5 1 0 1 2 7 3 -10 2 1 0 1 2 7 3 5 2 2 1 3 3 1 2 -5 1
总结
本教程展示了如何使用itertools.combinations和Pandas的explode和join操作,将DataFrame中包含数组的列展开为新的行,并将数组元素两两组合。这种方法在数据处理和分析中非常有用,可以帮助我们更好地理解和利用数据。
以上就是将DataFrame中的数组元素转换为新的行的详细内容,更多请关注其它相关文章!
# 中非
# 有趣代餐网站推广
# 营销推广表情包怎么做的
# 杭州求推荐英文网站推广
# 旅游攻略营销推广方案模板
# 英语听力网站建设素材
# 团购网seo
# 东营关键词排名哪家强
# 福保中文网站推广
# 济南网站建设框架设计
# 包装网站优化咨询
# 如何实现
# python
# 创建一个
# 如何使用
# 解决方法
# 重写
# 自定义
# 数据处理
# 并将
# 转换为
# ai
# app
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
J*a里如何实现订单支付与库存同步功能_支付库存同步项目开发方法说明
C#中解析不规范的HTML为XML 常见的坑与解决办法
蛙漫移动版在线看 蛙漫手机浏览器直达入口
虫虫漫画精品漫画官网_虫虫漫画精品漫画官网进入精品漫画
圆通快递查询实时追踪 圆通物流包裹状态快速查看
拼多多视频播放卡顿如何处理 拼多多视频播放优化技巧
HTML空白字符处理机制:渲染、DOM与编码实践
J*a应用集成GitHub CLI与API认证指南
c++如何使用Catch2编写单元测试_c++简洁易用的BDD风格测试框架
C++如何实现线程池_C++11手动实现一个简单的固定大小线程池
一加 14R 快充无反应_一加 14R 充电优化
J*aScript map 迭代中检测空数组元素的有效方法
MongoDB Aggregation:在嵌套对象数组中精确匹配ObjectId
PHP中SSG-WSG API的AES加密实践:正确使用初始化向量
MAC怎么安装Homebrew包管理器_MAC为开发者和高级用户安装命令行工具
C++如何检测键盘输入_C++ _kbhit与_getch函数非阻塞输入
1688商家版怎样分析买家画像精准供货_1688商家版分析买家画像精准供货【供货策略】
多闪网页版在线观看免费入口_多闪官网访问入口
TikTok国际版网页端快速入口 TikTok全球版短视频浏览教程
Lar*el如何正确地在控制器和模型之间分配逻辑_Lar*el代码职责分离与架构建议
极兔快递快件信息查询系统 极兔快递官网运单号追踪
win11如何卸载Windows更新补丁 Win11解决更新导致系统不稳定的问题【修复】
QQ邮箱网页版入口页面 QQ邮箱在线登录入口官网
怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】
使用 Pandas 高效处理 .dat 文件:数据清洗与数值计算实战
mc.js官网登录入口 mc.js官方登录入口最新版
LINUX怎么设置定时任务_LINUX crontab配置教程
ArrayList与LinkedList操作复杂度详解:遍历与修改
蛙漫限时开放最深处链接_蛙漫全站漫画会员同款秒开地址
谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法
Django表单提交验证失败后保持字段值不刷新
消息称三星明年 2 月正式发布 HBM4,与 SK 海力士同台竞技
押井守高度称赞《辐射4》:玩了八年都停不下来!
C++的std::mdspan是什么_C++23中用于操作多维数组的非拥有视图
漫蛙2正版漫画站 漫蛙2网页版快速访问入口
如何在 Windows 11 中启动游戏手柄设置
QQ邮箱官网登录入口 QQ邮箱网页版邮箱快速登录
Angular响应式表单:实现提交后表单及按钮的禁用与只读化
高德地图总提示网络异常怎么办 高德地图离线导航设置与网络排查方法
机构:以往存储涨价周期小米利润率实际上有所改善 能转嫁给消费者等
没有大陆身份证/银行卡如何实名微信? 亲测有效的几种方法分享
C++如何打印当前代码行号与文件名_C++预定义宏FILE与LINE的使用
怎么去除衣服上的口红印_生活小妙招教你用酒精轻松擦除
Excel中VLOOKUP的第四个参数是干什么用的_Excel VLOOKUP第四参数作用解析
AO3最新入口2025公告_AO3中文官网合集
飞书妙记怎样用语音转文字速记_飞书妙记用语音转文字速记【速记方法】
4399体育竞技小游戏_4399小游戏赛事入口
Lar*el的路由模型绑定怎么用_Lar*el Route Model Binding简化控制器逻辑
win11怎么查看应用耗电情况 Win11电池设置查看应用能耗排行榜【优化】
在J*aScript中复现SciPy的B样条拟合与求值:关键考量


2025-11-02
浏览次数:次
返回列表