新闻中心

python读取csv的不同形式

2025-11-18
浏览次数:
返回列表
答案:Python读取CSV文件主要有三种方法:1. 使用csv模块适合简单结构,可读取为列表或字典;2. pandas的read_csv最常用,支持DataFrame操作、类型推断和大文件分块;3. numpy适用于纯数值数据,用loadtxt或genfromtxt快速加载数组。

python读取csv的不同形式

Python读取CSV文件有多种方式,每种适合不同场景。最常用的包括使用内置的csv模块、pandas库,以及用numpy处理数值型数据。下面介绍几种主要方法及其适用情况。

1. 使用 csv 模块读取(基础方式)

csv模块是Python标准库的一部分,适合处理结构简单、不需要复杂分析的CSV文件。

常见用法:

  • 读取为列表:每一行是一个列表,按列顺序访问数据
  • 读取为字典:使用csv.DictReader,列名作为键,更易读

示例代码:

import csv
<h1>读取为列表</h1><p>with open('data.csv', 'r', encoding='utf-8') as file:
reader = csv.reader(file)
for row in reader:
print(row)  # 每行是列表</p><h1>读取为字典</h1><p>with open('data.csv', 'r', encoding='utf-8') as file:
reader = csv.DictReader(file)
for row in reader:
print(row['name'], row['age'])  # 按列名访问

2. 使用 pandas 读取(推荐用于数据分析)

pandas是最常用的数据分析库,pd.read_csv()功能强大,支持自动类型推断、缺失值处理、指定列、跳行等。

优点:

  • 一行代码加载成DataFrame,便于后续处理
  • 支持压缩文件、URL路径、大文件分块读取
  • 可指定编码、分隔符、索引列等参数

示例:

import pandas as pd
<h1>基本读取</h1><p>df = pd.read_csv('data.csv')</p><h1>指定参数</h1><p>df = pd.read_csv('data.csv', encoding='gbk', sep=';', index_col='id')</p>
                    <div class="aritcle_card">
                        <a class="aritcle_card_img" href="/ai/855">
                            <img src="https://img.php.cn/upload/ai_manual/001/503/042/68b6d67adc5da910.png" alt="Whimsical">
                        </a>
                        <div class="aritcle_card_info">
                            <a href="/ai/855">Whimsical</a>
                            <p>Whimsical推出的AI思维导图工具</p>
                            <div class="">
                                <img src="/static/images/card_xiazai.png" alt="Whimsical">
                                <span>182</span>
                            </div>
                        </div>
                        <a href="/ai/855" class="aritcle_card_btn">
                            <span>查看详情</span>
                            <img src="/static/images/cardxiayige-3.png" alt="Whimsical">
                        </a>
                    </div>
                <h1>只读前100行(适合大文件)</h1><p>df = pd.read_csv('large.csv', nrows=100)</p><h1>分块读取</h1><p>chunk_reader = pd.read_csv('huge.csv', chunksize=1000)
for chunk in chunk_reader:
process(chunk)  # 逐块处理

3. 使用 numpy 读取(适用于纯数值数据)

如果CSV只包含数字,可以用numpy.loadtxt()genfromtxt()快速加载为数组。

注意:

  • 数据必须规整,不能有缺失或混合类型
  • genfromtxt()支持处理缺失值

示例:

import numpy as np
<h1>简单读取(全为数字)</h1><p>data = np.loadtxt('numbers.csv', delimiter=',')</p><h1>支持缺失值</h1><p>data = np.genfromtxt('data.csv', delimiter=',', skip_header=1)

4. 其他情况处理技

实际使用中常遇到编码、分隔符、中文列名等问题,这里列出常见应对方式:

  • 乱码问题:尝试encoding='utf-8''gbk''latin1'
  • 分隔符不是逗号:如制表符\t,用sep='\t'delimiter='\t'
  • 无标题行:设置header=Nonenames=['col1','col2']
  • 跳过某些行:使用skiprows参数

基本上就这些常用方式。小文件或学习阶段可用csv模块,做数据分析首选pandas,纯数值计算考虑numpy。根据数据特点选择合适方法,效率更高。

以上就是python读取csv的不同形式的详细内容,更多请关注php中文网其它相关文章!


# 不需要  # 校园推广营销文案范文简短  # seo 爱好者  # 云南网站建设在哪办  # 郑州营销型网站建设代码  # 淘宝搜索内裤关键词排名  # 宇梦seo  # 周振兴seo视频  # 搜索关键词排名认可g火19星棒  # 百度营销推广合作  # 登封seo关键词优化  # 中文网  # 相关文章  # 可以用  # php  # 是一个  # 分隔符  # 加载  # 大文件  # 适用于  # 最常用  # 标准库  # csv文件  # csv  # 编码  # python  # 编程  # java 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: CSS Grid如何控制元素对齐_align-items与justify-items组合使用  在Typer应用中优雅地处理和重组任意命令行参数  苹果手机指南针不准怎么校准 传感器校准方法详解【建议收藏】  Win10如何清理注册表垃圾 Win10手动清理无效注册表【技巧】  特斯拉自动驾驶房车计划曝光 原型车将于2027年亮相  windows10怎么关闭系统提示音_windows10彻底静音设置方法  谷歌学术网站直达地址 谷歌学术搜索网页版一键进入  mcjs网页版在线存档 mcjs云存档登录入口  Archive of Our Own官网直达 AO3最新可用地址一览  自定义Bag-of-Words实现:处理带负号的词汇权重  Surface怎么安装系统 微软Surface Pro U盘重装win11教程  海棠账号登录入口_登录海棠账户同步阅读记录  知音漫客官网漫画下载_知音漫客网页版阅读记录  邮编格式怎么匹配地址_根据邮编格式快速匹配详细地址的技巧  Golang如何处理RPC请求负载均衡_Golang RPC请求负载均衡策略与实践  Go语言HTML解析:利用Goquery精准获取指定元素内容  抓大鹅解压小游戏 抓大鹅摸鱼解压入口  J*aScript打印功能_j*ascript输出控制  铁路12306卧铺选择攻略 铁路12306下铺座位预定技巧  汽水音乐在线解析 汽水音乐在线解析入口  利用5118提升短视频内容效果_5118短视频关键词优化方法  漫蛙2漫画入口 漫蛙正版网页漫画直达网址  PDF怎么合并PDF并保持格式_PDF合并文件保持排版教程  MongoDB Aggregation:在嵌套对象数组中精确匹配ObjectId  微博网页版直接访问 微博网页版账号管理快速入口  黑猫投诉统一入口官网 消费者权益保护投诉平台  谷歌浏览器浏览体验优化_谷歌浏览器新版直连永久可用提示  如何使用CaptainHook和Composer管理Git钩子_在提交前自动运行代码检查的Composer配置  怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】  Tabulator表格中精确实现日期时间排序的指南  C++如何进行游戏物理模拟_使用Box2D库为C++游戏添加2D物理效果  2026春节假期时间安排 2026春节假日查询  大象笔记网页版入口 印象笔记网页版登录入口  mc.js游戏直达 mc.js网页免下载版本秒进地址  新手怎么开始学化妆 零基础化妆入门教程  Sublime Text怎么设置垂直标尺_Sublime配置Rulers规范代码长度  Win10双系统截图高效法 截屏快捷键速记【技巧】  Win11怎么安装Linux子系统 Win11 WSL2安装Ubuntu及环境配置指南  《马克思佩恩3》早期版本曝光 UI设计曾多次调整!  Pandas DataFrame:高效添加条件计算列  Yandex免登录官网入口_俄罗斯Yandex搜索引擎直达链接  HTML转PPT成品工具有哪些?HTML网页转PPT成品工具大全  蛙漫官方正版入口 蛙漫网页在线全集免费观看  J*aScript中向JSON对象添加新属性的正确姿势  邮政编码查询不到怎么办_邮政编码查询不到的常见原因与对策  Composer如何解决json扩展缺失的错误  铁路12306的积分有效期是多久_铁路12306积分有效期说明  Typer应用中动态命令行参数的解析与处理  蓝湖怎样用切图标注提对接效率_蓝湖用切图标注提对接效率【设计对接】  浏览器打开即用 美图秀秀网页版入口 

搜索