新闻中心
Linux awk脚本入门教程_Linux强大的文本分析工具实例
awk是Linux下以字段为单位处理文本的利器,语法为awk 'pattern {action}' file,支持内置变量、BEGIN/END块、条件判断和字符串操作,常用于日志分析、系统信息提取与统计。

awk 是 Linux 下处理文本的利器,特别适合按行、按列提取、统计、过滤和格式化数据。它不像 sed 那样专注编辑,也不像 grep 只做匹配,而是以“字段为单位”做逻辑处理,写法简洁,上手快,一条命令常顶一个 Python 小脚本。
awk 的基本结构和运行方式
awk 的核心语法是:awk 'pattern {action}' file。其中 pattern 是匹配条件(可省略,默认每行都处理),action 是执行动作(如打印、计算、判断)。最常用的内置变量有:
- $0:整行内容
- $1, $2, …:第1、第2个字段(默认空格或制表符分隔)
- NF:当前行字段总数
- NR:当前处理的行号(从1开始)
- FS:输入字段分隔符(默认空白);OFS:输出分隔符(默认空格)
常用实例:从日志和系统命令中快速提取信息
比如查看 df -h 输出中使用率超过 80% 的分区:
df -h | awk '$5+0 > 80 {print $1, $5}'
说明:$5 是“已用百分比”,加 0 是强制转成数字(避免带 % 符号时字符串比较出错);{print $1, $5} 输出设备名和百分比。
再比如统计 nginx 日志中访问次数最多的前 3 个 IP:
awk '{print $1}' access.log | sort | uniq -c | sort -nr | head -3
或者直接用 awk 统计(更高效):
awk '{ip[$1]++} END {for (i in ip) print ip[i], i}' access.log | sort -nr | head -3
用 BEGIN 和 END 做初始化与汇总
awk 在读取文件前执行 BEGIN 块,在读完所有行后执行 END 块,非常适合做统计汇总。
例如计算 /etc/passwd 中 shell 字段(第7列)的种类和数量:
微软爱写作
微软出品的免费英文写作/辅助/批改/评分工具
130
查看详情
awk -F: 'BEGIN {print "Shell\tCount"} {sh[$7]++} END {for (s in sh) print s, sh[s]}' /etc/passwd | sort -k2nr
这里 -F: 指定冒号为分隔符;BEGIN 打印表头;END 遍历数组并输出结果。
简单条件判断和字符串操作
awk 支持 if、else、正则匹配(~ 和 !~)、substr、length、gsub 等函数。
例如:只打印 /etc/fstab 中非注释、非空行,且第3列是 ext4 的设备:
awk '$1 !~ /^#/ && NF > 0 && $3 == "ext4" {print $1, $2}' /etc/fstab
又如把某列小写转大写:
awk '{print toupper($2)}' data.txt
替换字段中的某个单词(类似 sed):
awk '{gsub(/old/, "new", $3); print}' file.txt
基本上就这些。awk 不需要编译,即写即跑,配合管道几乎能覆盖 80% 的日常文本分析需求。写多了你会发现,它不是“替代脚本语言”,而是“让脚本语言变得不必要的那个工具”。
以上就是Linux awk脚本入门教程_Linux强大的文本分析工具实例的详细内容,更多请关注其它相关文章!
# 中非
# 韩国最大推广网站是哪个
# 比较大的推广网站
# 网站建设学习励志头像
# 成都seo网络优化推广
# 深圳黑帽seo
# 河北整合营销推广系统
# 聊城seo营销
# 潜江服装网站推广价格
# 佛山高明seo博客
# 扬州网站建设哪家比较好
# 遍历
# 不需要
# linux
# 编辑器
# 分隔符
# 行号
# 服务管理
# 不像
# 运行环境
# 微软
# 工具
# access
# nginx
# python
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
sublime怎么预览Markdown渲染效果_Markdown Preview插件 for sublime教程
树莓派传感器触发:通过Twilio API发送WhatsApp消息教程
学习通网页版官方登录 超星学习通电脑端入口指南
Mac怎么使用表情符号_Mac Emoji快捷键面板
b站怎么删除评论_b站评论管理与删除操作
邮编格式怎么匹配地址_根据邮编格式快速匹配详细地址的技巧
我的世界官方游戏入口 我的世界官网平台直达链接
Excel函数批量查找替换超快方法_Excel用REPLACE和FIND函数秒级替换
J*a递归快速排序中静态变量的状态管理与陷阱
Golang如何优化CPU绑定任务分配策略_Golang CPU任务分配优化实践
Tabulator表格中精确实现日期时间排序的指南
HTML5原生日期选择器与jQuery UI:实现日期选择器的联动与程序化控制
在J*a中如何开发在线活动报名与管理系统_活动报名管理项目实战解析
Linux如何排查内存不足OOME问题_LinuxOOM分析教程
在J*a里如何理解依赖关系的方向_依赖方向在模块结构中的作用
Go语言中的*string:深入理解字符串指针
Win11怎么设置开机NumLock亮 Win11修改注册表InitialKeyboardIndicators值
押井守高度称赞《辐射4》:玩了八年都停不下来!
J*aScript中向JSON对象添加新属性的正确姿势
免费抖音短视频入口_抖音网页版短视频免费通道
谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法
C++如何实现线程池_C++11手动实现一个简单的固定大小线程池
PySpark中从现有列右侧提取可变长度字符创建新列的教程
Win10快速启动功能利弊分析 Win10开启或关闭快速启动教程【技巧】
处理动态列数据:J*a ArrayList的正确初始化与字符累加教程
印象笔记如何设离线包出差查阅_印象笔记设离线包出差查阅【离线阅读】
NRF24L01数据传输深度解析:解决大载荷接收异常与分包策略
Yandex免登录网页版地址 Yandex搜索引擎官方访问入口
TikTok国际版官网直达_TikTok国际版官网直达进入在线观看
Selenium Python中处理点击后新窗口加载冻结问题的策略与实践
外媒分析《GTA6》定价:卖100美元可以但真没必要!
浏览器打开即用 美图秀秀网页版入口
Yandex搜索引擎一键访问入口_俄罗斯Yandex官网免登录
实现全屏滚动与导航点:专业教程
怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】
Excel文件在线转换快速入口 Excel在线格式转换网站
将HTML Canvas内容转换为可上传的图像文件(File对象)
Go语言中动态执行代码字符串的策略与实践
微信怎么把收藏的内容分类管理 微信收藏内容标签分类方法
CSS自定义字体样式被系统字体替换怎么办_font-face方式指定font-display控制渲染策略
126邮箱网页版官方入口 126邮箱账号在线登录平台
Kafka Streams中基于消息头条件过滤消息的实现指南
响应式容器内容自动缩放与宽高比维持教程
抖音极速版最新版本 抖音极速版官方下载地址
PostgreSQL海量数据高效导入策略:Python与Django实践指南
C++如何实现一个智能指针_手动实现C++ shared_ptr的引用计数功能
零跑汽车11月交付量达70327台 实现连续9个月正增长
厨房不锈钢水槽发黑生锈怎么处理_水槽用可乐+锡纸2分钟抛亮如新
c++如何使用Meson构建系统_c++比CMake更快的构建工具
Yandex搜索引擎官方地址 俄罗斯网络世界的主要入口


2025-12-12
浏览次数:次
返回列表
' file,支持内置变量、BEGIN/END块、条件判断和字符串操作,常用于日志分析、系统信息提取与统计。