新闻中心

Linux awk脚本入门教程_Linux强大的文本分析工具实例

2025-12-12
浏览次数:
返回列表
awk是Linux下以字段为单位处理文本的利器,语法为awk 'pattern {action}' file,支持内置变量、BEGIN/END块、条件判断和字符串操作,常用于日志分析、系统信息提取与统计。

linux awk脚本入门教程_linux强大的文本分析工具实例

awk 是 Linux 下处理文本的利器,特别适合按行、按列提取、统计、过滤和格式化数据。它不像 sed 那样专注编辑,也不像 grep 只做匹配,而是以“字段为单位”做逻辑处理,写法简洁,上手快,一条命令常顶一个 Python 小脚本。

awk 的基本结构和运行方式

awk 的核心语法是:awk 'pattern {action}' file。其中 pattern 是匹配条件(可省略,默认每行都处理),action 是执行动作(如打印、计算、判断)。最常用的内置变量有:

  • $0:整行内容
  • $1, $2, …:第1、第2个字段(默认空格或制表符分隔)
  • NF:当前行字段总数
  • NR:当前处理的行号(从1开始)
  • FS:输入字段分隔符(默认空白);OFS:输出分隔符(默认空格)

常用实例:从日志和系统命令中快速提取信息

比如查看 df -h 输出中使用率超过 80% 的分区:

df -h | awk '$5+0 > 80 {print $1, $5}'

说明:$5 是“已用百分比”,加 0 是强制转成数字(避免带 % 符号时字符串比较出错);{print $1, $5} 输出设备名和百分比。

再比如统计 nginx 日志中访问次数最多的前 3 个 IP:

awk '{print $1}' access.log | sort | uniq -c | sort -nr | head -3

或者直接用 awk 统计(更高效):

awk '{ip[$1]++} END {for (i in ip) print ip[i], i}' access.log | sort -nr | head -3

用 BEGIN 和 END 做初始化与汇总

awk 在读取文件前执行 BEGIN 块,在读完所有行后执行 END 块,非常适合做统计汇总。

例如计算 /etc/passwd 中 shell 字段(第7列)的种类和数量:

微软爱写作 微软爱写作

微软出品的免费英文写作/辅助/批改/评分工具

微软爱写作 130 查看详情 微软爱写作

awk -F: 'BEGIN {print "Shell\tCount"} {sh[$7]++} END {for (s in sh) print s, sh[s]}' /etc/passwd | sort -k2nr

这里 -F: 指定冒号为分隔符;BEGIN 打印表头;END 遍历数组并输出结果。

简单条件判断和字符串操作

awk 支持 if、else、正则匹配(~ 和 !~)、substr、length、gsub 等函数。

例如:只打印 /etc/fstab 中非注释、非空行,且第3列是 ext4 的设备:

awk '$1 !~ /^#/ && NF > 0 && $3 == "ext4" {print $1, $2}' /etc/fstab

又如把某列小写转大写:

awk '{print toupper($2)}' data.txt

替换字段中的某个单词(类似 sed):

awk '{gsub(/old/, "new", $3); print}' file.txt

基本上就这些。awk 不需要编译,即写即跑,配合管道几乎能覆盖 80% 的日常文本分析需求。写多了你会发现,它不是“替代脚本语言”,而是“让脚本语言变得不必要的那个工具”。

以上就是Linux awk脚本入门教程_Linux强大的文本分析工具实例的详细内容,更多请关注其它相关文章!


# 中非  # 韩国最大推广网站是哪个  # 比较大的推广网站  # 网站建设学习励志头像  # 成都seo网络优化推广  # 深圳黑帽seo  # 河北整合营销推广系统  # 聊城seo营销  # 潜江服装网站推广价格  # 佛山高明seo博客  # 扬州网站建设哪家比较好  # 遍历  # 不需要  # linux  # 编辑器  # 分隔符  # 行号  # 服务管理  # 不像  # 运行环境  # 微软  # 工具  # access  # nginx  # python 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: sublime怎么预览Markdown渲染效果_Markdown Preview插件 for sublime教程  树莓派传感器触发:通过Twilio API发送WhatsApp消息教程  学习通网页版官方登录 超星学习通电脑端入口指南  Mac怎么使用表情符号_Mac Emoji快捷键面板  b站怎么删除评论_b站评论管理与删除操作  邮编格式怎么匹配地址_根据邮编格式快速匹配详细地址的技巧  我的世界官方游戏入口 我的世界官网平台直达链接  Excel函数批量查找替换超快方法_Excel用REPLACE和FIND函数秒级替换  J*a递归快速排序中静态变量的状态管理与陷阱  Golang如何优化CPU绑定任务分配策略_Golang CPU任务分配优化实践  Tabulator表格中精确实现日期时间排序的指南  HTML5原生日期选择器与jQuery UI:实现日期选择器的联动与程序化控制  在J*a中如何开发在线活动报名与管理系统_活动报名管理项目实战解析  Linux如何排查内存不足OOME问题_LinuxOOM分析教程  在J*a里如何理解依赖关系的方向_依赖方向在模块结构中的作用  Go语言中的*string:深入理解字符串指针  Win11怎么设置开机NumLock亮 Win11修改注册表InitialKeyboardIndicators值  押井守高度称赞《辐射4》:玩了八年都停不下来!  J*aScript中向JSON对象添加新属性的正确姿势  免费抖音短视频入口_抖音网页版短视频免费通道  谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法  C++如何实现线程池_C++11手动实现一个简单的固定大小线程池  PySpark中从现有列右侧提取可变长度字符创建新列的教程  Win10快速启动功能利弊分析 Win10开启或关闭快速启动教程【技巧】  处理动态列数据:J*a ArrayList的正确初始化与字符累加教程  印象笔记如何设离线包出差查阅_印象笔记设离线包出差查阅【离线阅读】  NRF24L01数据传输深度解析:解决大载荷接收异常与分包策略  Yandex免登录网页版地址 Yandex搜索引擎官方访问入口  TikTok国际版官网直达_TikTok国际版官网直达进入在线观看  Selenium Python中处理点击后新窗口加载冻结问题的策略与实践  外媒分析《GTA6》定价:卖100美元可以但真没必要!  浏览器打开即用 美图秀秀网页版入口  Yandex搜索引擎一键访问入口_俄罗斯Yandex官网免登录  实现全屏滚动与导航点:专业教程  怎么在浏览器上运行HTML文件_浏览器运行HTML文件技巧【技巧】  Excel文件在线转换快速入口 Excel在线格式转换网站  将HTML Canvas内容转换为可上传的图像文件(File对象)  Go语言中动态执行代码字符串的策略与实践  微信怎么把收藏的内容分类管理 微信收藏内容标签分类方法  CSS自定义字体样式被系统字体替换怎么办_font-face方式指定font-display控制渲染策略  126邮箱网页版官方入口 126邮箱账号在线登录平台  Kafka Streams中基于消息头条件过滤消息的实现指南  响应式容器内容自动缩放与宽高比维持教程  抖音极速版最新版本 抖音极速版官方下载地址  PostgreSQL海量数据高效导入策略:Python与Django实践指南  C++如何实现一个智能指针_手动实现C++ shared_ptr的引用计数功能  零跑汽车11月交付量达70327台 实现连续9个月正增长  厨房不锈钢水槽发黑生锈怎么处理_水槽用可乐+锡纸2分钟抛亮如新  c++如何使用Meson构建系统_c++比CMake更快的构建工具  Yandex搜索引擎官方地址 俄罗斯网络世界的主要入口 

搜索