新闻中心
利用Python Dominate实现Excel数据驱动的HTML文件批量创建

本教程旨在指导如何使用python及其dominate库,自动化地从excel数据生成独立的html文件。文章将详细介绍如何通过编程方式构建html结构,并结合模拟的excel数据,实现每行数据对应一个html文件的批量创建,从而简化静态网站内容的管理与生成流程。
在现代Web开发中,尤其是在构建大量结构相似但内容不同的静态页面时,手动创建和填充HTML文件效率低下且易出错。当数据源是结构化的表格(如Excel文件)时,这种重复性工作更应通过自动化工具来解决。Python因其强大的数据处理能力和丰富的库生态系统,成为实现这一目标的理想选择。本教程将重点介绍如何利用Python的dominate库,结合Excel数据(或任何结构化数据),批量生成定制化的HTML文件。
1. 理解自动化生成HTML的需求
假设我们有一个Excel文件,其中包含多行数据,例如“图片”、“姓名”、“描述”和“代表作”等字段,目标是为Excel中的每一行数据生成一个独立的HTML文件。每个HTML文件都应包含一个预设的HTML结构,并用对应行的数据填充其中的占位符。例如,对于古典作曲家的数据,我们希望生成一个页面,展示其肖像、姓名、简介和代表作品。
2. Python与HTML生成:Dominate库简介
dominate是一个强大的Python库,它允许开发者直接在Python代码中以编程方式创建HTML文档和片段。与传统的字符串拼接或模板引擎(如Jinja2)不同,dominate通过提供一系列Python对象来代表HTML标签,使得HTML结构的构建更加直观、类型安全且易于维护。它将HTML元素视为Python对象,并通过上下文管理器(with语句)来表达嵌套关系,极大地提高了代码的可读性。
2.1 安装 Dominate
首先,确保您的Python环境中安装了dominate库。如果尚未安装,可以使用pip进行安装:
pip install dominate
2.2 Dominate基础用法示例
以下是一个简单的dominate示例,展示了如何创建一个基本的HTML文档结构:
import dominate
from dominate.tags import *
# 创建一个HTML文档对象,并设置标题
doc = dominate.document(title='我的第一个Dominate页面')
# 在文档头部添加样式表和脚本文件
with doc.head:
link(rel='stylesheet', href='style.css')
script(type='text/j*ascript', src='script.js')
# 也可以直接嵌入CSS样式
style("""
body { font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; margin: 20px; background-color: #f0f2f5; color: #333; }
h1 { color: #0056b3; }
p { line-height: 1.5; }
""")
# 在文档主体添加内容
with doc.body:
with div(id='header'):
h1('欢迎使用Dominate')
p('这是一个通过Python Dominate生成的示例页面。')
with div(cls='content'):
p('您可以在这里添加更多动态内容。')
ul():
li('项目1')
li('项目2')
li('项目3')
# 打印生成的HTML字符串
print(doc)运行上述代码将输出一个完整的HTML字符串,其中包含了我们通过Python代码定义的头部、样式和主体内容。
语鲸
AI智能阅读辅助工具
314
查看详情
3. 数据集成:从Excel到HTML
要实现从Excel数据批量生成HTML文件,我们需要两个核心步骤:
- 读取Excel数据: 虽然dominate本身不处理Excel文件,但Python生态中有许多优秀的库可以完成此任务,例如pandas或openpyxl。在本教程中,我们将使用一个模拟的Python列表字典来代表已从Excel读取的数据,以简化演示。
- 遍历数据并生成HTML: 对每一行数据,调用一个函数来构建HTML文档,并将数据动态插入到相应的HTML元素中。
3.1 模拟Excel数据
为了演示,我们假设已经从Excel文件中读取了以下作曲家数据:
# 假设这是从Excel读取的数据,每项代表一行
excel_data = [
{'Picture': 'beethoven.jpg', 'Name': 'Ludwig van Beethoven', 'Description': '德国作曲家和钢琴家,古典主义时期最重要的音乐家之一。', 'Piece': '第九交响曲'},
{'Picture': 'mozart.jpg', 'Name': 'Wolfgang Amadeus Mozart', 'Description': '奥地利作曲家,欧洲古典主义音乐的代表人物。', 'Piece': '安魂曲'},
{'Picture': 'bach.jpg', 'Name': 'Johann Sebastian Bach', 'Description': '德国作曲家,巴洛克时期音乐的集大成者。', 'Piece': '勃兰登堡协奏曲'}
]3.2 完整实现示例:批量生成作曲家页面
下面的代码将展示如何结合dominate和模拟的Excel数据,为每位作曲家生成一个独立的HTML详情页。
import dominate
from dominate.tags import *
import os # 用于文件系统操作
# 模拟的Excel数据
excel_data = [
{'Picture': 'beethoven.jpg', 'Name': 'Ludwig van Beethoven', 'Description': '德国作曲家和钢琴家,古典主义时期最重要的音乐家之一。', 'Piece': '第九交响曲'},
{'Picture': 'mozart.jpg', 'Name': 'Wolfgang Amadeus Mozart', 'Description': '奥地利作曲家,欧洲古典主义音乐的代表人物。', 'Piece': '安魂曲'},
{'Picture': 'bach.jpg', 'Name': 'Johann Sebastian Bach', 'Description': '德国作曲家,巴洛克时期音乐的集大成者。', 'Piece': '勃兰登堡协奏曲'}
]
# 定义一个函数,用于为单个作曲家创建HTML页面
def create_composer_page(composer_info):
"""
根据作曲家信息字典生成一个HTML文档对象。
"""
doc = dominate.document(title=f'{composer_info["Name"]} - 经典作曲家')
with doc.head:
meta(charset='utf-8')
link(rel='stylesheet', href='../style.css') # 假设style.css在父目录
# 嵌入一些基本样式,方便演示
style("""
body { font-family: Arial, sans-serif; line-height: 1.6; margin: 20px; background-color: #f4f4f4; color: #333; }
.container { max-width: 800px; margin: auto; background: #fff; padding: 30px; border-radius: 8px; box-shadow: 0 2px 5px rgba(0,0,0,0.1); }
h1 { color: #0056b3; border-bottom: 2px solid #eee; padding-bottom: 10px; margin-bottom: 20px; }
img { max-width: 100%; height: auto; border-radius: 4px; margin-bottom: 15px; display: block; margin-left: auto; margin-right: auto; }
p { margin-bottom: 10px; }
.label { font-weight: bold; color: #555; }
.button { display: inline-block; background-color: #007bff; color: white; padding: 10px 15px; border-radius: 5px; text-decoration: none; margin-top: 20px; }
.button:hover { background-color: #0056b3; }
""")
with doc.body:
with div(cls='container'):
h1(composer_info['Name'])
# 假设图片文件位于 'images/' 目录下
img(src=f'../images/{composer_info["Picture"]}', alt=composer_info['Name'])
p(span('描述:', cls='label'), composer_info['Description'])
p(span('代表作:', cls='label'), composer_info['Piece'])
a('返回作曲家列表', href='../index.html', cls='button')
return doc
# 定义输出目录和图片目录
output_dir = 'generated_pages'
images_dir = 'images'
if not os.path.exists(output_dir):
os.makedirs(output_dir)
if not os.path.exists(images_dir):
os.makedirs(images_dir)
print(f"请将图片文件(如 beethoven.jpg, mozart.jpg, bach.jpg)放入 '{images_dir}' 目录中。")
# 批量生成HTML文件
print("开始生成作曲家页面...")
for composer in excel_data:
html_doc = create_composer_page(composer)
# 使用作曲家名字作为文件名,并进行URL友好处理
# 例如:"Ludwig van Beethoven" -> "ludwig_van_beethoven.html"
filename = f"{composer['Name'].replace(' ', '_').lower()}.html"
filepath = os.path.join(output_dir, filename)
with open(filepath, 'w', encoding='utf-8') as f:
f.write(str(html_doc))
print(f"已生成文件: {filepath}")
# 生成一个主页 (index.html) 用于导航
index_doc = dominate.document(title='经典作曲家列表')
with index_doc.head:
meta(charset='utf-8')
link(rel='stylesheet', href='style.css')
style("""
body { font-family: Arial, sans-serif; line-height: 1.6; margin: 20px; background-color: #f4f4f4; color: #333; }
.container { max-width: 800px; margin: auto; background: #fff; padding: 30px; border-radius: 8px; box-shadow: 0 2px 5px rgba(0,0,0,0.1); }
h1 { color: #0056b3; border-bottom: 2px solid #eee; padding-bottom: 10px; margin-bottom: 20px; }
ul { list-style: none; padding: 0; }
li { margin-bottom: 10px; }
li a { text-decoration: none; color: #007bff; font-weight: bold; }
li a:hover { text-decoration: underline; color: #0056b3; }
""")
with index_doc.body:
with div(cls='container'):
h1('经典作曲家列表')
ul():
for composer in excel_data:
# 链接到生成的详情页
li(a(composer['Name'], href=f"{output_dir}/{composer['Name'].replace(' ', '_').lower()}.html"))
index_filepath = 'index.html'
with open(index_filepath, 'w', encoding='utf-8') as f:
f.write(str(index_doc))
print(f"已生成主页: {index_filepath}")
# 生成一个全局的style.css文件
style_content = """
body { font-family: Arial, sans-serif; line-height: 1.6; margin: 20px; background-color: #f4f4f4; color: #333; }
.container { max-width: 800px; margin: auto; background: #fff; padding: 30px; border-radius: 8px; box-shadow: 0 2px 5px rgba(0,0,0,0.1); }
h1 { color: #0056b3; border-bottom: 2px solid #eee; padding-bottom: 10px; margin-bottom: 20px; }
img { max-width: 100%; height: auto; border-radius: 4px; ma
rgin-bottom: 15px; display: block; margin-left: auto; margin-right: auto; }
p { margin-bottom: 10px; }
.label { font-weight: bold; color: #555; }
.button { display: inline-block; background-color: #007bff; color: white; padding: 10px 15px; border-radius: 5px; text-decoration: none; margin-top: 20px; }
.button:hover { background-color: #0056b3; }
"""
with open('style.css', 'w', encoding='utf-8') as f:
f.write(style_content)
print("已生*局样式文件: style.css")
print("\n所有文件生成完毕!")
print(f"请在浏览器中打开 '{index_filepath}' 查看结果。")
print(f"别忘了将图片文件(如 beethoven.jpg 等)放入 '{images_dir}' 目录。")代码说明:
- 数据源模拟: excel_data列表模拟了从Excel读取的每一行数据。
-
create_composer_page函数: 这个函数接收一个作曲家信息的字典,然后利用dominate库构建一个完整的HTML文档。
- dominate.document(title=...) 创建文档。
- with doc.head: 和 with doc.body: 用于在文档的头部和主体中添加内容。
以上就是利用Python Dominate实现Excel数据驱动的HTML文件批量创建的详细内容,更多请关注其它相关文章!
# 奥地利
# 广州企业网站建设
# seo42-seo3的键角大小
# 井陉高级网站建设项目
# seo顾问服务 陕西
# 保定旅游网站建设工作
# 灵丘网站推广工具
# 法库品牌网站建设供应商
# 影楼网络推广营销策略
# 贷款关键词热度排名优化
# 烟台网站推广找哪家公司
# 结构化
# 代表人物
# 创建一个
# 欧洲
# 最重要
# css
# 是一个
# 巴洛克
# 德国
# 文档
# 工具
# 浏览器
# composer
# go
# js
# html
# java
# python
# excel
# javascript
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
解决Django多数据库/多Schema环境下外键迁移问题
LINUX的perf命令入门_LINUX官方性能分析工具的使用与解读
漫蛙漫画官方首页 漫蛙2漫画在线阅读入口
windows10怎么查看本机ip_windows10命令提示符ipconfig使用
构建轻量级网站内部消息系统:Formspree 集成指南
深入理解Promise链:如何在catch后中断then的执行
使用Pandas转换并合并DataFrame:多列映射至统一结构
12306怎么选座位选到安静区_12306选座安静区域选择策略
Win10如何清理注册表垃圾 Win10手动清理无效注册表【技巧】
Flexbox布局实践:实现粘性导航栏与底部固定页脚
J*aScript中高效清空DOM列表元素:解决for循环中断与任务管理问题
使用 Pandas 高效处理 .dat 文件:数据清洗与数值计算实战
Win10如何恢复误删的快捷方式_Win10重建常用软件快捷方式
J*aScript中向JSON对象添加新属性的正确姿势
Golang如何处理RPC请求负载均衡_Golang RPC请求负载均衡策略与实践
yy漫画网页版官方入口_yy漫画官网登录页面链接
淘宝支付提示失败如何解决 淘宝支付流程优化方法
向日葵客户端怎么进行远程CentOS控制_向日葵客户端远程CentOS控制操作教程
Win10双系统截图高效法 截屏快捷键速记【技巧】
斑马英语APP如何开启夜间护眼阅读_斑马英语APP夜间模式与低蓝光设置教程
HTML转PPT成品工具有哪些?HTML网页转PPT成品工具大全
c++中的std::forward_list和std::list有什么不同_c++ forward_list与list区别分析
Composer的 "check-platform-reqs" 命令有什么用_在部署前检查生产环境是否满足Composer依赖需求
QQ邮箱官方登录入口_QQ邮箱网页版快捷使用平台
Yandex官方入口网址 Yandex俄罗斯搜索引擎最新在线地址
动漫共和国防屏蔽稳定域名-动漫共和国官方正版直达通道
魅族17怎样用浏览器译外语网页_iPhone魅族17浏览器译外语网页【即时翻译】
WordPress插件开发:正确注册卸载钩子与避免常见陷阱
如何在J*a中使用Locale处理多语言环境
蓝湖怎样用切图标注提对接效率_蓝湖用切图标注提对接效率【设计对接】
谷歌邮箱注册显示错误Gmail服务器异常与延迟处理
C++如何使用AddressSanitizer(ASan)_C++调试工具中检测内存访问错误的利器
在Go Martini框架中高效服务动态生成图像的实践指南
Golang如何使用new_Go new分配内存机制讲解
Go语言中对Map值调用带指针接收者方法:原理与最佳实践
火狐浏览器占用内存高卡顿怎么办 火狐浏览器性能优化设置技巧
利用5118提升短视频内容效果_5118短视频关键词优化方法
京东单号查询入口_京东快递订单追踪入口
mc.js官网登录入口 mc.js官方登录入口最新版
Kafka Streams中基于消息头条件过滤消息的实现指南
今日头条怎么同步内容到抖音_今日头条内容同步到抖音教程
J*aScript中针对特定容器内图片动画的实现教程
我的世界mc.js免费游戏直接能玩 我的世界mc.js小游戏免费秒玩入口
写好的html代码怎么运行出来_运行写好的html代码方法【教程】
Composer如何处理Git子模块(submodule)依赖_Composer与Git Submodule的对比与选择
Lar*el头像管理:图片缩放与旧文件删除的最佳实践
Gmail邮箱申请注册直达_Gmail邮箱免费注册PC版官网入口2025
俄罗斯浏览器官网直达链接 俄罗斯浏览器最新在线入口导航
为什么我的微信朋友圈看不到别人的更新_微信朋友圈更新显示异常解决方法
怎么去除衣服上的口红印_生活小妙招教你用酒精轻松擦除


2025-11-28
浏览次数:次
返回列表
rgin-bottom: 15px; display: block; margin-left: auto; margin-right: auto; }
p { margin-bottom: 10px; }
.label { font-weight: bold; color: #555; }
.button { display: inline-block; background-color: #007bff; color: white; padding: 10px 15px; border-radius: 5px; text-decoration: none; margin-top: 20px; }
.button:hover { background-color: #0056b3; }
"""
with open('style.css', 'w', encoding='utf-8') as f:
f.write(style_content)
print("已生*局样式文件: style.css")
print("\n所有文件生成完毕!")
print(f"请在浏览器中打开 '{index_filepath}' 查看结果。")
print(f"别忘了将图片文件(如 beethoven.jpg 等)放入 '{images_dir}' 目录。")