新闻中心
PyMC模型中自定义对数似然的性能优化:兼论JAX兼容性与数学表达式重构

pymc模型中,当使用自定义pytensor op定义对数似然并尝试结合blackjax采样器时,可能遭遇jax转换兼容性错误。本文将深入探讨如何实现自定义对数似然,分析blackjax集成时的挑战,并提供一种通过数学表达式重构来显著提升核心计算函数性能的通用优化策略,即使无法利用jax加速,也能有效缩短采样时间。
1. PyMC中自定义对数似然函数的实现
在贝叶斯建模中,有时标准分布无法满足特定需求,需要引入自定义的对数似然函数。PyMC(基于PyTensor)提供了一种机制,允许用户通过定义自定义的pytensor.Op来集成任意Python函数及其梯度。
1.1 定义自定义PyTensor Op
要将一个复杂的Python函数(例如,涉及外部库或数值求解器)集成到PyMC的计算图中,需要创建两个pytensor.Op类:一个用于计算函数值(对数似然),另一个用于计算其梯度。
LogLikeWithGrad (对数似然函数)
这个Op负责计算给定参数的对数似然值。它需要实现perform方法来执行实际的对数似然计算,并重载grad方法来指定如何计算梯度。
import pytensor.tensor as pt
import numpy as np
from scipy.optimize import approx_fprime # 用于数值梯度
class LogLikeWithGrad(pt.Op):
itypes = [pt.dvector] # 输入是一个参数向量
otypes = [pt.dscalar] # 输出是一个标量(对数似然值)
def __init__(self, loglike_function):
self.likelihood = loglike_function
self.loglike_grad_op = LogLikeGrad(loglike_function) # 初始化梯度Op
def perform(self, node, inputs, outputs):
(theta,) = inputs
logl = self.likelihood(theta)
outputs[0][0] = np.array(logl)
def grad(self, inputs, grad_outputs):
(theta,) = inputs
# 调用自定义的梯度Op来计算梯度
grads = self.loglike_grad_op(theta)
return [grad_outputs[0] * grads]LogLikeGrad (对数似然梯度函数)
这个Op专门用于计算对数似然函数相对于其输入的梯度。在缺乏解析梯度的情况下,可以使用数值近似方法,例如scipy.optimize.approx_fprime。
class LogLikeGrad(pt.Op):
itypes = [pt.dvector] # 输入是一个参数向量
otypes = [pt.dvector] # 输出是一个梯度向量
def __init__(self, loglike_function):
self.likelihood = loglike_function
def perform(self, node, inputs, outputs):
(theta,) = inputs
# 使用数值方法近似梯度
grads = approx_fprime(theta, self.likelihood, epsilon=1e-8)
outputs[0][0] = grads1.2 在PyMC模型中集成自定义似然
一旦定义了自定义的LogLikeWithGrad Op,就可以将其作为pm.Potential添加到PyMC模型中。pm.Potential允许用户在模型中引入任意的对数概率贡献。
import pymc as pm
# 假设 applyMCMC 是你的核心对数似然计算函数
# 并且 param_names 和 lower/upper_boundaries 已经定义
# logl = LogLikeWithGrad(applyMCMC)
with pm.Model() as model:
# 定义模型参数
for i, name in enumerate(param_names):
pm.Uniform(name, lower=lower_boundaries[0][i], upper=upper_boundaries[0][i])
# 将所有参数组合成一个PyTensor向量
theta = pt.as_tensor_variable([model[param] for param in param_names])
# 将自定义对数似然作为潜力项添加到模型中
pm.Potential("likelihood", logl(theta))
# 执行采样
# trace = pm.sample(draws=niter, step=pm.NUTS(), tune=500, cores=64, init="jitter+adapt_diag", progressbar=True)2. Blackjax采样器与PyTensor Op的JAX兼容性挑战
PyMC 5.x 版本支持多种NUTS采样器后端,包括其默认的PyTensor后端以及基于JAX的Blackjax采样器,后者在GPU等加速设备上表现出色。然而,当模型中包含自定义的pytensor.Op时,尝试使用Blackjax采样器可能会遇到兼容性问题。
2.1 NotImplementedError 的根源
当尝试通过 pm.sample(nuts_sampler="blackjax") 使用Blackjax时,如果自定义的LogLikeWithGrad Op没有对应的JAX转换实现,PyTensor的JAX后端会抛出 NotImplementedError,错误信息通常为 No JAX conversion for the given Op: LogLikeWithGrad。
小云雀
剪映出品的AI视频和图片创作助手
1949
查看详情
这是因为Blackjax采样器依赖于JAX的即时编译(JIT)能力,而JAX只能编译其能够理解的操作。自定义的pytensor.Op本质上是一个Python对象,PyTensor需要一个明确的规则来告诉JAX如何将其转换为JAX可执行的操作。对于标准PyTensor操作,这些转换已经内置,但对于用户自定义的Op,则需要手动提供。
2.2 解决方案方向
解决此问题通常需要以下两种方法之一:
- 重写Op以完全使用JAX操作:如果自定义对数似然函数的核心逻辑可以用JAX原生的操作(如jax.numpy)表达,那么可以直接在JAX中构建这个似然函数,并将其集成到PyMC模型中。这通常涉及将所有PyTensor代码替换为JAX代码。
- 为自定义Op提供JAX转换规则:这是一种更高级的方法,涉及为自定义pytensor.Op编写一个JAX转换函数,告诉PyTensor的JAX后端如何将该Op转换为JAX的计算图。这通常通过注册JAX调度函数来实现,但实现起来较为复杂,且文档相对较少。
在许多情况下,特别是当自定义似然函数依赖于复杂外部库(如物理模拟器)时,直接将其完全转换为JAX操作可能非常困难或不可能。此时,即使无法利用Blackjax的JAX加速,我们仍然可以通过优化核心计算逻辑来提升采样性能。
3. 提升PyMC模型计算性能的通用策略:数学表达式优化
即使无法直接利用JAX的GPU加速,通过对核心数学计算函数进行细致的优化,也能显著提升PyMC模型的采样速度。这种优化策略侧重于减少冗余计算、避免重复的函数调用以及利用局部变量缓存中间结果。
3.1 识别并消除冗余计算
在复杂的数学表达式中,往往存在重复计算相同子表达式的情况。通过将这些子表达式的结果存储在局部变量中,可以避免多次计算,从而提高效率。
以原始代码中的dH和du函数为例,它们包含大量重复的幂运算和乘法:
- (1 + z) 的不同幂次 ((1 + z)**2, (1 + z)**3, (1 + z)**4, (1 + z)**5)
- math.pi * Rho_m
- Omega_k * Phi
- Phi * Phi (即 Phi**2)
3.2 优化示例:dH 和 du 函数
以下是针对 dH 和 du 函数的优化版本,通过引入局部变量来缓存重复计算的中间结果:
import math
import timeit # 用于性能测试
# 假设 Rho_m, Phi, u, omega_BD, Omega_k, z 为示例输入
# (为了测试方便,这里使用任意值,实际应是模型参数)
Rho_m = -1.0
Phi = 0.1
u = 3.0
omega_BD = 4.0
Omega_k = -5.0
z = 6.0
# 原始 du 函数 (为对比而保留,实际代码中应替换为优化版本)
def du_original(Rho_m, Phi, u, omega_BD, Omega_k, z):
return (
24 * math.pi * Rho_m * Phi**3
+ (1 + z)
* u
* Phi**2
* (
8 * math.pi * (-3 + omega_BD) * Rho_m
- 3 * (1 + z) ** 2 * (3 + 2 * omega_BD) * Omega_k * Phi
)
- 3
* (1 + z) ** 2
* u**2
* Phi
* (
-4 * math.pi * omega_BD * Rho_m
+ (1 + z) ** 4 * (3 + 2 * omega_BD) * Omega_k * Phi
)
- omega_BD
* u**3
* (
4 * math.pi * (1 + z) ** 3 * (1 + omega_BD) * Rho_m
+ (1 + z) ** 5 * (3 + 2 * omega_BD) * Omega_k * Phi
)
) / (
(1 + z) ** 2
* (3 + 2 * omega_BD)
* Phi**2
* (8 * math.pi * Rho_m + 3 * (1 + z) ** 2 * Omega_k * Phi)
)
# 优化后的 du 函数
def du_optimized(Rho_m, Phi, u, omega_BD, Omega_k, z):
# 缓存幂次和重复乘法
Phi_pow2 = Phi * Phi
Phi_pow3 = Phi_pow2 * Phi
one_plus_z = 1 + z
one_plus_z_pow2 = one_plus_z * one_plus_z
one_plus_z_pow3 = one_plus_z_pow2 * one_plus_z
one_plus_z_pow4 = one_plus_z_pow3 * one_plus_z
one_plus_z_pow5 = one_plus_z_pow4 * one_plus_z
# 缓存其他重复子表达式
one_plus_z_pow2_times_3 = 3 * one_plus_z_pow2
pi_times_Rho_m = math.pi * Rho_m
Omega_k_times_Phi = Omega_k * Phi
u_pow2 = u * u
u_pow3 = u_pow2 * u
omg1 = (3 + 2 * omega_BD) # (3 + 2 * omega_BD)
omg = omg1 * Omega_k_times_Phi # (3 + 2 * omega_BD) * Omega_k * Phi
omg2 = omega_BD * pi_times_Rho_m # omega_BD * math.pi * Rho_m
return (
24 * pi_times_Rho_m * Phi_pow3
+ one_plus_z * u * Phi_pow2 * (8 * (-3 + omega_BD) * pi_times_Rho_m - one_plus_z_pow2_times_3 * omg)
- one_plus_z_pow2_times_3 * u_pow2 * Phi * (-4 * omg2 + one_plus_z_pow4 * omg)
- omega_BD * u_pow3 * (4 * one_plus_z_pow3 * (pi_times_Rho_m + omg2) + one_plus_z_pow5 * omg)
) / (
one_plus_z_pow2 * omg1 * Phi_pow2 * (8 * pi_times_Rho_m + one_plus_z_pow2_times_3 * Omega_k_times_Phi)
)
# 原始 dH 函数 (为对比而保留)
def dH_original(Rho_m, Phi, u, omega_BD, Omega_k, z):
val = (-16 * math.pi * Rho_m - 6 * (1 + z) ** 2 * Omega_k * Phi) / (
6 * (1 + z) * u + ((1 + z) ** 2 * omega_BD * u**2) / Phi - 6 * Phi
)
if val >= 0:
return -(
(
(1 + z)
* (16 * math.pi * Rho_m + 6 * (1 + z) ** 2 * Omega_k * Phi)
* (
(1 + z) * omega_BD * u**3
- 2
* omega_BD
* u
* ((1 + z) * du_original(Rho_m, Phi, u, omega_BD, Omega_k, z) + u)
* Phi
- 6 * du_original(Rho_m, Phi, u, omega_BD, Omega_k, z) * Phi**2
)
+ (
6
* Phi
* (
-8 * math.pi * Rho_m
+ (1 + z) ** 2 * Omega_k * ((1 + z) * u + 2 * Phi)
)
* (6 * Phi**2 - (1 + z) * u * ((1 + z) * omega_BD * u + 6 * Phi))
)
/ (1 + z)
)
/ (
2
* math.sqrt(val)
* (
(1 + z) ** 2 * omega_BD * u**2
+ 6 * (1 + z) * u * Phi
- 6 * Phi**2
)
** 2
)
)
else:
return None
# 优化后的 dH 函数
def dH_optimized(Rho_m, Phi, u, omega_BD, Omega_k, z):
# 缓存常用变量和幂次
Phi_pow2 = Phi * Phi
Phi_pow2_times_6 = Phi_pow2 * 6
Phi_times_6 = Phi * 6
one_plus_z = 1 + z
one_plus_z_pow2 = one_plus_z * one_plus_z
one_plus_z_times_u = one_plus_z * u
pi_times_Rho_m = math.pi * Rho_m
Omega_k_times_Phi = Omega_k * Phi
u_pow2 = u * u
u_pow3 = u_pow2 * u
# 重新计算 duu (如果 duu 在 dH 内部被调用多次,直接内联其计算可进一步优化)
# 此处为简洁起见,仍调用 du_optimized,但注意实际场景可内联
# 或者,如原答案所示,直接将 du_optimized 的计算逻辑复制到此处
# duu 的内联计算部分 (来自 du_optimized)
Phi_pow3_du = Phi_pow2 * Phi
one_plus_z_pow3_du = one_plus_z_pow2 * one_plus_z
one_plus_z_pow4_du = one_plus_z_pow3_du * one_plus_z
one_plus_z_pow5_du = one_plus_z_pow4_du * one_plus_z
one_plus_z_pow2_times_3_du = 3 * one_plus_z_pow2
omg1_du = (3 + 2 * omega_BD)
omg_du = omg1_du * Omega_k_times_Phi
omg2_du = omega_BD * pi_times_Rho_m
duu = (
24 * pi_times_Rho_m * Phi_pow3_du
+ one_plus_z * u * Phi_pow2 * (8 * (-3 + omega_BD) * pi_times_Rho_m - one_plus_z_pow2_times_3_du * omg_du)
- one_plus_z_pow2_times_3_du * u_pow2 * Phi * (-4 * omg2_du + one_plus_z_pow4_du * omg_du)
- omega_BD * u_pow3 * (4 * one_plus_z_pow3_du * (pi_times_Rho_m + omg2_du) + one_plus_z_pow5_du * omg_du)
) / (
one_plus_z_pow2 * omg1_du * Phi_pow2 * (8 * pi_times_Rho_m + one_plus_z_pow2_times_3_du * Omega_k_times_Phi)
)
# duu 内联计算结束
val1 = (-16 * pi_times_Rho_m - 6 * one_plus_z_pow2 * Omega_k_times_Phi)
val = val1 / (6 * one_plus_z_times_u + (one_plus_z_pow2 * omega_BD * u_pow2) / Phi - Phi_times_6)
if val >= 0:
Phi_times_2 = Phi + Phi
val2 = (one_plus_z_pow2 * omega_BD * u_pow2 + 6 * (one_plus_z_times_u * Phi - Phi_pow2))
# 优化分子中的复杂项
term1_numerator = one_plus_z_pow2 * val1 * (omega_BD * u * (one_plus_z * u_pow2
- Phi_times_2 * (one_plus_z * duu + u)) - duu * Phi_pow2_times_6)
term2_numerator = Phi_times_6 * (-8 * pi_times_Rho_m + one_plus_z_pow2 * Omega_k * (one_plus_z_times_u + Phi_times_2)) * (Phi_pow2_times_6 - one_plus_z_times_u * (one_plus_z_times_u * omega_BD + Phi_times_6))
return (term1_numerator - term2_numerator) / (2 * one_plus_z * math.sqrt(val) * val2 * val2)
else:
return None
# 性能测试
t_original = timeit.timeit('dH_original(Rho_m, Phi, u, omega_以上就是PyMC模型中自定义对数似然的性能优化:兼论JAX兼容性与数学表达式重构的详细内容,更多请关注其它相关文章!
# 转换为
# 文档优化网站
# 福山网站推广团队
# 阳泉营销推广多少钱
# 海南品牌营销推广公司
# 九江一站式营销推广商家
# 揭阳网站优化电话多少
# 赤峰页面seo优化
# 东莞网站建设+信科网络
# 打印产品推广营销的方案
# 汽车方向盘推广营销
# 方法来
# 也能
# python
# 将其
# 采样器
# 重构
# 是一个
# 自定义
# 模拟器
# python函数
# 性能测试
# 后端
# app
# node
相关栏目:
【
科技资讯46185 】
【
网络学院92790 】
相关推荐:
vivo云服务网页版登录 怎么登录vivo云服务网页版
b站如何看历史记录_b站观看历史找回方法
解决Django多数据库/多Schema环境下外键迁移问题
在J*a项目里如何构建对象之间的契约_接口约束的实际落地
win11开机启动修复循环怎么办 Win11无法进入系统高级启动解决方法【修复】
2026春节假期时间安排 2026春节假日查询
J*aScriptWebpack优化_J*aScript构建工具实战
AO3网页版最新入口合集 Archive of Our Own在线访问指南
如何将HTML表格多行数据保存到Google Sheet
新三国志曹操传110级星符试炼夏侯渊极难攻略
Bing引擎入口最新2025 Bing搜索免费官方登录
Win10桌面图标出现小盾牌怎么办 Win10去除UAC图标教程【解决】
包子漫画官方网站阅读入口-包子漫画在线漫画官网直达链接
J*aScript实现单选按钮与关联输入框的联动禁用教程
Excel函数批量查找替换超快方法_Excel用REPLACE和FIND函数秒级替换
C++如何实现异步操作_C++11使用std::future和std::async进行异步编程
高德地图家和公司地址在哪设置 高德地图通勤路线设置方法【超详细】
如何在网页中实现特定地点的随机图片展示
极兔快递快件信息查询系统 极兔快递官网运单号追踪
微信网页版官方入口直达 微信网页版网页版登录使用方法
Vue.js 图片显示异常排查:理解应用挂载范围与DOM ID唯一性
圆通快递查询实时追踪 圆通物流包裹状态快速查看
HTML转PPT成品工具有哪些?HTML网页转PPT成品工具大全
C#使用XPath查询节点时出错? 常见语法错误与调试技巧
Composer的 archive 命令怎么用_快速打包你的PHP项目及其Composer依赖
J*a实现学校排课程序_面向对象结构化项目示例
Python异步编程实践:使用Binance API构建实时交易数据流
谷歌邮箱注册显示错误Gmail服务器异常与延迟处理
QQ网页版官方账号入口 QQ网页版网页版登录指南
Win10自动更新怎么关闭 Win10永久关闭系统更新的两种方法【终极版】
Win11怎么关闭快速启动_Win11彻底关机设置教程
Node.js CSV 数据处理:基于字段空值条件过滤整条记录的策略
将HTML Canvas内容转换为可上传的图像文件(File对象)
邮政快递包裹最新位置 邮政快递实时追踪入口
J*aScript数据结构转换:将对象数组按类别分组
从OpenAI API响应中高效提取生成文本
深入理解Google Cloud Datastore查询:祖先路径与数据一致性
天猫2025双十一0点秒杀攻略 天猫爆款抢购时间
AO3官方在线访问地址 Archive of Our Own最新镜像合集
抖音极速版最新版本 抖音极速版官方下载地址
如何仅使用CSS更改登录界面背景图像图标的颜色
Win11输入法不见了怎么办_Windows11恢复语言栏显示方法
TikTok国际版官网直达_TikTok国际版官网直达进入在线观看
Golang如何安装Swagger工具_GoSwagger文档生成环境
J*aScript中localStorage数据的获取、清洗与格式化教程
Win11怎么关闭触摸屏_Windows 11禁用HID符合标准触摸屏
QQ邮箱官方登录入口_QQ邮箱网页版快捷使用平台
msn官网入口地址手机版 msn官方网站手机最新链接
深入理解与实现最大堆的Heapify过程:常见错误与修正
CSS如何设置hover状态颜色_hover伪类调整背景或文字颜色


2025-11-19
浏览次数:次
返回列表
- Phi_times_2 * (one_plus_z * duu + u)) - duu * Phi_pow2_times_6)
term2_numerator = Phi_times_6 * (-8 * pi_times_Rho_m + one_plus_z_pow2 * Omega_k * (one_plus_z_times_u + Phi_times_2)) * (Phi_pow2_times_6 - one_plus_z_times_u * (one_plus_z_times_u * omega_BD + Phi_times_6))
return (term1_numerator - term2_numerator) / (2 * one_plus_z * math.sqrt(val) * val2 * val2)
else:
return None
# 性能测试
t_original = timeit.timeit('dH_original(Rho_m, Phi, u, omega_