您的位置: 专家智库 > >

邹昊

作品数:5 被引量:3H指数:1
供职机构:清华大学更多>>
相关领域:自动化与计算机技术经济管理文化科学更多>>

合作作者

文献类型

  • 4篇中文专利

领域

  • 1篇文化科学

主题

  • 4篇加权
  • 2篇低维
  • 2篇因果推断
  • 2篇数据点
  • 2篇数据分布
  • 2篇最小化
  • 2篇离线
  • 2篇离线数据
  • 2篇刻画
  • 2篇混淆
  • 2篇机器学习技术
  • 2篇加权平均
  • 2篇观测数据

机构

  • 4篇清华大学

作者

  • 4篇崔鹏
  • 4篇邹昊

年份

  • 1篇2024
  • 1篇2022
  • 1篇2020
  • 1篇2019
5 条 记 录,以下是 1-4
排序方式:
基于离线数据的策略评估方法及装置
本发明公开了一种基于离线数据的策略评估方法及装置,其中,该方法包括:获取多个行为组和待评估策略,通过估计每个行为组在待评估策略作用下的数据分布矩以作为目标分布矩;对每个行为组进行加权,并为加权后的每个行为组施加待评估策略...
崔鹏邹昊
文献传递
一种关于集合类型决策效果的反事实预测方法
本发明提出一种关于集合类型决策效果的反事实预测方法,属于机器学习技术领域。本发明将决策变量与混淆变量去相关问题转化为更低维度的决策变量隐表征和混淆变量去相关问题,采用基于深度神经网络的概率密度比估计方法,将观测数据样本对...
崔鹏邹昊
一种关于集合类型决策效果的反事实预测方法
本发明提出一种关于集合类型决策效果的反事实预测方法,属于机器学习技术领域。本发明将决策变量与混淆变量去相关问题转化为更低维度的决策变量隐表征和混淆变量去相关问题,采用基于深度神经网络的概率密度比估计方法,将观测数据样本对...
崔鹏邹昊
文献传递
基于离线数据的策略评估方法及装置
本发明公开了一种基于离线数据的策略评估方法及装置,其中,该方法包括:获取多个行为组和待评估策略,通过估计每个行为组在待评估策略作用下的数据分布矩以作为目标分布矩;对每个行为组进行加权,并为加权后的每个行为组施加待评估策略...
崔鹏邹昊
共1页<1>
聚类工具0