一种基于多agent学习的电子市场智能定价方法

计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (15): 208-211.

一种基于多agent学习的电子市场智能定价方法

韩伟，王云，吕捷

南京财经大学信息工程学院，南京 210046

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-05-21 发布日期:2007-05-21
通讯作者: 韩伟

Pricing in marketplaces by multiagent learning

HAN Wei，WANG Yun，LV Jie

Information Science College，Nanjing University of Finance and Economics，Nanjing 210046，China

Received:1900-01-01 Revised:1900-01-01 Online:2007-05-21 Published:2007-05-21
Contact: HAN Wei

摘要/Abstract

摘要： B2B电子市场的定价问题是一个半学习半推理的连续决策过程，每个定价agent不是直接采用多agent学习算法下的均衡策略，而是根据博弈历史进行推理决策，并不断学习对手的策略。提出了基于内省推理方法的多agent环境下agent高效在线学习方法，将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来。仿真结果证实了算法在电子市场定价中的有效性。

关键词: 多agent系统, 在线学习, 内省推理, 电子市场

Abstract: The pricing problem in B2B electronic marketplaces is a continuous decision process，which can be seen as learning as well as inference.In stead of adopting the equilibrium policy，each pricing agent makes a decision by the pricing history of all agents.This paper proposes an efficient online learning algorithm，which integrates the observed objective behavior as well as the subjective inferential intention of the opponents.The algorithm is proven to be effective when it comes to the problem of seller’s pricing in electronic market.

Key words: multiagent, online-learning, internal inference, electronic market

韩伟，王云，吕捷. 一种基于多agent学习的电子市场智能定价方法[J]. 计算机工程与应用, 2007, 43(15): 208-211.

HAN Wei，WANG Yun，LV Jie. Pricing in marketplaces by multiagent learning[J]. Computer Engineering and Applications, 2007, 43(15): 208-211.

[1]	李义翠1，2，亓琳1，谭舒昆1，2. 结合PN约束在线半监督boosting目标跟踪算法[J]. 计算机工程与应用, 2017, 53(23): 129-134.
[2]	胡晓辉，李兰凤，方政，刘雪亮. 改进的任务分配策略在WSN中的应用研究[J]. 计算机工程与应用, 2017, 53(2): 124-128.
[3]	闫萌，刘建宾，郑丽伟. QueTy：支持时间边际效益的云服务协同框架[J]. 计算机工程与应用, 2017, 53(19): 86-97.
[4]	陈少淼1，李智勇1，杨波1，2，李彦武3. 云环境下超启发式能耗感知调度算法[J]. 计算机工程与应用, 2016, 52(2): 74-80.
[5]	吴盈，刘哲，陈恳，吉培培. 基于随机局部均值Hash特征的在线学习目标跟踪[J]. 计算机工程与应用, 2016, 52(14): 209-214.
[6]	戈军1，周莲英2. 面向交通信号的两层递阶控制解决方案[J]. 计算机工程与应用, 2015, 51(20): 246-252.
[7]	游生福，汪荣贵，戴经成，张冬梅. 自适应嵌套级联的在线集成学习方法研究[J]. 计算机工程与应用, 2014, 50(5): 169-174.
[8]	胡启祥，瞿心昱. 内部动机驱动的机器人未知环境在线自主学习[J]. 计算机工程与应用, 2014, 50(4): 110-113.
[9]	戴经成，汪荣贵，游生福，李想. 在线多示例学习目标跟踪方法研究[J]. 计算机工程与应用, 2014, 50(15): 129-135.
[10]	张敏，曾新苗，马长春. 一种基于簇的极限学习机的在线学习算法[J]. 计算机工程与应用, 2014, 50(11): 188-191.
[11]	刘建伟，李双成，罗雄麟. 基于正则化的乘更新在线分类算法[J]. 计算机工程与应用, 2012, 48(26): 53-59.
[12]	赵良辉，王天擎，陶雪萍. 以多Agent系统为架构的实时调度模型[J]. 计算机工程与应用, 2012, 48(13): 223-226.
[13]	杨怡1，王洪国1，邵增珍2，成照乾2. 基于任务能力排序的虚拟企业联盟生成方法[J]. 计算机工程与应用, 2011, 47(7): 229-232.
[14]	侯艳丽. 基于支持向量机和Q学习的移动机器人导航[J]. 计算机工程与应用, 2011, 47(23): 242-244.
[15]	韩伟1，宋柱芹2. 电子市场排污权交易的多智能体协商方法[J]. 计算机工程与应用, 2011, 47(2): 200-203.