Dynamic programming subject to total variation distance ambiguity

Tzortzis, I.; Charalambous, Charalambos D.; Charalambous, T.

doi:10.1137/140955707

dc.contributor.author	Tzortzis, I.	en
dc.contributor.author	Charalambous, Charalambos D.	en
dc.contributor.author	Charalambous, T.	en
dc.creator	Tzortzis, I.	en
dc.creator	Charalambous, Charalambos D.	en
dc.creator	Charalambous, T.	en
dc.date.accessioned	2019-04-08T07:48:35Z
dc.date.available	2019-04-08T07:48:35Z
dc.date.issued	2015
dc.identifier.uri	http://gnosis.library.ucy.ac.cy/handle/7/45020
dc.description.abstract	The aim of this paper is to address optimality of stochastic control strategies via dynamic programming subject to total variation distance ambiguity on the conditional distribution of the controlled process. We formulate the stochastic control problem using minimax theory, in which the control minimizes the payoff while the conditional distribution, from the total variation distance set, maximizes it. First, we investigate the maximization of a linear functional on the space of probability measures on abstract spaces, among those probability measures which are within a total variation distance from a nominal probability measure, and then we give the maximizing probability measure in closed form. Second, we utilize the solution of the maximization to solve minimax stochastic control with deterministic control strategies, under a Markovian and a non-Markovian assumption, on the conditional distributions of the controlled process. The results of this part include (1) minimax optimization subject to total variation distance ambiguity constraint; (2) new dynamic programming recursions, which involve the oscillator seminorm of the value function, in addition to the standard terms; and (3) a new infinite horizon discounted dynamic programming equation, the associated contractive property, and a new policy iteration algorithm. Finally, we provide illustrative examples for both the finite and infinite horizon cases. For the infinite horizon case, we invoke the new policy iteration algorithm to compute the optimal strategies. © 2015 Society for Industrial and Applied Mathematics.	en
dc.source	SIAM Journal on Control and Optimization	en
dc.source.uri	https://www.scopus.com/inward/record.uri?eid=2-s2.0-84940707638&doi=10.1137%2f140955707&partnerID=40&md5=73803b41c95562de2494a008060b05ee
dc.subject	Optimization	en
dc.subject	Dynamic programming	en
dc.subject	Algorithms	en
dc.subject	Iterative methods	en
dc.subject	Probability	en
dc.subject	Stochastic control systems	en
dc.subject	Stochastic systems	en
dc.subject	Dynamic programming equations	en
dc.subject	Stochastic control	en
dc.subject	Conditional distribution	en
dc.subject	Process control	en
dc.subject	Minimax	en
dc.subject	Probability measures	en
dc.subject	Variational distance	en
dc.subject	Policy iteration algorithms	en
dc.subject	Minimax optimization	en
dc.subject	Total variational distance	en
dc.title	Dynamic programming subject to total variation distance ambiguity	en
dc.type	info:eu-repo/semantics/article
dc.identifier.doi	10.1137/140955707
dc.description.volume	53
dc.description.issue	4
dc.description.startingpage	2040
dc.description.endingpage	2075
dc.author.faculty	Πολυτεχνική Σχολή / Faculty of Engineering
dc.author.department	Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών / Department of Electrical and Computer Engineering
dc.type.uhtype	Article	en
dc.source.abbreviation	SIAM J Control Optim	en
dc.contributor.orcid	Charalambous, Charalambos D. [0000-0002-2168-0231]
dc.gnosis.orcid	0000-0002-2168-0231

Files in this item

Files	Size	Format	View
There are no files associated with this item.

This item appears in the following Collection(s)

Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών / Department of Electrical and Computer Engineering [2897]

Show simple item record