• Produktbild: Statistical Reinforcement Learning
  • Produktbild: Statistical Reinforcement Learning

Statistical Reinforcement Learning Modern Machine Learning Approaches

136,99 €

inkl. gesetzl. MwSt., Versandkostenfrei


Beschreibung

Produktdetails

Einband

Gebundene Ausgabe

Erscheinungsdatum

16.03.2015

Abbildungen

schwarz-weiss Illustrationen, Tabellen, schwarz-weiss

Verlag

Taylor and Francis

Seitenzahl

206

Maße (L/B/H)

24/16,1/1,6 cm

Gewicht

340 g

Sprache

Englisch

ISBN

978-1-4398-5689-5

Beschreibung

Produktdetails

Einband

Gebundene Ausgabe

Erscheinungsdatum

16.03.2015

Abbildungen

schwarz-weiss Illustrationen, Tabellen, schwarz-weiss

Verlag

Taylor and Francis

Seitenzahl

206

Maße (L/B/H)

24/16,1/1,6 cm

Gewicht

340 g

Sprache

Englisch

ISBN

978-1-4398-5689-5

Herstelleradresse

Libri GmbH
Europaallee 1
36244 Bad Hersfeld
DE

Email: gpsr@libri.de

Kundinnen und Kunden meinen

0 Bewertungen

Informationen zu Bewertungen

Zur Abgabe einer Bewertung ist eine Anmeldung im Konto notwendig. Die Authentizität der Bewertungen wird von uns nicht überprüft. Wir behalten uns vor, Bewertungstexte, die unseren Richtlinien widersprechen, entsprechend zu kürzen oder zu löschen.

Die Bewertungen sind nach Format, Anzahl Sterne und Datum sortiert.

Verfassen Sie die erste Bewertung zu diesem Artikel

Helfen Sie anderen Kund*innen durch Ihre Meinung

Kundinnen und Kunden meinen

0 Bewertungen filtern

Die Leseprobe wird geladen.
  • Produktbild: Statistical Reinforcement Learning
  • Produktbild: Statistical Reinforcement Learning
  • Introduction to Reinforcement LearningReinforcement LearningMathematical FormulationStructure of the Book Model-Free Policy Iteration Model-Free Policy Search Model-Based Reinforcement LearningMODEL-FREE POLICY ITERATIONPolicy Iteration with Value Function ApproximationValue Functions State Value Functions State-Action Value FunctionsLeast-Squares Policy Iteration Immediate-Reward Regression Algorithm Regularization Model SelectionRemarksBasis Design for Value Function ApproximationGaussian Kernels on Graphs MDP-Induced Graph Ordinary Gaussian Kernels Geodesic Gaussian KernelsExtension to Continuous State SpacesIllustration Setup Geodesic Gaussian Kernels Ordinary Gaussian Kernels Graph-Laplacian Eigenbases Diffusion WaveletsNumerical Examples Robot-Arm Control Robot-Agent NavigationRemarksSample Reuse in Policy Iteration FormulationOff-Policy Value Function Approximation Episodic Importance Weighting Per-Decision Importance Weighting Adaptive Per-Decision Importance Weighting IllustrationAutomatic Selection of Flattening Parameter Importance-Weighted Cross-Validation IllustrationSample-Reuse Policy Iteration Algorithm IllustrationNumerical Examples Inverted Pendulum Mountain Car RemarksActive Learning in Policy IterationEfficient Exploration with Active Learning Problem Setup Decomposition of Generalization Error Estimation of Generalization Error Designing Sampling Policies IllustrationActive Policy Iteration Sample-Reuse Policy Iteration with Active Learning IllustrationNumerical ExamplesRemarksRobust Policy IterationRobustness and Reliability in Policy Iteration Robustness ReliabilityLeast Absolute Policy Iteration Algorithm Illustration PropertiesNumerical ExamplesPossible Extensions Huber Loss Pinball Loss Deadzone-Linear Loss Chebyshev Approximation Conditional Value-At-RiskRemarksMODEL-FREE POLICY SEARCH Direct Policy Search by Gradient Ascent FormulationGradient Approach Gradient Ascent Baseline Subtraction for Variance Reduction Variance Analysis of Gradient EstimatorsNatural Gradient Approach Natural Gradient Ascent IllustrationApplication in Computer Graphics: Artist Agent Sumie Paining Design of States, Actions, and Immediate Rewards Experimental ResultsRemarksDirect Policy Search by Expectation-Maximization Expectation-Maximization ApproachSample Reuse Episodic Importance Weighting Per-Decision Importance Weight Adaptive Per-Decision Importance Weighting Automatic Selection of Flattening Parameter Reward-Weighted Regression with Sample ReuseNumerical ExamplesRemarksPolicy-Prior SearchFormulationPolicy Gradients with Parameter-Based Exploration Policy-Prior Gradient Ascent Baseline Subtraction for Variance Reduction Variance Analysis of Gradient Estimators Numerical ExamplesSample Reuse in Policy-Prior Search Importance Weighting Variance Reduction by Baseline Subtraction Numerical ExamplesRemarksMODEL-BASED REINFORCEMENT LEARNING Transition Model EstimationConditional Density Estimation Regression-Based Approach Q-Neighbor Kernel Density Estimation Least-Squares Conditional Density EstimationModel-Based Reinforcement LearningNumerical Examples Continuous Chain Walk Humanoid Robot ControlRemarksDimensionality Reduction for Transition Model Estimation Sufficient Dimensionality ReductionSquared-Loss Conditional Entropy Conditional Independence Dimensionality Reduction with SCE Relation to Squared-Loss Mutual InformationNumerical Examples Artificial and Benchmark Datasets Humanoid RobotRemarksReferences Index