親の仕送り問題 <マルコフ決定過程>. 問題設定  春から下宿生活をすることになった K 君。  4月から親の仕送りを受ける。  収入・支出のデータをもとに、できるだ け親の負担の少ない仕送り計画を設定す る。

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
量子力学 第四章 力学量与算符. 第二章中,求 的平均值时,引入了算符概念: 将这一概念推广,得量子力学的第四个基本假定: * 任一力学量 A ,对应于一力学量算符 即, 那么: 1. 量子力学中算符的一般定义是什么? 2. 算符之间如何运算? 3. 与力学量 A 对应的算符 与数学上的一般算符有何异同?
Advertisements

古紙リサイクルのホントのところ とやま古紙再生サークル.
技术经济学 第四讲 主讲教师:刘玉国 学时: 16 学时. 第三章 资金的时间价值及等值计算  3.1 资金的时间价值  3.2 计算资金时间价值的基本方法  3.3 资金等值计算  3.4 几种常见的普通复利公式.
第四回レポートの講評.
装置詳細. AD 変換器のマニュアルを見てみよ う 入力チャンネル 入力チャンネル 4ch この AD 変換器は、本来四つの信号を読む ことが出来る.
高エネルギー実験の紹介.
データ収集. 正弦波のデータ 今、正弦波のデータ になっているはずで す。 6、7秒程度、正弦 波のデータの取りま しょう.
光の三原色 色材の三原色.
最新計算機概論 第4章 數位邏輯設計.
結構學(一) 第五次作業 97/04/24.
實驗一、電晶體頻率響應(一) 共射極(CE)電路的頻率響應
實驗三、電晶體頻率響應(二) 共集極(CC)放大器的頻率響應
关于经典磁化率模型的完整表示与推广 物理二班 张中扬 PB
实验四 常用电子仪器的使用 一. 实验目的 1. 了解示波器的工作原理。 2. 初步掌握示波器的正确使用方法。练习 正确实用示波器,信号源及交流毫伏表。
需要予測.
Jung-Sheng Fu, DEE, NUU, ROC.1 實驗五 : 名稱:導熱係數. 第二章 變數、常數、運算子和運算式 物理實驗 Jung-Sheng Fu, DEE, NUU, ROC2 目的: 瞭解熱傳導特性,測量導熱系數。
第6章:集成DAC和ADC的原理与组成 §6-1 集成数模转换器(DAC) §6-2 集成模数转换器(ADC) §6-3 应用举例
: Problem B: Rocket Stages ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11502: Problem B: Rocket Stages 解題者:李重儀 解題日期: 2008 年 10 月 5 日 題意:簡單的說,題目會給你一個火箭的各個.
最新計算機概論 第4章 數位邏輯設計.
填料吸收塔的操作 及 吸收传质系数的测定 主讲教师:.
3 次元数値シミュレーション コードの設計 花輪 知幸. 数値シミュレーションによる研 究 モデルの設定 – 微分方程式 – 境界条件・初期条件 数値計算 – 計算コードの作成 – 実行 – データ解析 論文作成.
生物化学实验之五 枯草芽孢杆菌蛋白酶活力的测定 食品与生物工程学院 王章存.
第三章 效用论与消费者行为理论 消费者行为是指人们为满足自己的欲望,而利用物 品效用的一种经济行为。 消费者行为理论研究消费者在市场上如何做出购买 决策进行购买活动。 消费者是指能够做出统一的消费决策的家庭或居民 户,而无论家庭中的人数多少。 消费者行为理论的假定前提: 1 、消费者行为是有理性的,即消费者总是通过深思熟.
第四讲 核与粒子的非点结构 4.1 基本研究方法 4.2 类点粒子弹性散射的微分截面 4.3形状因子和核素的电荷分布
計算の理論 I -大レポート解答 - 月曜3校時 大月 美佳. 課題 正則表現 (01+10)* について 1. これと等価な ε- 動作を含む NFA を求めよ。 (導出過程、状態遷移図および定義式を書け) 2. 1 の ε- 動作を含む NFA と等価な NFA を求めよ。 (導出過程、状態遷移図および定義式を書け)
平成 16 年新潟県中越地震による斜面災 害緊急シンポジウム 1 中越地震の震源及び内陸地震 の発生予測 東京大学地震研究所 東京大学地震研究所平田 直 謝辞:本調査研究は科学研究費補助金(特別研究促進費) 「 2004 年新潟県中越地震の余震に関する調査研究」の補助を受 けています。 一部の研究は、科学技術振興調整費・緊急研究「平成.
6.5 数字高通、带通和带阻 滤波器的设计. 设计思路  我们已经学习了模拟低通滤波器的设计方法,以 及基于模拟滤波器的频率变换设计模拟高通、带 通和带阻滤波器的方法。对于数字高通、低通和 带阻的设计,可以借助于模拟滤波器的频率变换 设计一个所需类型的模拟滤波器,再通过双线性 变换将其转换成所需类型的数字滤波器,例如高.
第 5 章第 5 章 機率論與機率分配. 5-1 機率定義的確立 (1/2)  隨機實驗 1. 每次試驗中可能出現的結果,不止一種情況, 但出現的情況是已知的 2. 一次只會出現其中一種結果,但在未真正試驗 之前,無法確知那種情況會發生 3. 試驗可在相同的情況下,重複進行  出像:係指試驗所有可能出現的情況.
第八讲 2.6 利用Z变换分析信号和系统的频域特性.
实验五 简单正弦交流电路的研究 一、实验目的 1. 研究正弦交流电路中电压、电流的大小与 相位的关系。 2. 了解阻抗随频率变化的关系。 3. 学会三压法测量及计算相位差角。 4. 学习取样电阻法测量交流电流的方法。 二、实验原理说明 ( 略 )
核 磁 共 振 兰州理工大学物理实验室.
1. 2 第一节 成形工艺中的冶金反应特点 3 液态成形的化学冶金过程主要发生在金属的熔炼阶 段。主要的物理化学反应为金属的氧化、金属的脱 磷、脱碳、脱氧、脱硫和合金化等。 金属熔炼过程中温度较低,约在 1600 ℃以下。温度 变化范围不大,液态金属的体积较大,熔炼时间较 长,冶金反应进行的较充分和完全,可采用物理化.
財務工程 呂瑞秋著 1 第八章 債券衍生性商品的評價 無套利模型. 財務工程 呂瑞秋著 2 無套利模型與均衡模型 均衡模型是由即期的無風險利率過程設定 開始,零息債券價格與其過程是該模型下 的產物 (output) 無套利模型是由零息債券價格過程設定開 始,零息債券價格與其過程是該模型的投 入因子.
實驗五、電晶體共集極放大電路 雙電源電路測試
傳統閉迴路控制系統 控制器致動器 ( 馬達 ) 過程 ( 手臂 ) 感測器 設定點受控結果 誤差 比較器.
平成 16 年 6 月 15 日佐賀大学知能情報システム学科 1 計算の理論 I 正則表現と FA との等価性 火曜3校時 大月 美佳.
疑难解析 受控源.
1 第 8 章 数字信号的最佳接收 8.1 数字信号接收的统计表述 8.2 最佳接收的准则 8.3 最佳接收机的抗干扰性能.
實驗二、電晶體頻率響應(二) 共基極(CB)放大器的頻率響應
第七章 配位滴定法 第一节 配位滴定法概述 利用配位反应进行滴定分析的方法,称为配位滴定法。它是用配位剂作为标准溶液直接或间接滴定被测物质,并选用适当的指示剂指示滴定终点。
結構學(一) 第二次作業.
第14章 迴歸分析與複迴歸分析  本章的學習主題  1.使用迴歸分析的時機 2.最小平方法在迴歸分析上的意義 3.迴歸分析的假設
第三章 歐式股票選擇權的評價 Black and Scholes的模型 財務工程 呂瑞秋著.
习 题 精 解 2-1 试判断下列各电路图对正弦交流电压信 号有无放大作用?为什么?. 习 题 精 解 解: 无放大作用,因为 电源 Vcc 极性不对。 无放大作用,因为无 基极偏置电流。
プログラミング言語論 第7回 関数型言語 担当:犬塚 (第6回は欠番).
实验一 基本电工仪表及测量误差 一、实验目的 1. 熟悉基本电工仪表的种类。 2. 了解万用表的种类及主要技术 指标。 3. 万用表内阻对测量结果的影响。
實驗四、電晶體共基極放大電路.
化學技術實習(二) 表面化學技術篇 讀萬卷書 與 行萬里路 張基昇.
MHD数値シミュレーションの基礎 ニュートン流体力学方程式 (ニュートン)磁気流体力学方程式 相対論的流体力学方程式
課程: 組織行為 飛鷹計劃 指導教授:徐強.
實驗六、電晶體共集極放大電路 截止偏壓電路測試.  了解電晶體共集極放大電路之原理。  了解共集極電路作為阻抗轉換之原理。  了解電晶體推挽式放大電路的基本原理。 實驗目的.
Source: 楊志良,健康保險, Ch 4,pp
民意調查的抽樣 蔡佳泓 政大選舉研究中心 副研究員.
統計學複習0508.
結構學(一) 第一次作業.
● 以机械能衡算方程为基础的测定方法,应用公式: 1.6 流速和流量测定 ● 流体的速度和流量测定是一个重要的测量参数; ● 测量用的方法和流量计的种类很多。
計算の理論 I ー正則表現と FA の等価性 その 2 ー 月曜3校時 大月 美佳. 連絡事項  自転車がまだ散乱してますね.
交流电枢绕组的磁动势 重点讨论的问题: 要求: 单相绕组磁动势——脉振磁动势 三相绕组合成磁动势——旋转磁动势
結構學(一) 第三次作業 97/03/27.
第三章 效用论与消费者行为理论 消费者行为是指人们为满足自己的欲望,而利用物 品效用的一种经济行为。 消费者行为理论研究消费者在市场上如何做出购买 决策进行购买活动。 消费者是指能够做出统一的消费决策的家庭或居民 户,而无论家庭中的人数多少。 消费者行为理论的假定前提: 1 、消费者行为是有理性的,即消费者总是通过深思熟.
實驗六 反應熱的測定.
§7-3 检波器 学习要点: 掌握检波原理及检波器的构成 了解几种检波器的特点和适用范围 掌握大信号峰值检波器的惰性失真及 负峰切割失真.
实验四 质粒的电泳检测和酶切.
第五节 刚体的转动 掌握:角速度、角加速度、转动定律、角动量守恒定律 第一章 力学基本定律 理解:角动量、转动惯量.
SOUTHWESTJIAOTONG UNIVERSITY 学生个性化创新型实验 高 芳 清 基于桥梁结构静、动力行为的 西南交通大学力学实验教学中心.
第二节 钢在冷却时的转变 一、过冷奥氏体的等温冷却转变
能源消费水平的高低,是衡量一个国 家在一定时期内经济技术发展水平的重要 标志。 第 九 章能 源 化 学第 九 章能 源 化 学 第 九 章能 源 化 学第 九 章能 源 化 学.
Hippocrates Ἱπποκράτης.
3N 12h 9h 8h 11h 10h -20° -10° 0° +10° +20o +30° +40° 7h 6h 5h 4h +20°
総研セミナー開催案内 第59回 下記のとおり「総研セミナー」を開催いたします。
Μεταγράφημα παρουσίασης:

親の仕送り問題 <マルコフ決定過程>

問題設定  春から下宿生活をすることになった K 君。  4月から親の仕送りを受ける。  収入・支出のデータをもとに、できるだ け親の負担の少ない仕送り計画を設定す る。

 収入例 : 仕送り、バイト代、奨学金 etc  支出例 : 生活費、家賃、授業料 etc  支出例 : 生活費、家賃、授業料 etc  授業料の支払い以外を確率的に変動するも のとみなす。  学生ローン: 金利 100r L % / 週 上限 10万円 c(x,y) : 学生ローンの金利負担分 c(x,y) : 学生ローンの金利負担分

 第t月の月初めの預金残高( X t )に応 じて その月の仕送り額( Y t )を決定 し、 第1週末までに送ってもらう。 →X t 所与のもとで、 Y t の確率分布が示さ れる(マルコフ決定過程)。

授業料をふくめた家計負担の期待値(5. 12) Σ [ E { Y t } / (1+r) 4t-3 Σ [ E { Y t } / (1+r) 4t-3 + E { c( X t 、 Y t ) } / (1+r) 4t- 3 ] + E { c( X t 、 Y t ) } / (1+r) 4t- 3 ] +200,000 / (1+r) + … +200,000 / (1+r) + … ∞ t =1

線形計画問題 (5.13) 最小化 最小化 Σ [ E {Y t } / (1+r) 4t-3 Σ [ E {Y t } / (1+r) 4t-3 + E { c( X t 、 Y t ) } / (1+ r) 4t-3 ] + E { c( X t 、 Y t ) } / (1+ r) 4t-3 ] 条件 条件 Y t ; X t 所与のもとである 確率分布 として与え られる Y t ; X t 所与のもとである 確率分布 として与え られる ∞ t=1t=1t=1t=1

 β =(1+r) -4  β =(1+r) -4  c ij = y j + c( x i, y j )  z ij = Σ(1+ r )³ ・ β t ・ P { X t = x i, Y t = y j }  P ijk = P { X t+1 = x k | X t = x i, Y t = y j } 1 ij { X t,Y t } = 1, X t = x i, Y t = y j のとき 1 ij { X t,Y t } = 1, X t = x i, Y t = y j のとき 0, それ以外 0, それ以外 ∞ t=1

( 目的関数の変形 ) ( 目的関数の変形 ) = Σ Σ Σ (1+r) ³ ・ β t ・ c ij = Σ Σ Σ (1+r) ³ ・ β t ・ c ij ・ P { X t = x i,Y t = y j } ・ P { X t = x i,Y t = y j } = Σ Σ c ij ・ z ij (5.15) = Σ Σ c ij ・ z ij (5.15) t=1 ∞ i∈Ii∈Ii∈Ii∈I j ∈ Ji i∈Ii∈Ii∈Ii∈I j ∈ Jk

 Σz kj = Σ Σ(1+r) ³ ・ β t ・ P { X t = x k, Y t = y j } = Σ Σ ・ β ・ P ijk ・ z ij + (1+r) ・ P{ X 1 = x k } よって Σz kj ー ΣΣβ ・ P ijk ・ z ij (5.17) よって Σz kj ー ΣΣβ ・ P ijk ・ z ij (5.17) = (1+r), x k = 0 のとき (k  I ) = (1+r), x k = 0 のとき (k  I ) 0 それ以外 0 それ以外 jJkjJkjJkjJk jJkjJkjJkjJk iIiIiIiI jJijJijJijJi iIiIiIiI jJijJijJijJi t=1 ∞ iIiIiIiI

線形計画問題(5.18)  最小化 Σ Σ c ij ・ z ij  条件 Σ z kj ー Σ Σ β ・ P ijk ・ z ij = (1+r), x k = 0 のとき ( k  I) = (1+r), x k = 0 のとき ( k  I) 0 それ以外 0 それ以外 z ij  0, j  J i, I  I z ij  0, j  J i, I  I ⇒最適解{ z ij *| j  J i, i  I } ⇒最適解{ z ij *| j  J i, i  I } iIiIiIiI j  Ji j  Jk iIiIiIiI j  Ji

定理  実行可能基底解の中から最適解が選ばれ る  問題(5.18)の最適解は、定常かつ純 粋な仕送り計画 Y t = F*(X t ) に対応。

 Y t = F*(X t ) のもとでの {X t |t  1 } の ①推移確率 ①推移確率 P i k * =P{X t+1 = x k |X t =x i,Y t =F * (x i )} P i k * =P{X t+1 = x k |X t =x i,Y t =F * (x i )} ②状態確率 π i * (t)=P{X t = x i } π i * (t)=P{X t = x i } →π k * (t+I)=Σπ i * (t) ・ P ik * (5. 20) →π k * (t+I)=Σπ i * (t) ・ P ik * (5. 20) IiIIiI

 t→∞ π k * =Σπ i * ・ P ik *,k  I π k * =Σπ i * ・ P ik *,k  I Σπ i * =1 (5.21) Σπ i * =1 (5.21) iIiI

rLrLrLrL

 Y t = F*(X t ) のもとでの {Y t |t  1 } の 状態確率 状態確率 ρ j * (t)=P{F * (X t )=y j }=P{X t  F *-1 (y j )} (5. 19) ρ j * (t)=P{F * (X t )=y j }=P{X t  F *-1 (y j )} (5. 19) 仕送り額の定常分布{ ρ j * }は(5.21) より ρ j * =Σπ i * (5.22) ρ j * =Σπ i * (5.22) ( A j * ={i  I|x i  F *-1 (y j ) ) ( A j * ={i  I|x i  F *-1 (y j ) ) iAj*iAj*

rLrLrLrL

問題の最適解 rLrLrLrL (x i, y j ) z ij 0.001(0,0) (-20,000, 10,000) (-30,000, 0) (-40,000, 20,000) (-50,000, 30,000) (-60,000, 40,000) (-70,000, 40,000) (-80,000, 40,000) (-90,000, 70,000)

(-100,000, 90,000) (30,000, 20,000) (0, 50,000) (-10,000, 60,000) (40,000, 20,000) (0, 60,000)