chongjg's Blog

Seize the day and live it to the full.

《强化学习》学习笔记(二)

记录新思想

《强化学习》学习笔记(二) 第二部分 表格型近似求解方法 在第二部分,会将第一部分的表格型方法扩展到拥有任意大的状态空间的问题上 在这种情况下,目标不是找到最优策略或最优价值函数,而是使用有限的计算资源找到一个比较好的近似解 第九章:预测问题,给定策略,去逼近其价值函数 第十章:控制问题,介绍最优策略的近似 第十一章:对离轨策略进行函数逼近 第十二章:资格迹 ...

《强化学习》学习笔记(一)

记录新思想

《强化学习》学习笔记(一) Chap 1. 导论 强化学习的基本思想 在智能体为了实现目标而不断与环境产生交互的过程中,抓住智能体所面对的真实问题的主要方面。 具备学习能力的智能体必须能够在某种程度上感知环境的状态,然后采取动作影响环境状态。 智能体必须同时拥有和环境状态相关的一个或多个明确的目标。 马尔科夫决策过程...

信息论基础学习笔记

记录新思想

《信息论基础》(《Elements of Information Theory》second edition) 信息论基础学习笔记 对

线性代数网课笔记

记录新思想

网易公开课链接 MIT线性代数网课笔记 对于方程组(Lecture #1) \[\mathbf A \mathbf x=\mathbf b\] $\textbf A$为$N\times N$矩阵,$\textbf{x,b}$均为$N$维列向量 如果从行来看,每一个方程代表了一个超平面,这个方程组就是要求解$N$个超平面...

NNDL&机器学习笔记

记录新思想

NNDL《神经网络与深度学习》及西瓜书《机器学习》笔记 B站网课链接 书、课件等 NNDL&机器学习笔记 NNDL《神经网络与深度学习》 学生提问 ==为什么要使用logistic函数(而不是其他函数)进行分类?==(第三章提问) ==为什么正则化不约束bia...

新阶段新flag

三年计划

距离上一次更新差不多过去一年了,xs 感觉自己不太适合写博客hhh 那就不写技术博客了 就搞个简简单单的生活记录吧~ 时间真的过得很快 转眼就毕业,转眼就开学了 想一想大四下加上暑假 毕业设计、创业初尝试,好像也就这样 创业篇 上个学期结束实习之后还想着要好好学数学英语 结果被拉着去搞了几个月创业 也算是投入了很多精力 但是越是到后期 越是感到一种无力感 现在...

计算机功能配置记录

功能配置

linux下安装正版Matlab(no gui) 下载matlab iso镜像(官网好像需要管理员才能下?这里可以直接网上找资源),挂载/7z解压 编辑installer_input.txt,设置如下 destinationFolder=/usr/local/R2021b fileInstallationKey=...

矩阵求导术

矩阵求导基础

矩阵求导 定义:分子布局与分母布局 令$x,y$表示标量,$\mathbf {x,y}$表示向量,$\mathbf {X,Y}$表示矩阵。   分子布局 分母布局 标量$y\in \mathbb R$对向量$\mathbf x\in \mathbb R^M$求导 $\frac{...

Mathmatic

记录一些不太显然的数学理解

(不定时更新) 下面部分推导是博主自己的理解,如有错误欢迎指正。 矩阵求导 不相容线性方程最小二乘法 关于n元高斯分布的一些理解 前言 \[\begin{align} X&\sim \mathcal N(0,\sigma_X^2)\\ Y&=\frac{X}{\sigma_X}\sim\mathcal N(0,1)\\ f(x)&=\frac{1}...

保研记

现在开始就是准研究生啦!

先吐槽一句,2020年真是魔幻的一年。 作为一个究极大浪逼,英语没过六级,夏令营外校全挂,最后预推免成功上岸复旦属实运气好。 本来还想着记录一下自己的脑残保研之路,也好好回顾一下本科前三年的学习生活。 但仔细想想,也没有太多好回顾的了。无非就是浪费了好多时间,痛心疾首,很后悔,当事人现在就是非常后悔。 ...