本文共 186 字,大约阅读时间需要 1 分钟。
第一页纸定义了损失函数的样子, theta, X 和 y 的 shape, 以及最终的损失函数向量表现形式.
第二页纸抄上了几个要用到的矩阵求导公式,以及推导过程和结果.
转载地址:http://yfulf.baihongyu.com/