蘑菇先生学习记


  • 首页

  • 分类

  • 关于

  • 归档

  • 标签

  • 搜索
蘑菇先生学习记

Representation Learning on Graphs

发表于 2019-12-04 | 分类于 推荐系统

本篇文章主要从一篇关于Graphs的表示学习的调研文章出发,介绍基于Graph表示学习的一个Encoder-Decoder框架,该框架可以启发关于Graph表示学习的研究切入点以及良好的编程实践。此外,本文还围绕目前主流的一些Graph Embedding或Graph Neural Networks方法,来探讨如何使用Encoder-Decoder框架来重新组织和提炼方法中的核心思想和核心步骤,这对于改进模型和编程实践有非常好的借鉴意义。

阅读全文 »
蘑菇先生学习记

Graph Convolutional Networks

发表于 2019-02-24 | 分类于 推荐系统

Graph Convolutional Networks图卷积网络涉及到两个重要的概念,Graph和Convolution。传统的卷积主要应用于Euclidean Structure的数据上(排列很整齐、Grid形式的),如图像、语句等,主要是因为欧式结构数据能够保证卷积的性质,即平移不变性,而Non-Euclidean无法保证平移不变性,通俗理解就是在拓扑图中每个顶点的相邻顶点数目都可能不同,那么当然无法用一个同样尺寸的卷积核来进行卷积运算。为了能够将卷积推广到Graph等Non-Euclidean数据上,GCN应运而生。那么GCN是如何将卷积推广到Graph上的呢?

阅读全文 »
蘑菇先生学习记

排序学习调研

发表于 2018-12-25 | 分类于 推荐系统

排序是对一组物品列表按照某种方式进行排序,来最大化整个列表的效用的过程,广泛应用于搜索引擎、推荐系统、机器翻译、对话系统甚至计算生物学。一些监督机器学习技术经常被广泛应用在这些问题中,这些技术称作排序学习技术。本文会对排序学习进行调研。

阅读全文 »
蘑菇先生学习记

推荐系统算法调研

发表于 2018-05-03 | 分类于 推荐系统

本文对目前流行的推荐系统算法进行调研,主要参考三篇综述和一本手册。综述包括:推荐系统主流算法综述、基于协同过滤技术的推荐系统算法综述、基于深度学习的推荐系统算法综述。手册是经典推荐系统参考手册。另外,还会不断跟进目前主流和前沿的推荐技术,本调研会不断更新。[2018.12.6号最新更新]

阅读全文 »
蘑菇先生学习记

Attention in Deep Learning

发表于 2019-01-06 | 分类于 自然语言处理

目前深度学习中热点之一就是注意力机制(Attention Mechanisms)。Attention源于人类视觉系统,当人类观察外界事物的时候,一般不会把事物当成一个整体去看,往往倾向于根据需要选择性的去获取被观察事物的某些重要部分,比如我们看到一个人时,往往先Attend到这个人的脸,然后再把不同区域的信息组合起来,形成一个对被观察事物的整体印象。同理,Attention Mechanisms可以帮助模型对输入的每个部分赋予不同的权重,抽取出更加关键及重要的信息,使模型做出更加准确的判断,同时不会对模型的计算和存储带来更大的开销,这也是Attention Mechanism应用如此广泛的原因,尤其在Seq2Seq模型中应用广泛,如机器翻译、语音识别、图像释义(Image Caption)等领域。Attention既简单,又可以赋予模型更强的辨别能力,还可以用于解释神经网络模型(例如机器翻译中输入和输出文字对齐、图像释义中文字和图像不同区域的关联程度)等。本文主要围绕核心的Attention机制以及Attention的变体展开。

阅读全文 »
蘑菇先生学习记

生成对抗网络

发表于 2019-07-04 | 分类于 深度学习

这篇文章是观看李宏毅老师Youtube上的GAN教学视频的笔记,主要涉及到对GAN的理解。

阅读全文 »
蘑菇先生学习记

LSTM+CRF for NER

发表于 2018-11-27 | 分类于 自然语言处理

LSTM+CRF NER

本文将借鉴论文《End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF》中的思路和方法实现命名实体识别。

阅读全文 »
蘑菇先生学习记

word2vec学习笔记

发表于 2018-10-05 | 分类于 自然语言处理

本文对word2vec中常见的CBOW(continuous bag-of-word)、 SG(Skip-Gram)模型进行总结,包括优化技术Hierachical Softmax和Negative Sampling。 word2vec模型学习到的词向量表示携带着丰富的语义信息,能够应用到NLP、推荐系统等多种应用的建模中。本文会系统的总结一下word2vec的方法,主要参考《word2vec Parameter Learning Explained》。

阅读全文 »
蘑菇先生学习记

Variational Inference:A Review for Statisticians读书笔记

发表于 2018-09-10 | 分类于 自然语言处理

现代统计学核心问题之一是近似复杂的概率密度。这个问题在贝叶斯统计中尤其重要。贝叶斯统计框架下,所有的推断问题都是要求未知变量的后验概率。而后验概率通常是很难计算的,因此需要相应的算法来近似它。本文主要是阅读David M.Blei 2018发表的论文《Variational Inference: A Review for Statisticians》后的笔记。主要总结其中3种变分推断情况以及对应的优化方法。

阅读全文 »
蘑菇先生学习记

变分推断应用示例

发表于 2018-09-08 | 分类于 自然语言处理

变分推断示例

本报告是论文《Scalable Recommendation with Poisson Factorization》变分推断的推导过程。

回顾

一般变分推断前,需要先看看通过后验估计能不能优化参数。正常步骤是先计算所有隐变量的后验概率,然后对后验概率取对数,看看对数形式的目标函数能不能通过简单的梯度下降等方式进行优化。但是,大部分情况下,后验概率形式很复杂,很难计算。其中一个原因是,后验概率的分母是关于样本的边缘概率密度,需要对隐变量积分,通常该积分很难计算,无法得到闭合解。因此需要使用近似推断。变分推断的目的是使用简单的分布来拟合复杂的分布(即隐变量的后验概率分布)。通过优化KL散度(等价于最大化ELBO)来求解该简单分布。

阅读全文 »
12…6
xuetf

xuetf

56 日志
10 分类
99 标签
RSS
链接
  • 小王子
  • My Github
© 2019 xuetf