当前位置:网站首页>ML18-自然语言处理
ML18-自然语言处理
2022-08-04 00:10:00 【十九岁的花季少女】
自然语言处理
用途
深度学习
深度学习的基础模型就是神经网络。根据模型进行优化,右边就是优化过程`。
为什么要进行深度学习。
相对于普通的机器学习算法来说,它具有下面这些优点。
语言模型
实例
存在问题
N-Gram模型
N的取值就是看这个词的出现依赖钱买你多少词。
第二个表格就是,当i出现时i,want,to…等出现的次数。,由此可以计算出第三个表格中的概率值
参数规模
词向量
相近意思的词用词向量表示应该也是相近的。
对于两种语言构建出来的词向量应该是类似的,右边是西班牙语。
神经网络模型
优势
因为词向量类似,所以会把这几个句子看所是一个句子将所有句子的出现次数加起来,看作是一个句子出现的次数。
Hierarchical Softmax
神经网络两种实现模型。
CBOW就是输入几个词(上下文)然后经过一系列层预测出当前这一个词是什么。
Kkip-gram正好相反,输入是当前这个词,然后预测他的上下文。
CBOW
哈夫曼树。可以将权值看作词语出现的次数。
构造过程。可以进行编码。
逻辑回归-sigmoid函数来决定走哪个分支。
CBOW
输入词向量(每个大小为m维),在投影层将n-1个m维向量合在一起,然后进行求和。
不断更新的是词向量和参数值。
输入上下文,希望得到足球这个结果的概率是最大的。假设往右走是正例,往左走是负例,想要达到足球,要经过负例、正例、正例和负例;然后将这些概率值乘起来。
CBOW求解目标
使用似然函数求解,为了好求结果,使用对数似然函数。使用参数上角标来判断是正例还是负例,d=0时,表示正例,那后面部分就为1。后边的化简就是log(a*b)=log(a)+log(b).
梯度上升
化简得到更新表达式。因为是梯度上升,所以每次加上一个步长。
负采样
边栏推荐
猜你喜欢
In V8 how arrays (with source code, picture and text easier to understand)
2022-08-03:以下go语言代码输出什么?A:2;B:3;C:1;D:0。 package main import “fmt“ func main() { slice := []i
第1章:初识数据库与MySQL----MySQL安装
LYVE1抗体丨Relia Tech LYVE1抗体解决方案
苹果对高通说:我4.45亿美元买下一个新园区,可能计划加快基带芯片自研
Install third-party packages via whl
Salesforce的中国区业务可能出现新变化,传言可能正在关闭
OpenCV 图像拼接
北京电竞元宇宙论坛活动顺利召开
"Miscellaneous" barcode by Excel as a string
随机推荐
POE交换机全方位解读(下)
FinClip, help smart TV more imagination
通过whl安装第三方包
免费的公共WiFi不要乱连,遭中间人攻击了吧?
vscode插件设置——Golang开发环境配置
OpenCV 图像拼接
【面经】被虐了之后,我翻烂了equals源码,总结如下
Install third-party packages via whl
建木DevOps流程的快速运用
2021年数据泄露成本报告解读
手撕Nacos源码,今日撕服务端源码
HNUCM 2022年暑假ACM搜索专项练习
internship:编写excel表的上传方法(导入)
【MySQL —— 索引】
伦敦银最新均线分析系统怎么操作?
小身材有大作用——光模块基础知识(一)
A simple understanding of TCP, learn how to shake hands, wave hands and various states
After building the pytorch environment, the pip and conda commands cannot be used
【性能优化】MySQL常用慢查询分析工具
win10+cuda11.7+pytorch1.12.0 installation