当前位置:网站首页>SAKT方法部分介绍
SAKT方法部分介绍
2022-07-07 12:12:00 【多尝试多记录多积累】
网络架构和嵌入解释:
SAKT网络: 在每个时间戳处,仅对前面的每个元素估计注意权重。键、值和查询是从如下所示的嵌入层中提取的。当第j个元素为查询元素且第i个元素为关键元素时,注意权重为 a i j a_{ij} aij。
嵌入层: 嵌入学生正在尝试的当前练习和他过去的交互。在每次标记 t + 1 t+1 t+1 时,使用练习嵌入将当前问题 e t + 1 e_{t+1} et+1 嵌入到查询空间中,使用交互嵌入将过去交互的元素 x t x_t xt 嵌入到键和值空间中。
方法详细介绍:
模型目的: 根据学生1到 t 时刻 的习题作答情况,(即交互序列 X = x 1 , x 2 , . . . , x t X = x_1, x_2, ..., x_t X=x1,x2,...,xt,) 预测在 t + 1 t+1 t+1 时刻,习题 e t + 1 e_{t+1} et+1的回答情况(即预测出真实情况,正确的概率)。
交互元组: x t = ( e t , r t ) x_t = ( e_t, r_t) xt=(et,rt) : t t t 时刻习题 e t e_t et 的作答情况 r t r_t rt构成的。 x t x_t xt编号化时,用两者来表示,: y t = e t + r t × E y_t = e_t + r_t × E yt=et+rt×E , E E E是题目数量,可以看出交互编号,回答错误 时和题目编号同 y t = e t y_t = e_t yt=et,回答正确时,编号加上题目总数 y t = e t + E y_t = e_t + E yt=et+E。
嵌入层描述:
交互序列需要划分处理,保证所以的交互序列的长度一致,多则截断,短则填充。
因此交互序列由 y = ( y 1 , y 2 , . . . , y t ) y = (y_1, y_2, ...,y_t) y=(y1,y2,...,yt)变为 s = ( s 1 , s 2 , . . . , s n ) s = (s_1,s_2,...,s_n) s=(s1,s2,...,sn)。
训练一个交互嵌入矩阵 : M ∈ R 2 E × d M ∈ R^{2E×d} M∈R2E×d,其中 d 是潜在维度,用于获取交互嵌入。 s i s_i si的嵌入表示为 M s i M_{s_i} Msi
训练一个练习嵌入矩阵: E ∈ R E × d E ∈ R^{E×d} E∈RE×d, 用户获取练习嵌入。 e i e_i ei的嵌入表示为 E e i E_{e_i} Eei
位置编码:
为了对序列顺序进行编码,引入参数 P ∈ R n × d P ∈ R^{n×d} P∈Rn×d,加到交互嵌入中,形成新的编码。 P i P_i Pi 加入到第 i i i 个交互嵌入向量中,形成含有位置编码的交互嵌入向量。
自注意力层
Q: 习题嵌入
K:作答交互嵌入
V :作答交互嵌入
利用缩放点积的注意力机制
当前练习和之前的每一次作答交互 都有关系,计算出注意力权重。
多头
捕获不同子空间的信息。
因果关系
因为序列性的缘故,不能够知道被预测题目的信息,所以使用因果关系层掩盖从未来交互中学习到的权重。
前馈层
为了在模型中加入非线性并考虑不同潜在维度之间的相互作用,我们使用了前馈网络。
残差连接
利用低层信息
预测层
得到预测的概率
网络训练
交叉熵
边栏推荐
- Is it safe to open an account online now? Which securities company should I choose to open an account online?
- Laravel5 call to undefined function OpenSSL cipher IV length() error php7 failed to open OpenSSL extension
- mysql导入文件出现Data truncated for column ‘xxx’ at row 1的原因
- 2022-7-6 初学redis(一)在 Linux 下下载安装并运行 redis
- 2022-7-6 Leetcode 977. Square of ordered array
- Clickhouse (03) how to install and deploy Clickhouse
- Environment configuration
- 请问,redis没有消费消息,都在redis里堆着是怎么回事?用的是cerely 。
- 搜索框效果的实现【每日一题】
- Vmware 与主机之间传输文件
猜你喜欢
使用day.js让时间 (显示为几分钟前 几小时前 几天前 几个月前 )
数据库系统概论-第一章绪论【概念模型、层次模型和三级模式(外模式、模式、内模式)】
TPG x AIDU | AI leading talent recruitment plan in progress!
Sliding rail stepping motor commissioning (national ocean vehicle competition) (STM32 master control)
2022-7-6 Leetcode 977.有序数组的平方
LeetCode简单题分享(20)
Vmware 与主机之间传输文件
How to check the ram and ROM usage of MCU through Keil
SSRF vulnerability file pseudo protocol [netding Cup 2018] fakebook1
Social responsibility · value co creation, Zhongguancun network security and Information Industry Alliance dialogue, wechat entrepreneur Haitai Fangyuan, chairman Mr. Jiang Haizhou
随机推荐
[high frequency interview questions] difficulty 2.5/5, simple combination of DFS trie template level application questions
Help tenants
最长上升子序列模型 AcWing 1014. 登山
Laravel form builder uses
请问,PTS对数据库压测有好方案么?
作战图鉴:12大场景详述容器安全建设要求
最长上升子序列模型 AcWing 1012. 友好城市
Is the spare money in your hand better to fry stocks or buy financial products?
566. Reshaping the matrix
Introduction to database system - Chapter 1 introduction [conceptual model, hierarchical model and three-level mode (external mode, mode, internal mode)]
高等數學---第八章多元函數微分學1
【日常训练】648. 单词替换
Excuse me, when using Flink SQL sink data to Kafka, the execution is successful, but there is no number in Kafka
数据库系统概论-第一章绪论【概念模型、层次模型和三级模式(外模式、模式、内模式)】
[untitled]
Social responsibility · value co creation, Zhongguancun network security and Information Industry Alliance dialogue, wechat entrepreneur Haitai Fangyuan, chairman Mr. Jiang Haizhou
Hands on Teaching: XML modeling
118. 杨辉三角
参数关键字Final,Flags,Internal,映射关键字Internal
call undefined function openssl_ cipher_ iv_ length