当前位置:网站首页>SAKT方法部分介绍
SAKT方法部分介绍
2022-07-07 12:12:00 【多尝试多记录多积累】
网络架构和嵌入解释:
SAKT网络: 在每个时间戳处,仅对前面的每个元素估计注意权重。键、值和查询是从如下所示的嵌入层中提取的。当第j个元素为查询元素且第i个元素为关键元素时,注意权重为 a i j a_{ij} aij。
嵌入层: 嵌入学生正在尝试的当前练习和他过去的交互。在每次标记 t + 1 t+1 t+1 时,使用练习嵌入将当前问题 e t + 1 e_{t+1} et+1 嵌入到查询空间中,使用交互嵌入将过去交互的元素 x t x_t xt 嵌入到键和值空间中。
方法详细介绍:
模型目的: 根据学生1到 t 时刻 的习题作答情况,(即交互序列 X = x 1 , x 2 , . . . , x t X = x_1, x_2, ..., x_t X=x1,x2,...,xt,) 预测在 t + 1 t+1 t+1 时刻,习题 e t + 1 e_{t+1} et+1的回答情况(即预测出真实情况,正确的概率)。
交互元组: x t = ( e t , r t ) x_t = ( e_t, r_t) xt=(et,rt) : t t t 时刻习题 e t e_t et 的作答情况 r t r_t rt构成的。 x t x_t xt编号化时,用两者来表示,: y t = e t + r t × E y_t = e_t + r_t × E yt=et+rt×E , E E E是题目数量,可以看出交互编号,回答错误 时和题目编号同 y t = e t y_t = e_t yt=et,回答正确时,编号加上题目总数 y t = e t + E y_t = e_t + E yt=et+E。
嵌入层描述:
交互序列需要划分处理,保证所以的交互序列的长度一致,多则截断,短则填充。
因此交互序列由 y = ( y 1 , y 2 , . . . , y t ) y = (y_1, y_2, ...,y_t) y=(y1,y2,...,yt)变为 s = ( s 1 , s 2 , . . . , s n ) s = (s_1,s_2,...,s_n) s=(s1,s2,...,sn)。
训练一个交互嵌入矩阵 : M ∈ R 2 E × d M ∈ R^{2E×d} M∈R2E×d,其中 d 是潜在维度,用于获取交互嵌入。 s i s_i si的嵌入表示为 M s i M_{s_i} Msi
训练一个练习嵌入矩阵: E ∈ R E × d E ∈ R^{E×d} E∈RE×d, 用户获取练习嵌入。 e i e_i ei的嵌入表示为 E e i E_{e_i} Eei
位置编码:
为了对序列顺序进行编码,引入参数 P ∈ R n × d P ∈ R^{n×d} P∈Rn×d,加到交互嵌入中,形成新的编码。 P i P_i Pi 加入到第 i i i 个交互嵌入向量中,形成含有位置编码的交互嵌入向量。
自注意力层
Q: 习题嵌入
K:作答交互嵌入
V :作答交互嵌入
利用缩放点积的注意力机制
当前练习和之前的每一次作答交互 都有关系,计算出注意力权重。
多头
捕获不同子空间的信息。
因果关系
因为序列性的缘故,不能够知道被预测题目的信息,所以使用因果关系层掩盖从未来交互中学习到的权重。
前馈层
为了在模型中加入非线性并考虑不同潜在维度之间的相互作用,我们使用了前馈网络。
残差连接
利用低层信息
预测层
得到预测的概率
网络训练
交叉熵
边栏推荐
- When FC connects to the database, do you have to use a custom domain name to access it outside?
- [untitled]
- 供应链供需预估-[时间序列]
- [1] Basic knowledge of ros2 - summary version of operation commands
- 请问,我kafka 3个分区,flinksql 任务中 写了 join操作,,我怎么单独给join
- 2022-7-7 Leetcode 844.比较含退格的字符串
- What parameters need to be reconfigured to replace the new radar of ROS robot
- 2022-7-6 Leetcode27. Remove the element - I haven't done the problem for a long time. It's such an embarrassing day for double pointers
- 现在网上开户安全么?那么网上开户选哪个证券公司?
- Clickhouse (03) how to install and deploy Clickhouse
猜你喜欢
高等数学---第八章多元函数微分学1
最长上升子序列模型 AcWing 1014. 登山
2022-7-6 sigurg is used to receive external data. I don't know why it can't be printed out
使用day.js让时间 (显示为几分钟前 几小时前 几天前 几个月前 )
118. 杨辉三角
Enregistrement de la navigation et de la mise en service du robot ROS intérieur (expérience de sélection du rayon de dilatation)
社会责任·价值共创,中关村网络安全与信息化产业联盟对话网信企业家海泰方圆董事长姜海舟先生
SSRF vulnerability file pseudo protocol [netding Cup 2018] fakebook1
How to check the ram and ROM usage of MCU through Keil
Leecode3. Longest substring without repeated characters
随机推荐
[fortress machine] what is the difference between cloud fortress machine and ordinary fortress machine?
Redis只能做缓存?太out了!
2022-7-6 初学redis(一)在 Linux 下下载安装并运行 redis
Excusez - moi, l'exécution a été réussie lors de l'utilisation des données de puits SQL Flink à Kafka, mais il n'y a pas de nombre dans Kafka
为租客提供帮助
When FC connects to the database, do you have to use a custom domain name to access it outside?
IP address home location query full version
118. Yanghui triangle
Realize the IP address home display function and number home query
高等數學---第八章多元函數微分學1
[daily training] 648 Word replacement
Laravel5 call to undefined function openssl cipher iv length() 报错 PHP7开启OpenSSL扩展失败
How to check the ram and ROM usage of MCU through Keil
现在网上开户安全么?那么网上开户选哪个证券公司?
Is the compass stock software reliable? Is it safe to trade stocks?
Laravel5 call to undefined function OpenSSL cipher IV length() error php7 failed to open OpenSSL extension
最长上升子序列模型 AcWing 482. 合唱队形
. Net core about redis pipeline and transactions
参数关键字Final,Flags,Internal,映射关键字Internal
Vmware共享主机的有线网络IP地址