当前位置:网站首页>[Chinese tree tags - CTB]
[Chinese tree tags - CTB]
2022-08-01 21:05:00 【Tianchi Xiaotian】
Peking University Annotation Set
词性编码 | 词性名称 | 注解 |
---|---|---|
词性编码 | 词性名称 | 注解 |
Ag | 形语素 adjectives.形容词代码为a,The morpheme code is g前面置以A | |
a | 形容词 | 取英语形容词adjective的第1个字母 |
ad | 副形词 | 直接作状语的形容词.形容词代码a和副词代码d并在一起 |
an | 名形词 | 具有名词功能的形容词.形容词代码a和名词代码n一起 |
b | 区别词 | 取汉字“别”的声母 |
c | 连词 | Go to English conjunctionsconjunction的第1个字母 |
Dg | 副语素 | 副词性语素.副词代码为d,语素代码g前面置以D |
d | 副词 | 取adverb的第2个字母,因其第1个字母已用于形容词 |
e | 叹词 | 取英语叹词exclamation的第1个字母. |
f | 方位词 | 取汉字“方” |
g | 语素 | 绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母 |
h | 前接成分 | 取英语head的第1个字母 |
i | 成语 | 取英语成语idiom的第1个字母 |
j | 简称略语 | 取汉字“简”的声母 |
k | 后接成分 | |
l | 习用语 | 习用语尚未成为成语,有点“临时性”,取“临”的声母 |
m | 数词 | 取英语numeral的第3个字母,n,u已有他用 |
Ng | 名语素 | 名词性语素.名词代码为n,语素代码g前面置以N |
n | 名词 | 取英语名词noun的第1个字母 |
nr | 人名 | 名词代码n和“人(ren)”的声母并在一起 |
ns | 地名 | 名词代码n和处所词代码s并在一起 |
nt | 机构团体 | “团”的声母为t,名词代码n和t并在一起 |
nz | 其他专名 | “专”的声母的第1个字母为z,名词代码n和z并在一起 |
o | 拟声词 | 取英语拟声词onomatopoeia的第1个字母. |
p | 介词 | 取英语介词prepositional的第1个字母 |
q | 量词 | 取英语quantity的第1个字母 |
r | 代词 | 取英语代词pronoun的第2个字母,因pto be used for prepositions |
s | 处所词 | 取英语space的第1个字母 |
Tg | 时语素 | 时间词性语素.时间词代码为t,在语素的代码g前面置以T |
t | 时间词 | 取英语time的第1个字母 |
u | 助词 | 取英语助词auxiliary |
Vg | 动语素 | 动词性语素.动词代码为v.in morpheme codesg前面置以V |
v | 动词 | 取英语动词verb的第1个字母. |
vd | 副动词 | 直接作状语的动词.动词和副词的代码并在一起. |
vn | 名动词 | 指具有名词功能的动词.Codes for verbs and nouns are put together. |
w | 标点符号 | |
x | 非语素字 | 非语素字只是一个符号,字母x通常用于代表未知数、符号 |
y | 语气词 | 取汉字“语”的声母 |
z | 状态词 | 取汉字“状”的声母的前一个字母. |
un | 未知词 | 不可识别词及用户自定义词组.取英文Unknown首两个字母. |
(非北大标准,CSW分词中定义) |
Penn Chinese Treebank Markers and Their Interpretations
Part-Of-Speech tags:33tags
标记 | 英语解释 | 中文解释 |
---|---|---|
AD | adverbs | 副词 |
AS | Aspect marker | 体态词,体标记(例如:了,在,着,过) |
BA | 把 in ba-const | “把”,“将”的词性标记 |
CC | Coordinating conjunction | 并列连词,“和” |
CD | Cardinal numbers | 数字,“一百” |
CS | Subordinating conj | 从属连词(例子:若,如果,如…) |
DEC | 的 for relative-clause etc | “的”词性标记 |
DEG | Associative | 联结词“的” |
DER | in V-de construction, and V-de-R | “得” |
DEV | before VP | 地 |
DT | Determiner | 限定词,“这” |
ETC | Tag for words, in coordination phrase | 等,等等 |
FW | Foreign words | 例子:ISO |
IJ | interjetion | 感叹词 |
JJ | Noun-modifier other than nouns | |
LB | in long bei-construction | 例子:被,给 |
LC | Localizer | 定位词,例子:“里” |
M | Measure word(including classifiers) | 量词,例子:“个” |
MSP | Some particles | 例子:“所” |
NN | Common nouns | 普通名词 |
NR | Proper nouns | 专有名词 |
NT | Temporal nouns | 时序词,表示时间的名词 |
OD | Ordinal numbers | 序数词,“第一” |
ON | Onomatopoeia | 拟声词,“哈哈” |
P | Preposition | (excluding 把 and 被) |
PN | pronouns | 代词 |
PU | Punctuations | 标点 |
SB | in long bei-construction | 例子:“被,给” |
SP | Sentence-final particle | 句尾小品词,“吗” |
VA | Predicative adjective | 表语形容词,“红” |
VC | Copula | 系动词,“是” |
VE | 有 as the main verb | “有” |
VV | Other verbs | 其他动词 |
Syntactic tags:23 tags syntactic markers
Tags for phrase: 17 tags Short syntax markup
Tags for verb compounds: 6 tags Verb compound6个标记
Functional tags: 26 tags 功能标记26个
Empty categories (null elements): 7 tags Empty category tag
了解路径 – neuTblue
补充:
- 【Common Noun——NN】:List a variety of situations in which a Chinese character string is negative1个word
CD+N
“CD”和“N”的含义在 APPENDIX B 中查阅,“CD”为量词,“N”为名词
判断准则:如果在CD+N的结构中,A unit can be inserted inCD和N之间,And the meaning remains the same,则判定为2个词:CD+N,例如:
如果在CD和NThe meaning changes after inserting a unit in between,则将CD+NJudged as oneNN
【Proper Noun——NR,专有名词】
【Temporal Noun——NT,时间名词】
【Localizer——LC,定位词】如“内”,“左右”
【Pronoun——PN,代词】
【Determiner——DT,限定词】如“这”,“全体”
【Cardinal Number——CD,量词】
【Ordinal Number——OD,次序词】如“第三十一”
【Measure word——M,单位词】如“杯”
【Verb:VA,VC,VE,VV,动词】
【Adverb:AD,副词】如“近”,“极大”
【Preposition:P,介词】如“随着”
【Subordinating conjunctions:CS,从属连词】
【Conjuctions:CC,连词】如“和”
【Particle:DEC,DEG,DEV,DER,AS,SP,ETC,MSP,小品词】如“的话”
【Interjections:IJ,感叹词】如“哈”
【onomatopoeia:ON,拟声词】如“哗啦啦”
【Other Noun-modifier:JJ】如“发稿/JJ 时间/NN”
【Punctuation:PU,标点符号】
【Foreign word:FW,外国词语】如“OK”
【Others】包括idioms(习语),telescopic string(没明白什么意思),short form(缩写)
边栏推荐
- Based on FPGA in any number of bytes (single-byte or multibyte) serial port (UART) to send (including source engineering)
- tiup mirror clone
- 函数(二)
- 30+的女性测试人面试经验分享
- Review Set/Map basics with these two hooks
- MySQL语法基础
- C专家编程 第1章 C:穿越时空的迷雾 1.2 C语言的早期体验
- Qt设置应用程序开机自启 解决设置失败原因
- 通过这两个 hook 回顾 Set/Map 基础知识
- tiup mirror init
猜你喜欢
Jmeter实战 | 同用户重复并发多次抢红包
Excel advanced drawing techniques, 100 (22) - how to respectively the irregular data
Godaddy domain name resolution is slow and how to use DNSPod resolution to solve it
函数(二)
R语言 数据的关系探索
Godaddy域名解析速度慢问题以及如何使用DNSPod解析解决
(七)《数电》——CMOS与TTL门电路
写给刚进互联网圈子的人,不管你是开发,测试,产品,运维都适用
STAHL touch screen repair all-in-one display screen ET-316-TX-TFT common faults
扣减库存方案
随机推荐
微信小程序云开发|个人博客小程序
测试的意义并不是能找到全部的缺陷
外骨骼机器人(七):标准步态数据库
excel高级绘图技巧100讲(二十二)-如何对不规则数据进行分列
相亲模型与有限状态机
对C语言结构体内存对齐的理解
kubernetes各名词缩写
R语言进行相关的操作
1374. 生成每种字符都是奇数个的字符串 : 简单构造模拟题
WeChat applet cloud development | personal blog applet
wps excel 插入公式 整列
JS提升:如何中断Promise的链式调用
ISC2022 HackingClub白帽峰会倒计时1天!最全议程正式公布!元宇宙集结,精彩绝伦!
Transplant MQTT source code to STM32F407 development board
数据库内核面试中我不会的问题(1)
C专家编程 第1章 C:穿越时空的迷雾 1.1 C语言的史前阶段
LeetCode每日一题(1807. Evaluate the Bracket Pairs of a String)
iptables的使用简单测试
用户身份标识与账号体系实践
Pytorch框架学习记录10——线性层