临床表型多组学标记物专用元数据数据字典.docx

上传人:夺命阿水 文档编号:1318168 上传时间:2024-06-06 格式:DOCX 页数:10 大小:37KB
返回 下载 相关 举报
临床表型多组学标记物专用元数据数据字典.docx_第1页
第1页 / 共10页
临床表型多组学标记物专用元数据数据字典.docx_第2页
第2页 / 共10页
临床表型多组学标记物专用元数据数据字典.docx_第3页
第3页 / 共10页
临床表型多组学标记物专用元数据数据字典.docx_第4页
第4页 / 共10页
临床表型多组学标记物专用元数据数据字典.docx_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《临床表型多组学标记物专用元数据数据字典.docx》由会员分享,可在线阅读,更多相关《临床表型多组学标记物专用元数据数据字典.docx(10页珍藏版)》请在课桌文档上搜索。

1、临床表型多组学标记物专用元数据数据字典A.1基因组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1基因组生物标记物编号genomicbiomarkeridentifierGBID基因组生物标记物的唯一标识符,SNP优先使用rsid字符串型自由文本M12分类CategoryCat基因组生物标记物的分类,包含SNP、Inde1、CNV、SV字符串型自由文本MN3变体类型VarianttypeVarianttype变异的具体类型,包含转换、颠换、插入、缺失、重且、异位等字符甲型自由文本MN4变异前染色体RawChromosomeRawChr二代基因组生物标记物变异前的起始染色体

2、编号字符串型自由文本MN5变异前起始位置RawStartPositionRawStartPos基因组生物标记物变异前的起始坐标数值型正整数MN6变异前终止位置RawEndPositionRawEndPos基因组生物标记物变异前的终止坐标数值型正整数MN7变异后染色体VariantsChromosomeVarChr基因组生物标记物变异后的染色体编号字符串型自由文本MN8变异后起始位置VariantsStartPositionVarStartPos基因组生物标记物变异后的起始坐标数值型正整数MN9变异后终止位置VariantsEndPositionVarEndPos基因组生物标记物变异后的终止坐标

3、数值型正整数MN10原始碱基RawBaseRawBase基因组生物标记物变异前的碱基名字符串型自由文本MN11等位基因AllelesAlleles位于一对同源杂色体相同位置上控制同一性状不同形态的基因字符串型自由文本C,当变异类型为SNP时必选N12基因名称GeneNameGeneName标记物位置的基因名称(GeneSymbol)字符甲型自由文本0N13基因IDGeneIdentifierGeneID标记物位置的基因ID(EntrezID)数值型正整数0N14功能区域FunctionalRegionFR生物标记物所在区域的功能:内含子、外显子、ORF.CDS、UTR等字符串型自由文本MN15

4、变体长度VariantlengthVariantlength发生变异的碱基长度数值型正整数0N16染色体条带定位CytogeneticbandCytogcneticband基因所在染色体号及其氏短臂区域字符串型自由文本0N17物种名称OrganismOrganism标记物所来自的生物物种的名称,比如HomOsapiens字符串型自由文本MN18参考基因组Referencegenomeref生物标记物所对应的参考基因组,如hg38字符串型自由文本MN19临床表型名称ClinicalPhenotypeClinicalPheno生物标记物所对应的临床表型名称或ID(唯一)字符串型自由文本MN20临床

5、关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等字符串型自由文本MN21实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MN22研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如GWAS字符串型自由文本MN23风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,基因组建议使用OR字符串型自由文本0N24统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况选用p-valuc.FDR,Boffcrron

6、i矫正数值型0-1C,统计学方法必选NA.2表观(甲基化)组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1染色体编号ChromosomeChromosome染色体编号字符串自由文本MN2起始位宜StartPositionStartPosition染色体上的起始位置数值型正整数MN3终止位置EndPositionEndPosition在染色体上的终止位置数值型正整数MN4正负链信息StrandStrand在染色体上的链信息字符串“或0N5甲基化类型MethylationTypeMethylationType甲基化类型字符串位点或区域MN6甲基化水平Methylation1

7、.evelMcthylation1.evel甲基化水平字符串超(去)甲基化0N7氏度1.ength1.ength长度数值型正整数MN8功能区域Genomics1.ocationGenomics1.ocation所在的功能区域信息,不同功能区域标注信息具体为:exon,intron.UTRpromoter等字符串自由文本0N9基因名称GeneNameGeneName基因symbol名称字符串自由文本MN10基因IDGeneIDGeneID用于唯一标识基因的数字,如EntreZGeneID数值型正整数MN11临床表型名称ClinicalPhenotypeClinicalPheno生物标记物所对应的

8、临床表型名称或ID(唯一)字符串自由文本MN12临床关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等。字符串自由文本MN13实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MN14研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如eWAS、差异比较等。字符串自由文本MN15风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,甲基化建议使用差异程度字符串自由文本0N16统计P值PvalueP生物标记物与临床关联的统计学显著

9、性程度,可以根据情况选用PValue,FDR,Bofferroni矫正数值型0-1C,统计学方法必选NA.3转录组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1基因名称GencNameGoneName标记物位置的基因名称(使用GCneSymbol)字符串型自由文本MN2基因类型GenetypeGenetype生物标记物的类型,包含mRNA、miRNA、CirCRNA、InCRNA等字符串型自由文本MN3基因IDGeneIDGeneID用于唯一标识基因的数字,如EntrCZGenCID数值型正整数MN4基因全称GenefullnameGeneFN基因全称,如MToR全称为

10、MeChaniStiCTargetOfRapamycinKinase字符串型自由文本0N5正负链信息StrandStrand基因在染色体上的链向信息,分为正链(+)和负链(一)两种字符串型或“MN6靶标基因targetgenetargetgeneticroRNA或IncRNA靶标基因字符串型自由文本C,当RNA类型为miRN和IncRNA时必选N7参考基因组Referencegenomeref生物标记物所对应的参考基因组,如hg38字符串型自由文本MN8物种OrganismOrganism标记物所来自的生物物种的名称,比如Iischerichiacoli字符串型自由文本MN9细胞类型CellT

11、ypeCellType标记物所来自的细胞类型字符串型自由文本C,当RNA类型为单细胞转录测序时N10临床表型名称ClinicalPhenotypeClinicalPhenotype生物标记物所对应的临床表型名称或ID(唯一)字符串型自由文本MN11研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如TWAS或弟异比较字符串型自由文本MN12风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,转录组建议使用差异倍数IogSFoldChange字符串型自由文本0N13统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况

12、选用P-value,FDR,Bofferroni矫正数值型0-1C,统计学方法必选N14临床关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等字符串型自由文本MN15实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MNA.4蛋白质组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1蛋白质标识符ProteinIdentifierproteinidentifier每个蛋白质的唯一标识符,如UniProtID字符串自由文本MN2蛋白质名称ProteinNameProt

13、einName蛋白质的通用名称字符串自由文本MN3基因名称GeneNameGeneName基因symbol名称字符串自由文本MN4基因IDGeneIDGeneID用于唯一标识基因的数字,如EntreZGeneID数值型正整数MN5物种名称OrganismOrganism蛋白质标志物所来自的生物物种的名称,比如HOn1。sapiens字符串自由文本MN6长度1.ength1.ength蛋白质氨基酸序列长度的信息数值型正整数MN7亚细胞位置Subcellular1.ocationSubcellular1.ocation有关蛋白质在细胞内定位的信息。字符串自由文本0N8临床表型名称ClinicalP

14、henotypeClinicalPheno生物标记物所对应的临床表型名称或ID(唯一)字符串自由文本MN9临床关联ClinicalRelevanceClinicalRelevance生物标记物的临床关联,包含了风险、诊断、预后和治疗等。字符串自由文本MN10实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MN11研尢方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如eWAS、差异比较等。字符串自由文本MN12风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,甲基化建议使用差异程度字符串自由文本0N

15、13统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况选用PValue,FDR,Bofferroni矫正数值型0-1CNA.5代谢组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1代谢物名称MetaboliteNameMetabolitcName代谢物的正式名称或通用名称字符串自由文本MN2化合物IDCHEBIIDCHEBIID自CHEBI数据库的标识符,用于代谢物的统一命名和标识字符串自由文本MN3化学结构ChemicalStructureCheniicalStructure代谢物的分子结构,通常以化学式或分子图示形式表示字符串自由文本MN4代谢

16、物类别MetaboliteCategoryMetaboliIeCategory代谢物所属的化学类别,如氨基酸、脂质、糖类等。字符中自由文本0N5物种名称OrganismOrganiSn)标志物所来自的生物物种的名称,比如HOnK)sapiens字符串自由文本MN6临床表型名称ClinicalPhenotypeClinicalPheno生物标记物所对应的临床表型名称或ID(唯一)字符串自由文本MN7临床关联ClinicalRelevanceClinicalRelevancc生物标记物的临床关联,包含了风险、诊断、预后和治疗等。字符串自由文本MN8实验验证ValidationValidation生

17、物标记物是否经过了实验验证布尔型是或否MN9研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如eWAS、差异比较等。字符中自由文本MN10风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,甲基化建议使用差异程度字符申自由文本0N11统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况选用PValue.FDR,Bofferroni矫正数值型0-1CNA.6宏基因组序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1菌种IDTaxonomyIDTaxID菌种或菌株的编号数值型正整数MN2当前使用名

18、CurrentscientificnameCurrentScientificName当前使用的菌种或菌株名字符串型自由文MN3常用名CommonnameCommonname府用的菌种或菌株名字符中型自由文本MN4分类等级TaxonomicrankTaxonomicrank菌株的分类等级(科,属,种,株)字符申型自由文本MN5宿主HostHost为菌株提供生存环境的生物物种字符串型自由文本M16临床表型名称ClinicalPhenotypeClinicalPheno生物标记物所对应的临床表型名称或ID(唯一)字符串型自由文本MN7临床关联ClinicalRelevanceClinicalRele

19、vance生物标记物的临床关联,包含了风险、诊断、预后和治疗字符串型自由文本MN8研究方法名称StudymethodStudymethod生物标记物与临床表型关联所用的方法,如GwAS字符串型自由文本MN9风险量值RiskRatioRR生物标记物对临床表型的风险效应值大小,宏基因组建议使用差异菌群丰度字符中型自由文本MN10统计P值PvalueP生物标记物与临床关联的统计学显著性程度,可以根据情况选用P-ValUe,FDR,Bofferroni矫正数值型0-1C,统计学方法必选N11实验验证ValidationValidation生物标记物是否经过了实验验证布尔型是或否MNA.7临床表型序号中

20、文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1表型名称ClinicalPhenotypeNameClinicalPhenotypeName生物标记物所对应的临床表型字符串自由文本M12表型分类clinicalphenotypeclassClinicalphenotypeclass生物标记物所对应的临床表型分类、包含疾病、生化检测、常规检测、人群特征等字符串自由文本M13表型标识符ClinicalPhenotypeIdentifierClinicalPhenotypelD生物标记物所对应的临床表型ID,疾病使用ICD编号字符串自由文本C,当表型为疾病时必选14表型描述Clini

21、calPhenotypedescriptionClinicalPhenotypeDescription生物标记物所对应的临床表型的简要描述字符串自由文本0NA.8数据来源序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1提供方名称SubmitionOrganizationNameSubOrgName提供方的组织机构名称全称字符串自由文本M12提供方详细地址SubmitionOrganizationAddressSubOrgAddress与提供方联系的详细地址字符串自由文本M13提供方邮政编码SubraitionOrganizationPostCodeSubOrgPoseCo

22、de与提供方联系的通信地址相对应的邮政编码字符串自由文本M14提供方联系人SubmitionOrganizationContactsNameSubOrgContactsName与提供方联系的联系人姓名字符串自由文本MN5提供方联系电话SubmitionOrganizationPhoneSubOrgPhone与提供方联系的电话号码字符串自由文本MN6提供方电子邮箱SubraitionOrganizationElectronicMailAddressSubOrgEmail与提供方联系的电子邮箱地址字符串自由文本MN7发布日期DataReleaseDateReleaseDate元数据提交或发布的日期

23、日期采用GB/T39909-2021中的日期形式M1A.9研究方法序号中文名称英文名称缩写词定义数据类型值域约束/条件最大出现次数备注1研究方法名称StudyDesignNameStudyDesignNanie研究方法名称字符串型自由文本M12研究方法概述StudyDesignDescriptionStudyDcsignDcscription研究方法概述,简要阐明研究方法,包含取样条件、建库方法、测序平台或质谱仪信息、度控方法、标记物识别或表型关联方法等。字符串型自由文本M13样本量SampleSizeSamplcSiZG研究所用的样本应数目数值型正整数MN4实验对照设置CaseControl

24、InformationCase-Control描述研究的实验组和对照组设置情况字符串型自由文本MN5研究对象名称StudyObjectsNameStudyObjectName研究实验时象的名称字符串型自由文本MN6研究对象类别StudyObjectsTypeStudyObjectsType研究对象的类别,物种-器仃-组织-细胞字符串型自由文本MN7研究环境StudyEnvironmentStudyEnvironment研究进行的环境,如平原、高原等字符串型自由文本MN8衡量指标PerformanceMetricsPerformanceMetries衡量生物标记物效果的指标,如精确率、特异性等,对应于标记物的风险量值部分。字符串型自由文本MN9研究结论StudyConclutionStudyConclution说明研究所得的结论字符串型自由文本01

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号