金标准LncRNAs和可靠的LncRNAs

      与具有详尽注释的蛋白编码基因不同, lncRNAs常常缺乏注释,信息分散且收集不全。Arraystar拥有高质量的转录组和lncRNA数据库,通过生物信息学方法建立了科学、严谨的lncRNA筛选流程。 Arraystar人类LncRNA V4.0芯片共收录了40,173 个lncRNAs,主要分为两大类:7,506个金标准LncRNAs和32,667个可靠的LncRNAs,实现了对所有权威数据库(如Refseq, USCS Known Genes, GENCODE, lincRNA catalogs, lncRNAdb, T-UCRs, RNAdb, NRED 等)、高水平文章和超过47 Tb RNA-seq数据中的lncRNA最全面、最可靠和最及时的整理和收集。


金标准lncRNAs

       金标准lncRNAs全部采用经过详细注释和实验验证确定的lncRNAs,剔除了公共数据库中大量的lncRNA部分片段、不完整的UTRs和不可靠的lncRNAs。金标准lncRNAs具有完善的信息标注,包括转录单位、转录本异构体、功能机制以及亚细胞定位。它们的主要来源如下:

•lncRNAdb v2.0汇集了功能性 lncRNAs [1];

•Arraystar 筛选和收集了高水平文章中的lncRNA;

•Level 1 GENCODE v21 精心挑选了具有RT-PCR-seq方面实验数据支持的LncRNAs [2];

•Refseq 严格筛选了可信度高、具有全长序列的LncRNAs ;

•Arraystar 通过ENCODE CAGE Clusters,,PolyA-seq,深度RNA-Seq以及capture seq获得的,具有5’TSS、3’末端和表达量信息的全部lncRNA转录本 [3, 4]。


可靠的lncRNAs

       除了金标准lncRNA外,其他的 lncRNA序列主要通过整合数据库和经典文献中的转录单位(Transcription Units)而获得。DNA链的转录起始于DNA模板的一个特殊起点,并在一个终点处终止,此转录区域称为转录单位。根据转录本长度、来源数据库和其他有效信息,每个转录单位挑选一个最具代表性的lncRNA进行检测。最终从308,525个lncRNA序列中筛选出32,667个可靠的 LncRNAs分子。


相关服务

lncRNA芯片技术服务

超级增强子lncRNA芯片技术服务

lncPathTM芯片技术服务

nrStarTM Human Functional LncRNA PCR芯片技术服务

T-UCR芯片技术服务



参考文献

1. Quek X.C. et al. (2015) Nucleic Acids Res. 43(Database issue):D168-73 [PMID: 25332394]

2. Howald C. et al. (2012) Genome Res. 22(9):1698-710 [PMID: 22955982]


3. Clark M.B. et al. (2015) Nat. Methods 12(4):339-42 [PMID: 25751143]

4. Iyer M.K. et al. (2015) Nat. Genet. 47(3):199-208 [PMID: 25599403]