Bioinformatics has become an important part of many areas of biology. The Proteomics Core provides world-class mass spectroscopy, proteomics analyses, and Sanger-based sequencing. For this purpose, we built a resource investigating genetic model of drug response (iGMDR), which integrates the models from in vitro and in vivo pharmacogenetic studies with different omics data from a variety of technical systems. However, efficient storage, querying, and visualization of such large datasets remain challenging. hTFtarget: A Comprehensive Database for Regulations of Human Transcription Factors and Their Targets, Qiong Zhang, Wei Liu, Hong-Mei Zhang, Gui-Yan Xie, Ya-Ru Miao, Mengxuan Xia, An-Yuan Guo
IRESbase: A Comprehensive Database of Experimentally Validated Internal Ribosome Entry Sites, Jian Zhao, Yan Li, Cong Wang, Haotian Zhang, Hao Zhang, Bin Jiang, Xuejiang Guo, Xiaofeng Song To further investigate and visualize the relationships between variants and signatures of selection, the Genome Browser integrates all variations, selection data, and resources, from NCBI, the UCSC Genome Browser, and Animal QTLdb. By analyzing the variants collected in MosaicBase, we find that mosaic variants that directly contribute to disease phenotype show features distinct from those of variants in individuals with mild or no phenotypes, in terms of their genomic distribution, mutation signatures, and fraction of mutant cells. In this report, we describe a MS pipeline and spectral resource to support targeted proteomics studies for human tissue samples. However, studies in this field are limited by the difficulty in experimentally identifying the substrate site specificity of lysine succinylation. hTFtarget provides a comprehensive, reliable and user-friendly resource for exploring human TF–target regulations, which will be very useful for a wide range of users in the TF and gene expression regulation community. IC4R(Information Commons for Rice)数据库收集了5152个水稻样本的1800万个单核苷酸多态性(Single Nucleotide Polymorphism,SNP)。如此大规模的原始基因组变异图谱中包含大量的基因型缺失和位点冗余,并不能直接用于作物遗传育种研究的不同领域。为了提高基因组变异图谱的质量、易用性和通用性,需要构建由不同密度的高质量的SNP位点组成的分级基因组变异图谱。为满足水稻群体遗传学、进化分析、关联分析和基因组选择育种等方面的不同研究目的,我们对包含1800万个SNP的原始基因型数据进行统一的生物信息学处理,用于建立水稻IC4R-SR4R(SNP Ready for Rice)子数据库。SR4R数据库提供了4套分级基因组变异图谱,分别为经过数据过滤和基因推断后的2,097,405个hapmapSNPs,基于连锁不平衡去冗余后筛选出的156,502个tagSNPs,基于选择性清除扫描获得1180个fixedSNPs,以及基于DNA指纹模拟筛选出的38个barcodeSNPs。SR4R数据库不仅提供上述水稻分级基因组变异图谱数据的基因型信息查询和下载,还提供了18个用于本地分析的小程序,以及两个在线的基于机器学习的水稻亚群划分和品种预测的小工具。SR4R数据库有助于推进水稻遗传育种研究,其网址是。 Next-generation sequencing (NGS) technology, with its high-throughput capacity and low cost, has developed rapidly in recent years and become an important analytical tool for many genomics researchers. 在癌症中,解析基因的遗传变异信息最常用于指示药物治疗的可靠性和有效性。目前的药物基因组学研究通过体内和体外的方式已经获得了抗癌药物治疗相关的许多遗传学信息。这些信息筛选的终极目标是测量机体对于抗癌药物治疗的敏感性,获得高效的预测药物治疗效果的新的遗传学模型。尽管许多的遗传学模型已经被用于癌症治疗的临床实验研究和临床实践,但由于对现有药物遗传学研究数据缺乏整合和标准,这些非常有价值的模型并没有被很好的利用去反过来促进癌症的研究。因此需要一个新的在线资源去整合分析这些遗传学模型,促进这些信息的有效利用,释放它们的价值。为此,我们发展了iGMDR,整合不同技术体系、体外和体内药物基因组学研究的资源。在文章中,我们描述如何整合和标化不同体系下的药物基因组学模型,以及用户如何使用这些信息去提高癌症治疗的认识。在案例分析中我们借助整合的模型数据设计了临床测序新的panel、设计了药物组合治疗的策略。此外,我们还从模型数据的层面分析了组织特异性的药物敏感性。iGMDR提供了一个独特的资源来挖掘抗癌药物和个人基因组的关联, 通过大数据企图发现新的癌症知识。iGMDR的网址是。
It provides six main functionalities: gene search, variation search, genomic signature search, Genome Browser, alignment search tools, and the genome coordinate conversion tool. In addition, SR4R provides rice researchers with a web interface that enables them to browse all four SNP panels, use online toolkits, as well as retrieve the original data and scripts for a variety of population genetics analyses on local computers. 为了研究世界家牛的遗传多样性和鉴定基因组受选择区域,通过高通量测序技术已经产生了大量的牛基因组重测序数据。然而,对如此庞大的数据集进行有效的存储、查询和可视化仍然具有挑战性。本研究中,我们利用全世界54个家牛品种432个样本的重测序数据开发了牛基因组变异数据库 (the Bovine Genome Variation Database,BGVD)。BGVD包括六个主要功能: 基因快速检索、变异检索、基因组选择信号检索、基因组浏览器、比对工具和基因组坐标转换。BGVD存储了~60.44 M SNPs、~6.86 M indels、76,634个CNV以及六大群体的选择信号信息。用户可以通过搜索基因名或位置,快速检索三个参考基因组中(ARS-UCD1.2、UMD3.1.1和Btau 5.0.1) 54个牛品种的遗传变异分布模式和六个群体的选择信号。选择信号通过曼哈顿图和基因组浏览器来展示。基因组浏览器不仅包括基因组遗传变异和选择信号的信息,还整合了NCBI、UCSC基因组浏览器、动物QTLdb的资源。综上所述,所有这些特性使BGVD成为一个非常实用的牛基因组遗传变异数据库,可用于深度挖掘和分析全球范围内的牛基因组数据。BGVD的网址是。 MosaicBase will not only assist clinicians in genetic counseling and diagnosis but also provide a useful resource to understand the genomic baseline of postzygotic mutations in the general human population. MosaicBase: A Knowledgebase of Postzygotic Mosaic Variants in Noncancer Disease-related and Healthy Human Individuals, Xiaoxu Yang, Changhong Yang, Xianing Zheng, Luoxing Xiong, Yutian Tao, Meng Wang, Adam Yongxin Ye, Qixi Wu, Yanmei Dou, Junyu Luo, Liping Wei, August Yue Huang
iGMDR: Integrated Pharmacogenetic Resource Guide to Cancer Therapy and Research Lysine succinylation is an important protein acylation modification involved in diverse biological processes. Long noncoding RNAs (lncRNAs) and circular RNAs (circRNAs) are important regulatory molecules in living cells. 基因组重注释是不断修正基因模型的过程,对模式生物与非模式生物功能基因的深度解析具有重要意义。转录组测序技术由于能有效地识别基因组中的可变剪接位点,敏感地鉴定出低丰度表达基因与组织特异性基因,在基因组重注释研究中有巨大的应用潜力。鉴于目前水稻中已积累了海量转录组测序数据,我们开发了一套以公共RNA-seq数据大规模整合分析为基础的基因组注释流程,对水稻基因组开展重注释研究,进而获得了一套新的水稻基因组注释系统:IC4R-2.0。结果表明,IC4R-2.0通过外显子/内含子区域矫正,新UTR区域识别,基因融合及新基因挖掘等方式,对原注释系统中蛋白质编码基因的结构进行了更新。同时,我们对水稻基因组中的长链非编码RNA(lncRNA)与环形RNA(circRNA)进行了鉴定。通过整合多个基因组功能注释平台的资源,我们为水稻基因提供了更为丰富的功能注释信息。不同版本水稻基因组注释系统的定量评估与比较分析表明,大规模整合转录组测序数据的确可以使水稻基因模型的完整度与注释质量获得提升。为方便用户获取水稻基因组重注释信息,我们在水稻生物信息门户IC4R(v 1.0)的基础上进行了重新设计及二次开发,不但有效地整合了水稻基因组重注释信息,还提供了更为友好的数据展示界面,提高了数据检索效率,并提供了一系列丰富而实用的在线分析工具。本研究为在水稻和其他单子叶植物中开展大规模基因功能解析等相关工作提供了数据基础。IC4R-2.0注释系统及相关资源可通过http://访问。 Ars-Ucd1.2、Umd3.1.1和Btau 5.0.1 ) 54个牛品种的遗传变异分布模式和六个群体的选择信号。选择信号通过曼哈顿图和基因组浏览器来展示。基因组浏览器不仅包括基因组遗传变异和选择信号的信息,还整合了NCBI、UCSC基因组浏览器、动物QTLdb的资源。综上所述,所有这些特性使BGVD成为一个非常实用的牛基因组遗传变异数据库,可用于深度挖掘和分析全球范围内的牛基因组数据。BGVD的网址是http: //。 confluence of needs for information and interdisciplinary have!