生物学杂志 ›› 2024, Vol. 41 ›› Issue (5): 20-.doi: 10.3969/j.issn.2095-1736.2024.05.020
张极峰, 白晓轩, 刘 超, 李 婧, 李 奥, 刘士平
#br# ZHANG Jifeng, BAI Xiaoxuan, LIU Chao, LI Jing, LI Ao, LIU Shiping #br# #br#
摘要: 为充分解析草酸青霉SG-4的遗传信息,利用二代Illumina测序和三代PacBio测序相结合的方法对SG-4的全基因组进行测序,经过基因组组装、基因预测和功能注释后,对全基因组进行共线性分析和次级代谢产物合成基因簇预测。结果表明,草酸青霉SG-4基因组全长为31.17 Mb,GC含量为50.5%,包括线粒体基因组在内,共由9条基因支架(scaffold)组成,含有8430个蛋白质编码基因、175个tRNA和50个rRNA基因。与swiss-prot、Pfam、NR、GO和KEGG等数据库相比,COG数据库注释的基因数最多,可达7483个。共线性分析结果表明,SG-4与数据库中报道的其他草酸青霉的同源性有一定差异,且存在多处异位重排现象。通过生物信息学分析发现,SG-4基因组中有28个次级代谢产物生物合成基因簇,其中,14个基因簇的功能未见报道,将NRPS相关基因簇与转录组数据进行对应的同时,分析与三峡肽素合成趋势的相关性,得到9条基因簇,经前期实验验证其中有一条可能是负责三峡肽素合成的候选基因簇。研究丰富了草酸青霉的基因组信息,为全面了解草酸青霉的基因组信息、揭示三峡肽素的生物合成途径奠定基础。
中图分类号: