来自英国的科学家们希望,他们所建立的一个新型公开数据库能够随着时间的推移而逐渐缩小,而非扩大。这是因为该数据库汇集了人类基因组中数千种尚未深入研究的蛋白质,这些蛋白质的存在已被确认,但其具体功能大多仍不明确。
这个数据库被命名为“未知”,是由英国牛津大学邓恩病理学院的马修·弗里曼与剑桥MRC分子生物学实验室的肖恩·蒙罗及其团队共同开发的,并在开放获取期刊《公共科学图书馆生物学》中进行了详细描述。他们对数据库中某些蛋白质的研究表明,大部分蛋白质在重要的细胞功能中扮演着关键角色,包括发育和应对压力的能力。
人类基因组的测序结果清楚地表明,它编码了成千上万种可能的蛋白质序列,但这些序列的身份和功能仍然不为人知。造成这种现象的原因有很多,包括研究资金往往集中在已知目标上的趋势,以及缺乏有效工具(如抗体)来探究这些蛋白质在细胞中的功能。然而,忽视这些蛋白质的潜在风险是显而易见的,作者认为,某些蛋白质可能在关键的细胞过程中发挥着重要作用,并可能为治疗干预提供新的见解和目标。
为了加速对这些蛋白质的探索,作者创建了未知数据库(www.unknome.org),为每种蛋白质分配了一个“已知”分数,以反映科学文献中关于其功能、物种间保守性、亚细胞定位及其他相关信息的程度。
基于这一系统,我们对成千上万种蛋白质的了解几乎为零。该数据库不仅包括模型生物的蛋白质,还涵盖了人类基因组中的蛋白质。数据库对所有用户开放,并且可进行定制,允许用户为不同的元素设置自己的权重,从而生成一组个性化的知识分数,以便优先考虑自己的研究方向。
为了验证数据库的实用性,作者选择了260个人类基因,这些基因在果蝇中有相似的基因,并且在两个物种中已知的分数为1或更低,表明对它们几乎没有了解。对于其中许多基因,完全敲除该基因会导致果蝇无法生存;而部分敲除或组织特异性敲除则揭示了许多与生育、发育、组织生长、蛋白质质量控制或抗逆性等基本功能相关的发现。
结果显示,尽管经过数十年的深入研究,仍有成千上万的果蝇基因在最基本的层面上尚待了解,人类基因组的情况显然也是如此。“这些未被描述的基因不应被忽视,”蒙罗表示。“我们的数据库提供了一个强大、多功能且高效的平台,能够识别和选择未知功能的重要基因进行分析,从而加速填补生物学知识空白。”
蒙罗补充道:“数千种人类蛋白质的功能尚不明确,但研究往往集中在那些已经被充分理解的蛋白质上。为了解决这个问题,我们创建了一个未知数据库,根据对蛋白质的了解程度对其进行排名,并对这些神秘蛋白质进行功能筛选,以展示无知如何推动生物学的发现。”
本文来自作者[svs]投稿,不代表立场,如若转载,请注明出处:http://ibmjournal.com/post/7620.html
评论列表(4条)
我是的签约作者“svs”!
希望本篇文章《“未知”:一个我们几乎一无所知的人类基因数据库》能对你有所帮助!
本站[]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:来自英国的科学家们希望,他们所建立的一个新型公开数据库能够随着时间的推移而逐渐缩小,而非扩大。这是因为该数据库汇集了人类基因组中数千种尚未深...