AI发现人类肾细胞有一半结构未知,UCSD最新研究登上Nature,算法已开源

我们的细胞再向下一级究竟有什么?细胞核、线粒体、内质网、高尔基体……

在中学生物课里我们知道了这些,然而它们就是亚细胞结构的全部吗?

绝对不是!

加州大学圣地亚哥分校(UCSD)医学院的研究人员和合作者们,通过AI技术分析出了人类肾脏细胞的70种亚系统,发现其中有一半都是人类未知的

这项研究登上了最新一期的Nature。

科学家研究细胞内部的结构主要使用两种技术:荧光显微镜成像生物物理关联

第一种方法是用荧光物质标定蛋白质,并在显微镜范围内跟踪它们的运动和关联。由此科学家们得到了人类蛋白质图谱(HPA)数据。

生物物理关联,是使用一种特定的抗体将蛋白质从细胞中拉出来,分析蛋白质上结合着什么。现在,科学家们已经有了BioPlex这一数据库。

UCSD的研究者们,就是将HPA与BioPlex中的蛋白质数据集合到一起,然后输入到深度神经网络中。

AI会对蛋白质之间的“距离”进行计算分析,最后得到多尺度整合细胞图谱(MuSIC Map)。

多年来,UCSD团队一直对绘制细胞内部工作图感兴趣。MuSIC的不同之处在于使用深度学习直接从细胞显微镜图像绘制细胞图谱。

此前,他们构建了一种叫做DCell的神经网络,并且用酿酒酵母细胞作为基础研究模型。他们用所有关于细胞生物学和细胞层次的知识库,来训练这个标准AI算法。

DCell可以根据基因突变的信息,预测细胞可能发生的行为,结果与实验室里的细胞行为几乎一致

MuSIC也是一种神经网络,与DCell的不同之处在于,它是细胞显微镜图像到亚细胞结构的映射。

该团队已经将MuSIC的代码开源。

通过MuSIC,研究人员发现了一组蛋白质形成一种过去不熟悉的结构,最终确定该结构是结合RNA的蛋白质新复合体,该复合体可能涉及染色质的剪接。

搞清楚亚细胞结构对于发现疾病病因有重要的意义,因为大多数疾病都可以归结于细胞的哪个部分出了故障。

例如,肿瘤之所以能够生长,是因为基因没能准确转化为特定蛋白质;代谢疾病是因为线粒体没能正常工作。

但要了解在疾病中细胞的哪些部位出了故障,科学家首先需要一份完整的亚细胞结构清单。

这篇论文的通讯作者Trey Ideker教授指出,这是一项测试MuSIC技术的试点研究,他们只研究了661种蛋白质和一种细胞类型。

参考链接: [1]https://ucsdnews.ucsd.edu/pressrelease/we-might-not-know-half-of-whats-in-our-cells-new-ai-technique-reveals [2]https://www.nature.com/articles/s41586-021-04115-9 [3]https://idekerlab.ucsd.edu/music/ [4]https://github.com/idekerlab/MuSIC

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

原文链接:https://cloud.tencent.com/developer/article/1909952

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享