我们使用机器学习技术将英文博客翻译为简体中文。您可以点击导航栏中的“中文(简体)”切换到英文版本。
高管对话:与艾伦脑科学研究所数据和技术负责人Shoaib Mufti一起构建大脑知识平台
丽莎·麦克弗林:感谢你今天加入我们。为了让我们入门,你能否向我们介绍一下艾伦研究所的使命和你在该组织中的角色?
Shoaib Mufti :艾伦研究所是一家独立的非营利性生物科学机构,旨在通过基础科学解开人类生物学的未知数。我们专注于三个主要领域——大脑、细胞和免疫学,其中脑科学是这三个领域中存在时间最长的。
我们的方法是专注于一个组织无法单独解决的重大问题,并通过由数千名专家、技术和基础设施组成的团队为其提供支持。利用这种工业级研究职能,我们的目标是加快进展,与世界分享我们的发现,并将其公开提供给全球更大的研究界。
我领导艾伦脑科学研究所的数据和技术团队,该研究所目前正在开发大脑知识平台(BKP)。我的团队通过开发用于机器学习和计算机视觉等分析技术的数据管道以及用于存储、分析和从数据中获取见解的数据平台来支持我们的内部科学家。此外,我们还简化了外部客户(神经科学界)使用我们数据的流程,同时为他们提供了强大的可视化和分析工具的访问权限。
LM:你提到了大脑知识平台。你能告诉我们更多关于该项目以及它如何符合艾伦研究所总体使命的信息吗?
SM: 大脑知识平台是一项努力(也是同类计划中规模最大的!)通过精确和大规模地绘制大脑的细胞和细胞类型来了解大脑的复杂性。设想它将成为哺乳动物大脑的第一个周期表。我们正在使用单细胞基因组学来定义和绘制大脑中的所有细胞类型,包括人类和最相关的非人类灵长类动物物种,用于生物医学研究。这将为理解大脑的功能组织以及使我们与众不同(无论是物种还是个体)的差异提供前所未有的分辨率参考。就像参考人类基因组一样,这可以为理解大脑发育、疾病和疾病的组成部分提供基础,从而为治疗路径提供信息。
该平台还充当中央数据存储库,统一神经科学研究信息,并将其关联起来,使研究人员更容易更快地获得问题的答案。该平台还提供对交互式数据仪表板的访问,使用户能够有效地可视化和解释复杂的大脑数据。通过这些仪表板,研究人员可以获得有关数据中的模式、相关性和趋势的宝贵见解,从而促进新发现并增进我们对大脑复杂性的了解。
该平台是一项与美国国立卫生研究院大脑倡议细胞图谱网络(BICAN)项目共同资助的计划,它创建了大脑周围知识现状的可参考地图,并可供全球研究人员使用,这符合该研究所的首要使命,即通过开放科学更好地了解人脑。
LM:你能否更多地分享一下为什么这项计划很重要,以及它如何加速我们对大脑的理解?另外,大脑图的实际应用有哪些?
SM: 首先是对神经科学研究的影响。拥有单一的集成数据源可以使研究人员更容易获得问题的答案,从而缩短发现时间。想象一下,该平台不是去20个不同的出版物进行单独的搜索和访问不同的数据集,而是为他们提供了由艾伦研究所等值得信赖的组织运营的统一资源,让他们了解大脑的已知情况,并自信而轻松地检验他们的假设。它还可以扩展到其他领域,并通过人工智能和机器学习得到增强,从而扩展了研究人员的应用方式。
其次是对医学的影响。人脑很复杂,是鲜为人知的器官。在阿尔茨海默氏症等许多脑部疾病的治疗中,关于疾病进展和拦截认知回归的机制,还有很多东西需要学习。该平台可以帮助研究人员识别与特定行为和认知功能(例如学习、记忆、情感和决策)相关的神经回路。这将加快对使人衰弱的脑部疾病治疗方法的研究,并为个性化疗法的开发铺平道路。
第三是对技术的影响。该平台将对新技术的开发产生重要影响,例如脑机接口领域,它使我们能够控制设备或仅通过思想进行交流。
LM:这是一项大规模的举措。鉴于生成的数据量以及平台所支持的分析,云以及您与 亚马逊云科技 的合作如何推动该计划?
SM: 由于该项目生成了艾字节的数据,如果没有与 亚马逊云科技 的合作,我们不可能单独做到这一点。亚马逊云科技 为存储和计算提供了诸如大规模图表分析、数据集训练和机器学习之类的事情所需的可扩展性。它非常灵活,因此可以根据我们的需求进行演变,并允许我们选择所需的工具。随着技术发展如此之快,我们不可能在数据中心上建造我们正在构建的东西。
这是一项联盟计划,我们正在与全球许多合作者合作。云帮助我们统一分布式数据,同时管理安全而无缝的访问。亚马逊云科技 的内置隐私和安全性创造了一定程度的信任,这在这些工作中很重要。其中许多合作者也在 亚马逊云科技 上,这使得操作变得更加容易。
云还可以轻松地将社区聚集在一起。亚马逊云科技 帮助我们创造让全球研究人员聚集在一起的社交环境,并提供他们访问数据所需的工具,这符合我们围绕开放科学的使命。
LM:你是否也想在未来利用生成式 AI?
SM: 当然,我们正在评估来自亚马逊云科技的生成式人工智能服务,包括A
大脑知识平台的关键功能之一是它能够运行自动机器学习管道。研究人员可以利用这种功能来自动化数据处理、分析和解释,从而腾出宝贵的时间和资源。通过利用自动化的力量,该平台使研究人员能够专注于生成新假设,进行深入分析并突破神经科学知识的界限。
该平台可以将生成式 AI 模型无缝集成到工作流程中,开启创造力和创新的新维度。通过整合生成式人工智能,研究人员可以探索未知领域,模拟大脑过程,并生成原本可能未被发现的新见解。人工智能的这种整合可以促进人类专业知识和机器智能之间的动态协作,从而带来突破,突破我们的理解界限。
LM:在这段旅程中,你面临的最大挑战有哪些?
SM: 数据的 规模和可视化是最大的。庞大的规模和复杂性使其变得异常困难。人脑大约有800亿个神经元。而且,如果你比较多个大脑,就会将大量数据汇集在一起。我们正在尝试跨尺度整合——从细胞和基因到医院收集的宏观尺度非侵入性神经影像学数据。在如此不同的规模上处理如此庞大的数据集非常难以整合和可视化。这就是云在使我们能够持续扩展方面发挥了关键作用的地方。
另一个挑战是易用性和可发现性。我们希望通过建立信任以及消除平台使用和贡献方面的技术障碍来推动社区的广泛采用。我们希望在云端使用自然语言处理来构建简单的界面,这样用户就可以提问而不必编写计算机程序。
LM:这种资源和协作生态系统可以对加速科学界的发现产生直接影响。你如何看待它塑造未来?
SM: 拥有共同的空间参考并了解不同的细胞类型可以带来有关大脑相关疾病的新发现,改善诊断并实现更加个性化的治疗。我认为这将改变整个领域。我们不仅能够理解遗传密码,还能理解它在细胞层面上是如何表达的,以及它如何相互作用以影响大脑功能——最复杂的器官。我们还在努力使细胞参考文献成为该领域的通用标准,就像人类基因组学一样,利用标准化和工具供社区参照。这将立即协调各领域的工作,将疾病途径研究的分辨率提高到一个新的水平,以帮助确定治疗干预的新目标。
临床方面也有很多希望。想象一下这样一个世界:你去医生办公室,他们要看磁共振成像,他们会发现一些感兴趣的东西,然后他们会参考平台以便使用云更好地进行诊断。
最后,我们正在建设的基础设施也可以扩展到其他细胞图集,例如肺部或心脏。由于有可能扩展到其他器官,因此有可能揭示人体功能之间的联系、相互作用和依赖关系。
LM: 这个平台将解锁的可能性给 我带来了启发。你从最坚硬的器官——大脑开始,在开发大脑的参考器官时,你正在为其他复杂的网络铺平道路,从整体生理途径到生化和生物电反应。我们很高兴 亚马逊云科技 能够支持这项极其重要的工作。感谢您今天加入我的行列,我期待这项计划能够对科学界产生影响,也期待着神经病学的未来临床应用。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。