重温 2024 年亚马逊云科技 re:Invent 的精彩瞬间,一键查看主题演讲及创新讲座的精彩回放

 ✕

首页  »  亚马逊云科技解决方案  »  医疗保健与生命科学  »  多组学数据分析最佳实践

多组学数据分析最佳实践

此亚马逊云科技解决方案有何用途 ?

该解决方案帮助用户准备基因组、临床、突变、表达和成像数据以进行大规模分析,并针对数据湖执行交互式查询,包括作为代码自动化的基础架构、用于转换数据的摄取管道,以及用于交互式分析的笔记本和仪表板。

方案优势

轻松准备和加载数据

通过 Amazon Glue 对来自癌症基因组图谱 (TCGA) 计划、癌症影像档案 (TCIA)、1000 Genomes 项目和 ClinVar 的多组数据集进行准备,方便大规模分析与查询。

可视化界面

通过 Amazon QuickSight 中的可视界面分析多模式数据;数据缓存在 SPICE(超快速、并行、内存计算引擎)数据库中,优化查询性能。

加速构建与协作

通过 Amazon SageMaker 笔记本环境提供的一键式 Jupyter 笔记本分析数据,几秒钟内立即开始工作;后台自动弹性调节资源,不会造成中断;自动捕获代码依赖项,方便协作与同步。

解决方案架构及说明

以下架构图展示了整个方案的部署架构。

  1. 通过 Amazon CLI 部署 Hail 模型到 Amazon EMR
  2.  利用 Amazon SageMaker Notebook 提交测试代码
  3. 利用 Amazon S3 整合不同组学数据
  4. Hail 模型与 Amazon SageMaker 联合分析
关闭
1010 0766
由光环新网运营的
北京区域
1010 0966
由西云数据运营的
宁夏区域
关闭
由光环新网运营的
北京区域
由西云数据运营的
宁夏区域