首页 » 亚马逊云科技解决方案 » 医疗保健与生命科学 » 多组学数据分析最佳实践
多组学数据分析最佳实践
此亚马逊云科技解决方案有何用途 ?
该解决方案帮助用户准备基因组、临床、突变、表达和成像数据以进行大规模分析,并针对数据湖执行交互式查询,包括作为代码自动化的基础架构、用于转换数据的摄取管道,以及用于交互式分析的笔记本和仪表板。
方案优势
轻松准备和加载数据
通过
Amazon Glue 对来自癌症基因组图谱 (TCGA) 计划、癌症影像档案 (TCIA)、1000 Genomes 项目和 ClinVar 的多组数据集进行准备,方便大规模分析与查询。
可视化界面
通过
Amazon QuickSight 中的可视界面分析多模式数据;数据缓存在 SPICE(超快速、并行、内存计算引擎)数据库中,优化查询性能。
加速构建与协作
通过
Amazon SageMaker 笔记本环境提供的一键式 Jupyter 笔记本分析数据,几秒钟内立即开始工作;后台自动弹性调节资源,不会造成中断;自动捕获代码依赖项,方便协作与同步。
解决方案架构及说明
以下架构图展示了整个方案的部署架构。
单击以放大
- 通过 Amazon CLI 部署 Hail 模型到 Amazon EMR
- 利用 Amazon SageMaker Notebook 提交测试代码
- 利用 Amazon S3 整合不同组学数据
- Hail 模型与 Amazon SageMaker 联合分析