首页 » 亚马逊云科技解决方案 » 医疗保健与生命科学 » 医疗保健与生命科学技术博客
医疗保健与生命科学技术博客
首页 » 亚马逊云科技解决方案 » 医疗保健与生命科学 » 医疗保健与生命科学技术博客
医疗保健与生命科学技术博客
最新技术博客
基于 Neptune 搭建人类疾病表型通路知识图谱
此博文主要介绍基于 Amazon Neptune 图数据导入表型、遗传等不同生命科学维度的数据。通过 Neptune Gremlin 来清洗、处理相关数据,生成相关知识图谱。以及如何利用 Neptune 查询语句来快速发现定位相关数据通路,如不同表型之间的关联,基因位点对应的表型数据等。例如:阿尔茨海默病相关基因,以及表型所属的分类之间的关系。
利用 Amazon HPC 加速药物研发分子对接任务
在生产应用中,用户通常需要对数百万级别的分子和蛋白结构做对接,这样就需要非常长的时间周期。在传统方式在单机模式下运行一次任务需可能要数月时间,意味着单机不可能完成大规模的虚拟机筛选任务。故使用高性能的计算集群进行大规模虚拟筛选的能力对药物研发企业加速药物发现至关重要。
本文旨在介绍如何利用亚马逊云科技云服务实现药物发现阶段的大规模分子虚拟筛选任务。
在亚马逊云科技上使用 AlphaFold 进行蛋白质结构预测
AlphaFold 是一个能根据蛋白质序列预测构象的深度学习模型,2021 年 7 月,DeepMind 开源了升级版本 AlphaFold v2.0,本文简要描述了如何在亚马逊云科技上使用 AlphaFold 进行蛋白质结构预测。
基于 Alphafold2 一键构建云上高可用蛋白质结构预测平台
在本文的案例中,我们首先设计了基于 API+HPC 的任务调度逻辑,由 Amazon Lambda 作为无服务器后端,处理用户提交的任务请求并通过 Amazon SQS 消息队列服务对其进行解耦;然后将任务请求提交到 Amazon Batch 调用 GPU 计算实例,并分析Alphafold2 算法的源代码结构进行分析,并将其优化为Amazon Batch可使用的容器镜像格式,存储于 Amazon ECR 托管容器存储库中;Alphafold2 算法所使用的蛋白质数据库文件均位于 Amazon Fsx for Lustre 高性能分布式文件系统中;用户提交的任务过程信息使用 Amazon Dynamodb 作为 NoSQL 数据库存储,所有输入的氨基酸序列文件和输出的蛋白质结构预测文件均使用 Amazon S3 对象存储;算法科学家可使用基于 NICE DCV 的高性能远程桌面,通过 goofys 协议挂载 S3 目录,直接在云上可视化分析 Alphafold2 生成的蛋白质结构预测文件。最后,针对以上部署过程,通过 Amazon CDK 打包实现基础设施即代码化,方便客户一键部署。
在 Amazon sagemaker 上微调与部署 BioBERT 模型
本文讲解了如何使用 Amazon SageMaker 运行基于 Nvidia NGC 的 biobert finetune 与模型部署,最终暴露出来 api 调用接口来供终端用户使用。同时,本文展示了如何把一个基于已有的 tensorflow,horovod 框架的分布式项目快速运行到 Amazon SageMaker 上,并利用亚马逊的机器学习平台快速实现本地机器学习工程化,加速机器学习项目的架构优化与落地。
基于亚马逊云科技 CI/CD 和 Amazon Batch 服务构建云端单细胞分析流程
用户通过 CloudFormation 快速完成环境部署,用户可以通过网页/命令行/三方快捷的提交任务进行单细胞流程的分析。后端借助于亚马逊云科技提供的海量弹性资源快速有效的完成单细胞分析用于下游分析。
基于 Amazon SageMaker 利用 MONAI 处理医疗影像数据最佳实践
使用 Amazon SageMaker 加速自定义 AI 医疗影像算法构建
随着 AI 在医疗领域的快速运用与推广,越来越多医疗用户在亚马逊云科技平台寻求弹性,安全,高效,高可用的解决方案。同时,基于医疗的行业属性,医疗用户要求在云上的机器学习流程一方面与亚马逊云科技其它服务如监控,安全,审计等服务集成,以符合 HIPAA 要求;另一方面能贴合本地业务环境无缝集成,灵活部署。随着益体康,晶态科技等优秀的医疗+AI 用户通过在亚马逊云科技上快速搭建服务平台,他们极大缩短了产品从构想、开发,再到部署的时间,同时,越来越多的用户发现亚马逊云科技技术上的优势可以让医疗 AI 用户的模型训练变得更为轻松。这篇 blog 旨在以开源的医疗影像数据与语义分割算法为例,探索 Amazon SageMaker 加速自定义医疗 AI 影像分割算法构建的业务场景与优势。
利用 Amazon Batch 来为容器化负载调用海量云端算力
本文章中,演示了在仅有一次任务提交的情况下,如何通过 Amazon Batch 的多节点并行作业为紧耦合的 mpi 工作负载调用大量的 CPU 计算资源。在实际的场景中,您可以将 mpi_hello_world 改为自己的程序或者与其它分析软件结合使用。除了 CPU 之外,您也可以使用各种类型的 GPU 资源,无需担心算力问题,在亚马逊云科技上尽情运行您的 HPC 工作负载吧!