未知君是中国首家专注于肠道微生态治疗的AI制药公司,致力于以肠道微生态为基础,以AI技术为依托,通过粪菌移植、配方菌等微生物治疗方式,实现肠道及其他系统性疾病的缓解或治疗。不同于传统的“细胞–动物模型–人体”的医药研发路径,未知君依托创新型药物开发模式和自研的药物开发平台,将“人工智能+生物信息分析技术”与肠道微生物技术相结合,实现数据高质量分析、沉淀与产出,极大地提升了新药研发的效率和成功率。
未知君的使命是,利用微生态守卫人类健康。未知君的核心团队由来自于博德研究所、哈佛大学、麻省理工学院、斯坦福大学、约翰霍普金斯大学等国际顶级名校和知名研究机构的科学家组成,药物开发团队具有辉瑞、诺华和施贵宝等国际一流药厂和生物科技公司的研发工作经验,临床团队具有超过20年的药物临床试验、注册申报以及FDA药物评审工作经验,科学顾问委员会由中美科学院院士、前FDA药物评审专家、药物工业界顶级专家组成。
微生态制药的未来必然是AI数据分析和生物工程的融合。亚马逊云科技云计算的引入大幅缩短微生物数据处理的耗时,提高了生物信息流程开发的效率,有力地推动人类解密微生态的进程。"
胡函博士
未知君 首席生信科学家
选择亚马逊云科技云,生物信息行业的沃土
肠道微生物是人体的重要器官,越来越多的研究发现,肠道微生物与人体免疫系统、代谢系统和神经系统息息相关,被称为人体的第二基因组。很多研究者表示,通过调控肠道微生物可以改善身体状况,达到治疗疾病的效果。但是,国内市场对肠道微生物的认识还停留在益生菌和环境微生物上,致力于微生态药物开发的企业屈指可数。2017年,未知君成立,致力于将微生态制药从实验室阶段的科学探索,推向产业化的落地,加快国内微生物制药的发展。
相较于由化学合成驱动的大分子、小分子药物,以及由分子技术驱动的细胞治疗或基因编辑,由人工智能生信分析驱动的微生态药物采用人体数据驱动药物研发模式,从高复杂度人体数据切入,通过手术或分子移植等方式在临床上率先发现微生物对适应症的治疗效果,预先排除临床风险,颠覆传统从低复杂度体外数据切入的“试错式”研发路径。围绕这样的研发逻辑,未知君设计开发了与之相匹配的生信系统和AI框架,筛选有成药潜力的关键细菌。
最初,未知君所有业务、软件系统都在本地数据中心运行,由专人负责运维管理。但随着业务不断扩大,尤其是面对时间敏感型项目,本地数据中心的计算能力面临极大的挑战,计算资源扩展不灵活,运维成本提升,对业务发展造成了阻碍。
因此,当知悉亚马逊云科技针对生物信息的研究打造了匹配的工具包和计算框架,海外企业尤其是生物信息企业已普遍首选亚马逊云科技云,未知君也决定将业务部署在亚马逊云科技云。基于云端进行的业务研究,可大大减轻运维人员的负担,提高数据处理的效率。同时,亚马逊云科技云覆盖全球,确保未知君的海内外业务保持一致。
基于亚马逊云科技,未知君生信分析时间从一个月缩短至1-2天
2018年开始,未知君将相关的业务流程迁移至云端运行,利用亚马逊云科技云的可扩展性,满足重量级计算任务对时间的要求。未知君首席生信科学家胡函博士说:“生信分析是最消耗资源的业务之一,此前在本地数据中心的配置条件下,生信分析业务的相关数据处理工作需要一个月时间,采用亚马逊云科技云之后,同样的工作只需1到2天就能完成。”
-
Amazon EKS + Pachyderm:打破基因分析计算资源受限的瓶颈
-
Amazon S3:降低TB级数据存储成本,提升数据集下载速度
-
Amazon EKS + Pachyderm:打破基因分析计算资源受限的瓶颈
-
肠道微生物制药属于新兴市场,工具更新换代非常快,未知君时常面对新工具测试、新数据集推敲的挑战,因此未知君在初期设计整个生信框架时,便将所有工作都放在容器中,便于平台迁移和工具的快速升级。但是,采用容器还要面临运维管理和资源使用的有效性问题,生信本身众多平台和框架与容器兼容性欠佳,加大了运维管理难度。
利用Amazon Elastic Kubernetes Service (Amazon EKS),未知君可以使用 Kubernetes 来自动化部署、管理和扩展容器化应用程序,即使运维人员并非云计算运维专家,也能从容应对运维工作,极大地降低了容器管理的技术门槛。
未知君还引入了Pachyderm计算框架,针对分析的工作任务流来管理各个容器间的运行关系,并进行资源调度和任务管理,通过自动扩展完成大批量作业的处理。另外,Nextflow连通了本地业务与亚马逊云科技云上业务,支持多个公共数据库的管理,帮助未知君实现大规模任务调度,减少对高性能集群管理的负担。
-
Amazon S3:降低TB级数据存储成本,提升数据集下载速度
-
微生态药物是众多活体微生物的组合,研发需要理解其机制,寻找药物的生物标志物,过程中要整合运用大量如基因组、代谢组、血液代谢组、免疫组等多组学研究技术。这是一个极其复杂的基因组测序和分析流程,而一个人的宏基因组一般有高达30GB的数据,这对计算资源的要求非常高。计算一个样本通常要30到60个线程,同时配上2倍内存,为了保证中间文件及时生成,对硬盘的需求约是原始数据容量的40倍。
对未知君来说,一个样本大概会消耗接近100G乃至200G的容量。随着未知君工作项目的增多,每个项目都会生成海量数据,对数据的存储、管理和处理将增大容量和计算量,不必要的延迟带来的时间消耗对未知君的研发业务造成了影响,同时计算与存储成本也超出负荷。
基于Amazon Simple Storage Service (Amazon S3) ,未知君实现了TB级基因数据的存储。Amazon S3 的可扩展性和按需付费的特性,足以应对团队不断增长的存储需求。同时,亚马逊云科技提供的自动化管理数据生命周期服务,将不同的数据分级存储、归档到成本极低的Amazon Glacier 和Amazon S3 Glacier Deep Archive中,有效地降低类似于未知君这样的生物制药客户的大容量数据存储成本。
亚马逊云科技云针对未知君这样的生物制药企业提供了一系列用于基因分析的公开数据集。这些数据集具有数据量巨大的特点,通常在几百GB到几TB级别。受网速和网络稳定性的限制,如果从公共网络下载同量的数据,需要耗时十多天。利用存储至Amazon S3中的数据集,未知君可以直接在亚马逊云科技云上的相应模块进行开发和测试,从而大幅提升研究和分析效率。
借助人工智能服务,探索肠道菌群研究的新维度
目前,未知君已有四款药在向临床一期推进,相关适应症包括肿瘤免疫治疗、神经系统和免疫性疾病等。2020年,未知君已向美国FDA提交了其中两个项目的IND申请,通过后将于2021年开展临床一期的试验。
亚马逊云科技云在这四款药物的研发中发挥了重要作用。医药研发就是一场和时间的较量。临床研究需要采集大量临床病人的粪便样本进行宏基因组分析,只有快速获得病人肠道微生物的分析结果,才能及时调整临床的采样频次和给药方式。胡函博士表示,“借助亚马逊云科技云,我们可以保证在任何情况下都能及时向临床部门针对性地反映信息,帮助他们进行决策。”
AI是未知君探索肠道微生态研究的一个重要依托。目前,未知君正在利用现有的深度学习框架,并在本地进行原创算法开发,将肠道微生物的筛菌问题转化为机器学习特征,促进关键菌的快速筛选。接下来,未知君还将进一步探索Amazon SageMaker等机器学习服务,在新的维度、新的特征中找到肠道菌群与人体疾病的关联点,给新药研发提供加速度。
更多信息
了解如何在制药开发的每个环节中提高效率,请访问 制药与生物科技 详细信息页面。