biomap百图生科,百图生科智能技术有限公司

经济观察局记者沉一兰:“给我一个环形蛋白质”(请给我一个环形蛋白质)

“Generate a Drug for ALS”(开发一种治疗ALS 的药物)。

当人类在对话框中输入上述指令时,机器会在一秒钟内生成相应的生物材料。现在,这些科幻电影中的场景有望成为现实。正如ChatGPT打开人机交互的窗口一样,许多更大的生命科学AI模型也在开发中。

3月23日,生命科学平台公司Vitu Biotech发布了“AIGP平台”,这是一个基于内部开发的大规模人工智能模型“xTri-mo”开发的工具,有助于解决生命科学领域的问题。简单来说,它就像ChatGPT,可以生成蛋白质,并根据用户指定的参数和功能提供各种蛋白质、酶、细胞等的设计方案。百图生物CEO刘伟3月30日对记者表示,设计的最初目的是为了让研究人员能够提供一些生命科学技术的基础版本,他说这个想法是为了能够在那个基础版本的基础上进行构建,并节省一定的费用。实验时间和实验时间。花费。

2023年左右,大车型的概念开始在行业内起飞。刘伟于2023年创立该公司,主要目标是为昂贵且高价值的大模型技术寻找应用场景。

2023年,公司将把大规模AI模型“xTrimo”,即多模态预训练模型,相当于“大脑”,然后基于修改后的模型开发的AIGP平台将成为交互的窗口与用户。 AIGP将于2023年开始内部测试,2023年将在新闻发布会上宣布AIGP公开测试,国内外专业用户均可参与。

“不过,目前AIGP很难像Chat-GPT那样在一秒内提供答案。用户提供的参数和功能复杂且专业,AI需要在几个小时内提供答案。” ”刘伟告诉记者。还处于早期阶段,目前对于很多问题已经有了初步的能力,但是只能在一定的概率下给出正确的结果,而且只能一次性给出正确的结果。

“我们今天和ChatGPT0.5的时代非常相似,我们有一定的技术基础和计算资源,但建立数据地图和实验能力的过程仍然是从头开始。团队的愿景是最终的价值。人工智能在生命科学研究中将帮助破解和治疗所有疾病、目前难以解决的全球公共卫生问题、粮食和能源短缺、环境污染以及其他可持续的人类问题。发展。

刘伟表示,理想与现实之间存在距离,中间的过程非常复杂,算力、数据等资源的支撑能力也有限,所以社会资金环境也被考虑在内。必要的。通过改变传统实验的一些小流程,这也是革命性变革的开始。

最初的设计意图

刘伟表示,大规模的人工智能模型可以处理大量的生命科学数据,并具有机器推理和自学习能力,还可以对研究结果进行逆向推理和优化,提高数据分析的效率和准确性。说可以改进。该团队最初的设计是利用大规模的人工智能模型来生成蛋白质、酶、细胞等的设计方案,取代生命科学研究人员的枯燥工作,并帮助他们在此基础上解决复杂的问题。

生命科学是一门广泛的学科,对蛋白质和酶的研究是认识生命现象、促进生物技术发展和应用的基础。通过研究蛋白质和酶的结构和功能,研究人员可以深入了解生物体内化学反应的原理和机制,通过研究酶的工作条件和抑制剂,可以优化生物体内的代谢途径,改善您的健康。生物生产力。

生命科学是一个信息领域,研究人员通常需要大量样本来进行统计分析,其中许多样本通常难以获得或昂贵。生命科学数据的复杂性,例如基因序列、蛋白质结构和表达水平,使得数据分析变得困难。

另一个问题是实验时间长。刘伟团队联系的一些生命科学研究人员和公司并不专门从事蛋白质设计,开发具有基本性能指标和功能的蛋白质需要大量的时间和资金成本。 “传统的蛋白质生产可能需要多轮的动物筛选。比如小鼠的筛选实验现在已经非常工业化了,但你还是要等动物自己做出反应,虚拟空间中的AI生成只需要几个小时”。

刘伟表示,研究人员的实验结果需要基于过去大量的实验数据。对于一些难以用药的靶点,现有抗体很难找到数据,但通过推理和预测,AI可以预测近10%的全新问题,并通过多次迭代找到答案。这有助于研究人员快速解决没有数据的研究问题。

研究和开发的障碍

大规模AI模型需要计算资源、数据集深度学习框架、语料库等能力的支持。刘伟表示,百图生物在研发方面当然是站在百度的肩膀上。

刘伟表示,百图生物定位为由李彦宏和刘伟共同创立的独立公司。公司工商信息显示,刘伟和李彦宏分别占百图生物科技(北京)智能科技有限公司股东的21.6%和1%。刘伟也是该公司的实际经理。

百度的AI大模型有一定的技术参考点,团队在部分领域与百度自然语言处理团队进行研发合作。百图生物基于百度云平台研发,在算力方面也得到百度的支持。

刘伟表示,训练一个千亿参数的模型版本需要近1000个GPU运行几个月。当参数达到数万亿时,训练时间会增加10倍。一路走来,开发大型模型和推动AIGP 迭代将需要大量资金,该公司在2023 年和2023 年获得了总计数亿美元的融资,2023 年新一轮融资也在进行中。

大规模人工智能模型需要输入许多数据参数才能更好地理解问题。刘伟表示,生命科学是一个非常垂直的领域,因此创建数据集非常困难。该团队创建了生命科学数据图。其中90% 分布在不同的数据集(例如论文和专利)中,使得收集过程非常复杂。即使是非结构化数据的提取和分类也需要众多专家的努力。

仅仅依靠公共数据并不能满足xTrimo 的需求。该团队还建立了自己的实验室来开发人工智能/生物技术技术,为大型模型生成10% 的数据。

刘伟表示,由于生物如此复杂,目前数据量非常大,但仍然有限。随着生命科学领域观测方法和技术的发展,我们将能够通过融合更多的数据,特别是垂直方向的数据,更准确地理解进化和生命。这意味着,为了实现这一目标,公司需要不断吸引新的合作伙伴,特别是在体外模拟系统、超精密观察和特殊验证系统方面拥有丰富知识和技能的生命科学家。

面对质疑

AI大模型的概念将在2023年左右在业界流行起来,2023年。海外研究机构和公司已经开始在一些专业领域开发大规模AI模型,谷歌母公司Alphabet旗下的DeepMind正在开发AI模型来预测蛋白质结构和药物设计,我们正在开发基于自然语言处理的工具。根据所学到的知识,他与多家生命科学公司合作开发基于人工智能的应用程序,例如药物筛选和基因组测序软件。

在创立百图生物科技之前,刘伟10年前曾担任早期科技投资的投资人,专注和研究生物体数字技术。刘伟认为,在这个技术创新的时代,市场需要能够构建平台级技术基础、有决心对我注意到的前沿创新药物进行长期投资的新公司。 “我们在2023年成立这家公司的主要目的是为昂贵且非常有价值的大规模模型技术寻找应用场景。”刘伟说,当时主流互联网公司已经有了具体的语料库和技术。在自然语言处理中。作为一家初创公司,很难在这个领域竞争,你需要选择你的专业领域,因为你需要找到新问题的答案来补充主流人工智能大模型。生命科学是一个极其有价值的场景。

该公司在发布大规模人工智能模型后,积极寻找合作伙伴,但经常发现有些人对新技术更加相信,而另一些人则更加持怀疑态度,刘伟注意到了这一点。

对此,刘伟表示,该技术前期确实非常不完善,仍需要反复升级,不断提高精度和可靠性。公司目前选择的赛道也充满了技术挑战,需要传感器、人工智能、生物学、数据等等。大规模AI模型和高通量实验系统的技术门槛非常高,对于中小企业来说很难,这将导致各大药企很难全面采用这种模式。

刘伟表示,即使这个项目还不成熟,他也愿意向业界开放,共同合作创新。这涉及到路线选择问题,因此如果AIGP的目标是设计难度较低的蛋白质,可以使用业界现有的方法、软件和实验技术来发现,那么目前的准确性和可靠性应该更高。尤其是问题简单、数据丰富。换句话说,既然我们要创新基础技术,就应该瞄准足够有意义和困难的问题。

本文来自网络,不代表服装搭配_服装搭配的技巧_衣服的穿配法_服装搭配网立场,转载请注明出处:https://www.fzdapei.com/324094.html
上一篇
下一篇

为您推荐

返回顶部