理想上慢一步
应用上快三步
伏羲大模型的出现,得益于四个月前复旦大学和阿里云共同打造的CFFF(Computing for the Future at Fudan)智能计算平台。它支持千亿参数的大模型训练,总体算力规模跻身全球前15名。
简单来理解,这是一个孵化“大模型”的温床。
除了大气科学,它已经被复旦用于生命科学、材料科学、新药研发、数学研究、金融经济学等领域,也孵化了一系列大模型。
比如,化学分子预训练大模型可预测候选化合物成药性和安全性,目前获得的一些指标已经超过了美国国立卫生研究院。
依托CFFF,复旦大学还举办了世界科学智能大赛,共有18个国家和地区的10000余支队伍参赛,最终500余支队伍的得分超过传统方法的科研成果。
这也是漆远说的,人类正在用AI的“望远镜”探测科研的星辰大海。
阿里云和复旦的合作,也为国产大模型的走向提供了一个思路。作为开幕式的演讲嘉宾,百川智能CEO王小川首次分享了自己关于国产大模型发展的理念:理想上慢一步,应用上快三步。
他重申了自己此前的观点,到年底,国内会有赶上GPT3.5的大模型出来,到明年可能会追上GPT4.0,但这不意味着国产大模型就没有机会,“国外应用生产能力差很多,比如亚马逊和淘宝,在体验上就有很大差距”。
这和他去美国考察的体验有关。一方面他看到了OpenAI超级疯狂的想法:“他们正在设计把1000万颗GPU(GPT4.0只用了25000颗)连接在一起,打造大模型的技术。这个想法像登月一样。”
另一方面,他又自豪于在应用层面,国产大模型可能会走得更快,“明年国产大模型将会诞生若干款超级应用”。
关于这些应用最终会走向何处,以及许多人对大模型是否有用依旧抱有怀疑,王坚引用了建筑大师路易斯·康的灵魂一问:“贝多芬创作第五交响曲之前,世界对它有需求吗?”
对他而言,眼下就是云计算和AI一起创作“第五交响曲”的美妙时刻。