大模型的狂欢结束了
虽然大模型的热度已经持续大半年了,但是很多人对大模型仍然有较大差异的认知。鉴于此,我们先问一下ChatGPT—4什么是AIGC(生成式人工智能)?ChatGPT—4回答道:“通过理解和模仿现有输入数据中的模式、结构和特征,自主生成新颖、高质量和连贯的内容、数据或解决方案,目的通常是为了提高创造力、自动化任务或解决复杂问题。”
那么大模型是什么呢?ChatGPT—4回答大模型本质上是一个使用海量数据训练而成的深度神经网络模型,其巨大的数据和参数规模,实现了智能的涌现,展现出类似人类的智能。
大模型应用效果的基础是高质量的训练数据,这对业务领域训练数据的准备,尤其是认知场景训练数据的准备提出了更高的要求。所以重点来了,需要高质量的训练数据,再加上高昂的算力成本,所以大模型天然就是大公司之间的游戏。
据科技部统计,到今年5月份,中国已发布79个10亿参数规模以上的大模型。如今,根据业内人士估算,目前,国内大模型数量早已逼近个,甚至有券商报告称,行业正在步入“万模大战”的时代。
一位在近期成立了AIGC基金的投资者表示,大厂的开源免费速度太快,基于此,下半年很多大模型企业势必面临融资难的问题。当然一些比如百川、智谱、Minimax等明星企业除外,实力雄厚也迅速发布自家大模型,并且基本都公开免费商用。
8月31日,包括百度文心一言、智谱清言、商汤SenseChat等多款大模型应用终于拿到了监管部门颁发的首批入场券,可面向普通个人用户提供服务。这是一个关键节点,今年年初开始的大模型公司终于可以在国内向个人用户开放。不要小瞧这些大公司的大模型发布,鉴于目前行业公认仍与ChatGPT—4有一定差距而不是领先,所以问题的关键就在于先发者优势,更为重要的是很多大公司拥有沉淀多年的高质量行业数据,大模型成功的一半因素至少有了。
据《财经十一人》报道,在通用大模型领域中国公司的竞争相对同质化,算法都是基于Transformer。一位长期