天辰测速官网AI专家:大模型同质化严重,面临十

已有人阅读此文 - -
 
天辰测速官网
今年2月,复旦大学邱锡鹏团队发布MOSS,成为国内首个发布的类ChatGPT模型,而从ChatGPT诞生至今已过去9个多月,大模型又面临哪些挑战?
 
在24日下午上海市科协举办的青年科学家论坛上,复旦大学MOSS系统负责人邱锡鹏表示,大语言模型是当前自然语言处理的主流范式,它可以涌现出丰富的知识和能力,但也带来了一些挑战和问题。在他看来,大语言模型的研究需要多方面的合作和创新,需要开放和共享的技术平台和评测标准。
 
呼吁业界开放共享技术
 
“大模型确实给我们的研究带来非常多的问题,天辰测速官网一方面是同质化非常严重,另外就是赛道拥挤,大家原来把各切一块的研究范式都往一个赛道挤。还有就是评价困难。”
 
邱锡鹏解释,现在大家做的东西总体上比较雷同,比如说像预训练,虽然有创新性的东西但总体不多,目前的“千模大战”在创新性上并没有多少差异。而在评价方面,大家都说自己做得好,但又没有好的比较方法。因为对大模型、生成式人工智能的客观评价方法并不是特别有效,导致每个人都要自己建一套评价标准,这就没有一个比较方法,从而给整个研究带来一定的困难。
 
“现在很多人认为大模型变成工程性问题了,是不是还有科学价值?”在他看来,ChatGPT发布至今已经过去9个多月了,大家都感觉好像很明白它了,事实上很多观念的地方还是不明白。目前业界对整个技术路线是有一些掌握,这离不开学术界一直在发论文探讨。天辰测速官网邱锡鹏说,现在有做大模型的团队只宣布做出来的效果,并未公开究竟是怎么做的,但大模型的研究只有保证技术的公开度才能使大家都参与进来,让技术持续不断往前迭代。“当然这涉及到很多算力问题和能耗问题,希望可以有更好的优化方法,使大模型普惠化,使所有人降低门槛,所有人都参与进来进行研究。”
 
十大科学挑战
 
谈到大语言模型面临的挑战和问题,邱锡鹏总结了包括模型架构、幻觉、多模态的延展、知识来源、自动化评价、平民化等十个科学挑战。
 
他说,大模型之所以称为大模型,是因为可以涌现出丰富的知识和能力。目前大家熟知的Transformer架构非常强大,但缺点也明显,当文章长度变得更长得时候,它的复杂度就变得非常高,因此也限制了模型的进一步扩大。“我们要找到一种可能比Transformer更有效的架构,才能支持未来模型的进一步扩大。”
 
邱锡鹏还特别强调了大模型的平民化问题,因为平民化能让资源不多的研究者也能使用大模型。
 
他认为,大模型总的来讲不仅仅是工程问题,从迭代周期来看的话,大家需要的算力比较多的是预训练阶段,这个阶段也有很多东西可以做。但是如果往后看,包括像对齐、优化、指令微调等方面需要的算力没有想象中那么大。“随着将来大模型普惠化、平民化的工作,大家在3090显卡上就可以开展关于大模型的研究。我总体上会觉得大模型的研究,不管是学术界还是工业界的科研单位,里面都有很多科学问题,还是值得关注的,这不仅仅是一个简单的工程问题。”
 
相关文章!
  • grgtr 天辰测速官网2023年诺贝尔物理学奖揭晓,三位科
    - 阅180

    北京时间10月3日, 天辰测速官网 瑞典皇家科学院决定将2023年诺贝尔物理学奖授予Pierre Agostini,Ferenc Krausz和Anne LHuillier, 天辰测速官网 以表彰他们为研究物质中的电子动力学而产生阿...

  • grgtr 天辰测速官网中企转移东南亚,为何成本更高了
    - 阅136

    哈尔斯是一家总部位于浙江永康,设计制造杯壶的上市公司。哈尔斯建立了自有品牌,但代工海外品牌是其收入主要来源。客户非常明确对我们提出了多国采购的需求,哈尔斯总裁吴子...

  • grgtr 天辰测速官网由中国印尼联手打造的东南亚首条
    - 阅59

    据新华社报道, 天辰测速官网 印度尼西亚总统佐科10月2日上午在印尼首都雅加达哈利姆高铁站宣布雅万高铁正式启用。 佐科在启用仪式上宣布将雅万高铁命名为Whoosh, 天辰测速官网...

  • grgtr 天辰测速官网假日经济|假期前三天国内游3.95亿
    - 阅147

    传统文化和古建筑类景区成为人们假期出游赏月的热门之选。同程旅行数据显示,假期国内传统文化类景区预订量同比上涨超过5倍。国内众多民俗类景区推出国风市集、非遗市集、汉服...