要文快报!阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

博主:admin admin 2024-07-03 21:33:24 97 0条评论

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

GPU概念股全线飘红 寒武纪涨幅超6%

北京 - 6月13日,A股市场GPU概念股全线走强,其中寒武纪(688256.SH)涨逾6%,收报212.08元,龙芯中科(002332.SZ)、长电科技(600584.SH)、海光信息(600489.SH)等也跟随上涨。

消息面上,近日有媒体报道称,国内某头部互联网公司正加大对GPU芯片的采购力度,以满足其云计算和人工智能业务的快速增长需求。此外,还有多家券商发布研报表示,看好GPU市场未来的发展前景,并建议投资者关注相关概念股。

具体来看,寒武纪是国内领先的智能芯片设计公司,其主要产品为面向人工智能应用的GPU芯片。公司近期发布了新一代GPU芯片产品,性能大幅提升,并获得了多家客户的认可。龙芯中科是国内知名的CPU芯片设计公司,其GPU芯片产品也已开始量产并逐步应用于市场。长电科技和海光信息则是国内领先的晶圆代工企业,均已具备量产GPU芯片的能力。

分析人士认为,GPU概念股近期走强主要有以下几个原因:

  • **人工智能应用的快速发展推动了GPU芯片需求的增长。**人工智能技术在各个领域的应用越来越广泛,对GPU芯片的需求也越来越旺盛。
  • **国内GPU芯片产业链逐步完善。**近年来,国内GPU芯片产业链逐步完善,设计、制造、封装测试等环节均已具备较强的实力。
  • **政策支持力度加大。**国家近年来出台了一系列支持集成电路产业发展的政策,为GPU芯片产业的发展提供了良好的政策环境。

总体来看,GPU市场未来发展前景广阔,相关概念股值得关注。不过,投资者也需要注意,GPU芯片市场竞争激烈,相关公司盈利能力仍需进一步提升。

The End

发布于:2024-07-03 21:33:24,除非注明,否则均为子平新闻网原创文章,转载请注明出处。