导 航
楼主: 逸雪霁蓝

2024年高质量发展建设共同富裕示范区---杭州经济城建发展综合(禁止政治人事讨论)

  [复制链接]
 楼主| 发表于 4 天前 | 显示全部楼层
超越GPT-4o!逼近闭源模型王者Claude 3.5 Sonnet 阿里通义千问发布Qwen2.5-Coder系列模型

       11 月 12 日消息,阿里通义千问开源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,官方称代码能力追平 GPT-4o。Qwen2.5-Coder-32B-Instruct 在 evalPlus、LiveCodeBench、BigCodeBench 等流行的代码生成基准测试中均取得了出色的成绩,成为当前开源模型中的佼佼者。这一成就标志着阿里通义千问在人工智能领域的重要突破。

       阿里云通义大模型团队开源通义千问代码模型全系列,共6款Qwen2.5-Coder模型。相关评测显示,6款代码模型在同等尺寸下均取得了业界最佳效果,其中32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,同时,该代码模型还在代码生成等多项关键能力上超越闭源模型GPT-4o。基于Qwen2.5-Coder,AI编程性能和效率均实现大幅提升,编程“小白”也可轻松生成网站、数据图表、简历、游戏等各类应用。

       Qwen2.5-Coder-32B发布,霸气拿下多个主流基准测试SOTA,彻底登上全球最强开源编程模型宝座。更重要的是,在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决,斩获9胜,一举掀翻闭源编程模型的绝对统治。
      
       Qwen2.5-Coder-1.5B/7B发布。作为Qwen2.5家族的一员,Qwen2.5-Coder-7B打败了当时比它尺寸更大的DeepSeek-Coder-V2-Lite和Codestral-20B,成为最强基础编程模型之一。在此基础上,Qwen2.5-Coder-32B的推出,将规模提升一个数量级达到百亿参数,能力也进一步涌现,水平超越GPT-4o,逐渐逼近闭源模型王者Claude 3.5 Sonnet

       阿里通义千问表示,Qwen2.5-Coder 系列的开源将有助于推动人工智能领域的发展和创新。通过向全球开发者提供这一强大的工具,公司希望能够激发更多创意和应用,共同推动 AI 技术的进步。为了方便开发者获取和使用这些模型,阿里通义千问提供了多个链接,包括 Github、Huggingface、Modelscope 以及演示链接。开发者可以通过这些渠道轻松获取所需资源,并开始探索 Qwen2.5-Coder 系列的潜力。

       阿里通义千问此次开源的 Qwen2.5-Coder 系列模型在代码生成领域取得了显著成果,展现了公司在人工智能技术方面的强大实力。这一举措有望为全球开发者带来新的机遇和挑战,共同推动 AI 技术的发展和创新。

       截至目前,Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎所有模型都实现了同等尺寸下的最佳性能。据了解,全球基于Qwen系列二次开发的衍生模型数量9月底突破7.43万,超越Llama系列衍生模型的7.28万,通义千问已成为全球最大的生成式语言模型族群。






      
      

回复

使用道具 举报

 楼主| 发表于 4 天前 | 显示全部楼层
       目前智能代码助手领域主要以闭源模型为主,Qwen2.5-Coder为开发者提供了开源选择。它在几个可以评估模型辅助编程的基准上(CrossCodeEval、CrossCodeEval、CrossCodeLongEval、RepoEval、SAFIM)都取得了SOTA。新的Qwen2.5-Coder,对编程小白也很友好,一句话就能开发小应用/游戏。比如现场自动做一个2048小游戏,几十秒搞定,立刻就能玩。或者是生成一个图文并茂的英语单词卡页面,速度都非常快。

       不用一行代码,只要输入最直接、够详细的自然语言prompt,它就能给你整全套:比如,做个简单的模拟三体运动的HTML网页吧!生成个game of life的小游戏,也是手拿把掐:哪怕是完全不懂编程的小白,也能轻松上手。比如我们体验了一把用一句大白话生成计算器:很快就搞定了,计算器可以直接使用。还有更多好玩又实用的应用,比如不到20秒生成一个音乐播放器。

       这次,32B和更多尺寸的全系列Qwen2.5-Coder如约而至,这个看起来能用code生万物的最强开源代码模型,到底厉害在哪儿呢?超越GPT-4o,人人都能用。首先,我们为什么关注编程模型?因为代码能力对大模型的推理很重要,大模型对代码的理解通常被认为是其逻辑能力的基础来源之一。

       代码思维链(program-of-thought)将复杂问题分解为可执行的代码片段,并且利用代码执行器逐步解决子问题,可以较大程度提升基于大型语言模型的推理能力。DeepMind斯坦福UC伯克利联手发表的一项研究中提到,使用代码链(Chain of Code),不仅可以提升模型基于代码的推理能力,也给模型自然语言任务、数学计算方面带来积极影响。

       Qwen2.5-Coder也采用了类似原理。它基于Qwen2.5基础大模型进行初始化,使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。

       最新发布中,Qwen2.5-Coder全系列共开源6个尺寸模型,每个规模包含base和Instruct两个版本。Base模型为开发者可以自行微调的基座模型,Instruct模型是可以直接聊天的官方对齐模型。团队评估了不同尺寸Qwen2.5-Coder在所有数据集上的表现,不但均取得同等规模下最佳性能(无论开闭源),并且还验证了Scaling Law依旧奏效。

       其中,Qwen2.5-Coder-32B-Instruct是本次开源的旗舰模型。在编程大模型主要关注的5个方面上,它都实现了对GPT-4o的超越:代码生成、代码修复、代码推理、多编程语言、人类偏好对齐。首先来看编程模型最核心的能力——代码生成。Qwen2.5-Coder-32B-Instruct在多个流行的代码生成基准上都取得了开源SOTA。而且在HumanEval、McEval、Spider、EvalPlus、BigCodeBench等基准上,都超越了闭源的GPT-4o和Claude 3.5 Sonnet





      

      

      






      
回复

使用道具 举报

 楼主| 发表于 4 天前 | 显示全部楼层
       其次,代码修复方面,在主流基准Aider上,Qwen2.5-Coder-32B-Instruct略胜GPT-4o。第三,代码推理方面,在CRUXEval基准上,32B版本较7B版本有了明显提升,甚至达到了和GPT-4o、Claude 3 Opus相当的水平。第四,在对多编程语言的掌握上,Qwen2.5-Coder支持92种编程语言。Qwen2.5-Coder-32B-Instruct在其中40多种语言上表现出色。在Haskell、Racket等语言上表现格外突出,打败4o等闭源模型同时取得了超高分数。通过在预训练阶段进行独特数据清洗和配比,它在McEval上取得65.9分,在多编程语言的代码修复基准MdEval上,同样表现突出,取得75.2分,位列所有开源模型第一

       最后,为了检验Qwen2.5-Coder-32B-Instruct在人类偏好上的对齐表现。通义千问团队还构建了一个来自内部标注的代码偏好评估基准Code Arena,可以理解为编程大模型竞技场。这一部分,Qwen2.5-Coder-32B-Instruct和闭源模型正面PK,通过让两个模型在同样问题下PK,计算最终胜负比,以此来评判模型表现。

       实验结果显示,Claude 3.5 Sonnet战绩最好,Qwen2.5-Coder-32B-Instruct和GPT-4o水平相当,胜率为68.9%。总的来看,Qwen2.5-Coder-32B-Instruct毫无疑问是开源最佳,并且真正拉平甚至部分超出了有最强代码能力的闭源模型。在实际应用上,通义千问团队演示了基于Qwen2.5-Coder打造的智能代码助手,并上线了一个Artifacts应用。

       闭源模型山头几个月一换,而开源的Qwen却从来没有停下攀登的脚步,也进一步验证,开源模型和闭源模型之间的差距正在缩短,开源模型完全有机会、有能力取代闭源模型,为全球广大开发者用户提供更加低门槛、开放的AI能力。随着AI应用趋势不断演进,越来越多领域和行业加入,对AI模型的性能、开发成本以及上手门槛都会提出更高要求。反之,易用的开源模型将成为推动这股趋势的重要动力。

       背靠阿里——全球云计算和AI的第一梯队玩家,一方面,深厚技术和资源支持为Qwen系列的持续开源、不断升级提供更可靠保障,另一方面,阿里自身业务及发展上的需要也构成了Qwen继续攀登高峰的内在闭环。不过开源模型最大价值还是要回归开发者。AI的到来,让天下没有难开发的应用。Qwen作为中国开源大模型领军者,为全球开发者提供更丰富的选择,也代表中国创新力量在全球大模型竞技中登台亮相,并且正在得到更多人的认可。




回复

使用道具 举报

 楼主| 发表于 4 天前 | 显示全部楼层
“阿曼星”在轨后,首批全景影像传回地面。11月11日,“阿曼星”成功发射入轨,各项遥测数据表现正常,卫星运行平稳。11月13日,“阿曼星”成功向地面传回首批全景影像图。


回复

使用道具 举报

 楼主| 发表于 4 天前 | 显示全部楼层
杭州恒隆广场预计明年开业,顶奢竞争即将打响

       提到2025年杭州人最期待的购物中心,杭州恒隆广场必定榜上有名,即将在明年登台亮相的它,整体项目正在如火如荼地建设中,已在外立面的“穿衣”阶段。杭州恒隆广场是恒隆进入内地第九个城市的第11个项目,是由一座约10万平方米的购物商场、五座甲级办公楼和一座奢华酒店——浙江省首家文华东方酒店组成的高端商业综合项目。

       “我每天都会路过,天天看得到工地情况,很期待建成后的恒隆广场。”就在附近上班的徐女士自称民间“监工”,见证了恒隆广场项目高楼的拔地而起。11月12日,记者实地探访了地处市中心武林广场旁的恒隆广场工地,目前项目所有主体结构已结顶,正在进行商场和塔楼外立面装饰。玻璃幕墙、陶板、铝材等装饰用材在阳光照射下透露着考究精致,明亮的橙色幕墙十分亮眼,给人活力时尚的感觉。

       恒隆集团在2024年中期业绩发布会透露,杭州恒隆广场的商场部分预计将在2025年下半年开业,将代表着杭州商业环境的一次飞跃和奢侈品牌布局的一次大手笔。杭州恒隆广场的目标是“顶级商业综合体以及华东地区的豪华地标”,商业特色街区将对标东京银座、巴黎香榭丽舍大街等国际知名街区,云集来自世界各地的顶尖时尚品牌,成为杭州新的地标性金名片。

       如今,项目附近的杭州中心已开业快一年,杭州大厦也完成了全方位的换新改造,未来恒隆广场的加入,会进一步推动武林商圈的提质升级。

       据了解,杭州恒隆广场的英文名是“west lake 66”,这意味着它将保持上海恒隆广场“66”品牌的超一流定位。要知道上海恒隆广场云集了来自世界各地顶尖奢侈品牌,包括爱马仕、香奈儿、路易威登,迪奥、普拉达等。可以预见同为“66”品牌的杭州恒隆广场也会主打重奢,将和同样定位重奢的杭州大厦正面PK,加上已有的杭州中心、银泰武林总店、国大城市广场等,“神仙打架”的武林商圈将迎来更为激烈的竞争。

       值得一提的是,据消息人士,目前杭州恒隆广场商业大部分品牌已经入驻,具体品牌暂未透露,但据说爱马仕已经入驻。潮新闻记者从恒隆方面了解到,目前商场的招商情况尚不能透露。

       “我们的商业模式颇为独特,且我深信其根本上是稳健的。尽管近期中国的消费市场有所放缓,但我不认为消费者会毫无缘故突然不购买奢侈品或停止光顾我们的购物商场。事实上,若要预测未来趋势,中国消费者将会继续追求更好的生活质量,其中一个途径就是购买更优质的产品和服务,而这正是我们业务所长。” 恒隆集团及恒隆地产董事长陈文博在致股东函中曾指出。

       接下来的几年里,杭州还将有多个高端购物中心亮相,杭州IFC、新世界K11、杭州SKP、嘉里城……杭州的新商业大战呼之欲出,从以武林商圈为核心到一个个新商圈的诞生发展,城市商业格局正在一步步进阶。




回复

使用道具 举报

发表于 3 天前 来自手机 | 显示全部楼层
迄今所有综合性国家科学中心都是围绕中科院进行的,杭州减小对科学院投入,难道是准备退出了?
回复

使用道具 举报

 楼主| 发表于 3 天前 | 显示全部楼层
吴思齐 发表于 2024-11-15 08:22
迄今所有综合性国家科学中心都是围绕中科院进行的,杭州减小对科学院投入,难道是准备退出了?

浙江省国土空间规划已批复“建设以杭州为重点的综合性国 家科学中心”,后续国科中正式落地只是时间问题。且杭州现多的中科院系重点项目如,杭高院中科院太极计划引力波、中科院空应中心电磁弹射微重力、中科院电工所极端核磁、之江实验室中科院国 家天文台合作“宇宙触角”相场望远镜等大科学装置在全面推动申报,引进落地和合作预研阶段,与中科院系的合作是全面强化,而不是减弱。
回复

使用道具 举报

 楼主| 发表于 3 天前 | 显示全部楼层
吉利控股极氪、领克股权结构

       11月14日,吉利控股集团宣布了两项股权转让和优化决定。根据官方消息,吉利控股将向吉利汽车控股有限公司转让其所持有的11.3%极氪智能科技股份。交易完成后,吉利汽车对极氪的持股比例将增至62.8%。同时,对领克汽车进行了股权结构优化,以推动极氪和领克进行全面战略协同。极氪将持有领克51%股份,领克其余49%股份继续由吉利汽车旗下全资子公司持有。


回复

使用道具 举报

发表于 3 天前 | 显示全部楼层
吴思齐 发表于 2024-11-15 08:22
迄今所有综合性国家科学中心都是围绕中科院进行的,杭州减小对科学院投入,难道是准备退出了?

后知后觉,袁老板走了,科学中心是袁老板的方案,这个方案不赚钱的,每年财政要补贴很多的,新老板一个没有袁老板的关系,不一定可以成,第二个成了也是补贴大户,所以兴致没有那么高了
回复

使用道具 举报

 楼主| 发表于 3 天前 | 显示全部楼层
俄罗斯国家杜马代表团访问北航

       11月10日上午,俄罗斯国家杜马经济政策委员会第一副主 席丹尼斯·克拉夫琴科率俄罗斯联邦公众院、俄罗斯航天国家集团、俄罗斯国家技术集团相关代表一行5人访问北京航空航天大学。副校长赵巍胜在如心会议中心会见了来宾,国际合作部、教务部、科学技术研究院、航空科学与工程学院、宇航学院等单位相关负责人共同会见。

       赵巍胜对克拉夫琴科第一副主 席一行到访北航表示热烈欢迎。他首先介绍了学校近年来在人才培养、科学研究及全球合作等方面的整体情况,并简要回顾了北航与俄罗斯的合作历程及相关成果。赵巍胜表示,中俄建交75周年以来,两国高等教育交流频繁、合作不断深化。目前,北航已与多所俄罗斯一流高校及科研机构建立校际合作伙伴关系,在学生交流交换、双学位及联合培养、教师学术交流及科研合作、共建联合实验室等多领域取得了丰硕的合作成果。去年学校新建成杭州国际校园,旨在打造“国际教育示范区、顶尖人才蓄水池、交叉学科增长极、重大成果策源地”,欢迎更多俄罗斯专家学者和学生来杭州国际校园交流、工作和学习。希望在俄罗斯国家杜马的支持下,进一步加强与俄罗斯高校、科研机构和企业在人员交流、人才培养、联合研究及产教融合等多领域合作,共同开创中俄高等教育及科技合作新局面。

       克拉夫琴科对学校的热情接待表示感谢。他对北航近年来的发展成就表示高度赞赏,并简要介绍了俄罗斯政产学研各方面在推动两国合作方面的情况。克拉夫琴科指出,俄罗斯高度重视对华人文交流及科教合作,今年正值中俄建交75周年,希望通过此次访问,进一步促进俄罗斯与以北航为代表的中国高水平大学的交流合作,持续拓展在航空、航天、信息等双方共同感兴趣的领域合作的广度和深度,为推动两国高等教育合作做出更大贡献。

       会前,俄罗斯国家杜马代表团一行还参观了北航智能微纳公共创新中心、联合国附属空间科技教育亚太区域中心及虚拟现实技术与系统国家重点实验室。

        北航与俄罗斯的合作历史悠久,自上世纪50年代起就有多所俄罗斯高校与北京航空航天大学建立了友好关系。目前,北航已与16所俄罗斯院校和科研机构建立了合作伙伴关系,在人才培养、科学研究等领域开展了富有成效的合作。近年来,学校累计邀请俄罗斯籍短期专家330余人次来校开展学术交流、科研合作、联合指导学生,合作涉及物理、材料、数学、生物医学、控制科学、流体力学等多个学科领域。同时,学校先后加入“中俄工科大学联盟”“中俄综合性大学联盟”“中国—俄罗斯—白俄罗斯大学联盟”等国际大学联盟,有力推动学校与俄罗斯高校开展多边及双边合作。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|

GMT+8, 2024-11-18 01:29 , Processed in 0.072165 second(s), 3 queries , Redis On.

Powered by Discuz! X3.4 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表