国产乾元2大模型来了:可编程金融文生图,120亿参数,超对称联手复旦出品

国产大模型队伍正当“百模大战”之际,现在又添一员——BBT-2,全称BigBang Tansformer-2(乾元2),120亿参数的通用

2025-04-10
阅读 0

电脑CPU依然得看英特尔酷睿:新一代性能提升20%,AI能力翻5倍;网友:感谢AMD

英特尔第十一代「酷睿家族」终于登场了!代号Tiger Lake,10nm SuperFin 工艺,针对移动平台,英特尔还放话:性能方面

2025-04-10
阅读 0

苏妈AMD全力押注AI:MI300对标英伟达超芯,研发增长近四倍,AI早已成财报关键词

而上一次这么证明,还要回到AMD水深火热之时,正是由她一己之力实现了硅谷史上最伟大的转机之一。2014年,已经诞

2025-04-10
阅读 0

参数跑分真那么重要?大模型评价标准该变变了

预训练大模型,自诞生以来不断刷新AI能力,成为业界竞争的焦点。参数规模突破千亿直奔万亿,开发难度和成本也随之

2025-04-10
阅读 0

模型越大表现越差还能得百万奖金?纽约大学博士百万重金悬赏“反规模效应”的任务

模型越大、表现越差反而能获奖?奖金总计25万美金(折合人民币167万)?这样“离谱”的事情还真就发生了,一个名叫Inv

2025-04-10
阅读 0

显卡报价,一夜雪崩

花18599元买了2块显卡,2个月亏了8000多块。这是一位网友曝出的自己真实经历——显卡价格大雪崩。而且这位网

2025-04-10
阅读 0

AMD yes!拿下Meta后发布芯片,FP64性能是A100 4.9倍,面向HPC

AMD造势已久、面向高性能计算的MI200,终于来了!在拿下元宇宙大客户Meta后,AMD乘势而上官宣一系列新芯片,其中就

2025-04-10
阅读 0

颜水成加入智源/ 南大无法复现室温超导/ 网易LOFTER就AI绘图功能道歉……今日更多新鲜事在此

今天是3月17日,又到了愉快的周五啦!周末有什么安排,快来跟我分享!(本打工人只想躺着,如图)今天科技圈都发生了哪些

2025-04-10
阅读 0

没有大招的火山引擎,拿下70%大模型玩家

有没有在开发大模型?在学习。什么时候发布大模型?没计划。当被问起自研大模型,字节跳动副总裁杨震原口风甚严。

2025-04-09
阅读 0

大模型时代的OCR,“CPU” 的味道更重了

经典技术OCR(光学字符识别),在大模型时代下要“变味”了。怎么说?我们都知道OCR这个技术在日常生活中已经普及开

2025-04-09
阅读 0

做40年程序员是一种什么体验?他给出了13条建议

干了40年程序员,是一种什么体验?一位从1984年就开始当程序员的老哥出来“现身说法”了。他总结了自己从业近40

2025-04-09
阅读 0

搭载M1芯片的MacBook能不能当开发主力机?程序员半个月的亲身体验都在这里

MacBook换成ARM芯片后,它还是程序员的开发利器吗?经过国外程序员半个多月来的尝试,一些常见开发工具的兼容状况

2025-04-09
阅读 0

奔四的听力障碍码农,被开除15次,面试被拒200+次,还要继续干下去吗?

都说码农这个职业,到了35岁就得思考出路。而今天思考这个问题的码农比较特殊,他不仅年龄已经超过35岁,还患有听

2025-04-09
阅读 0

王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署

就在刚刚,王小川的开源大模型又有了新动作——百川智能,正式发布130亿参数通用大语言模型(Baichuan-13B-Base)。

2025-04-09
阅读 0

程序员离职删代码被判10个月,京东到家说恢复数据库花了3万,网友:这是真有仇啊

程序员“删库跑路”的话题再次登上热搜,浏览量过亿。不过,这一次删掉的不是数据库,而是自己亲手写下的代码!当事

2025-04-09
阅读 0

羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品

开源羊驼大模型LLaMA上下文追平GPT-4,只需要一个简单改动!Meta AI这篇刚刚提交的论文表示,LLaMA上下文窗口从2k

2025-04-08
阅读 0

音乐也逃不过AIGC:国风摇滚都来得(内藏ikun彩蛋)

“再多看一眼就会爆炸,再靠近点就快被融化”到底是个什么感觉?(这是一句《只因你太美》中的歌词)下面的音乐或许

2025-04-08
阅读 0

人人都能用的多语种大模型来了!支持59种语言,参数1760亿,1000名科学家联合发起

一直以来,很多大模型都由造它们出来的大型私营科技公司垄断着。比如GPT-3等,对于普通人来说,再香也只能眼巴巴

2025-04-07
阅读 0

ChatGLM-6B升级V2:性能大幅提升,8-32k上下文,推理提速42%

清华系大模型 ChatGLM-6B 再升级!背后团队新发布了 ChatGLM2-6B 。在主要评估LLM模型中文能力的 C-Eval 榜单

2025-04-07
阅读 0

突发!李开复宣布筹办新公司:不仅是中国版ChatGPT,全球招英才

李开复突然宣布筹办新公司,目标大模型领域。新公司Project AI 2.0,正式开启团队组建。要做啥?新公司希望打造一

2025-04-07
阅读 0

Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减少70%

微软大模型新架构,正式向Transformer发起挑战!论文标题明晃晃地写道:论文提出新的Retention机制来代替Attentio

2025-04-07
阅读 0

教大模型自己跳过“无用”层,推理速度×3性能不变,谷歌MIT这个新方法火了

大语言模型用着爽,但推理速度实在太慢了?而且,增加模型体积,推理效果也并不一定就比之前更好。为了解决这一问题

2025-04-07
阅读 0

美团创始高管离职创业/ 国内首个类ChatGPT下月开源/ 推特员工睡公司仍被裁 …今日更多新鲜事在此

新的一周又开始啦~在这段万物复苏、ChatGPT四处轰炸的日子里,科技圈又有哪些好玩的新鲜事?日报君在此呈上。Cha

2025-04-07
阅读 0

谷歌研究回顾2022年健康领域进展:达成多个合作,迈向移动医疗

量子位转载自Google原作者:Google Research杰出科学家Greg Corrado,工程与研究副总裁Yossi MatiasGoogle 关注

2025-04-07
阅读 0

沈向洋周明杨格大模型激辩:继续爆堆参数,大模型能出现新的「智能涌现」吗?

大模型掀起了一波AI领域的热潮,无论学界研究还是产界创业都风头不减。然而随着关注度变高,AI大牛们对于“大模

2025-04-07
阅读 0