DeepSeek开源第三弹:V3/R1训练推理关键秘籍 ...
来源:量子位开源周的第三天,DeepSeek把训练推理V3/R1背后的“动力”给亮出来了——DeepGEMM:一个FP8 GEMM(通用矩阵乘法)库,支持密集(dense)和混合专家(MoE)矩阵乘法运算。我们先来简单了解一...
DeepSeek扔的第二枚开源王炸到底是什么?
作者:梁思琦 编辑:董雨晴2月25日,开源放福利的DeepSeek甩出了一张王炸——开源全球首个面向MoE模型的全栈通信库DeepEP。因为直接解决了AI算力焦虑,GitHub瞬间飙出1500星(指收藏量),圈内集体炸...
超过DeepSeek、o3,双思维模型Claude 3.7来了
今天凌晨2点,著名大模型平台Anthropic发布了首个双思维模型——Claude 3.7 Sonnet。Claude3.7提供了标准和扩展两种思考模式:标准思考是无需进行复杂的推理过程,就能立刻提供答案,例如,当用户询问...
Alaya AI:重塑 AI 数据生产关系,推动去中心...
前言:数据生态的变革需求人工智能技术的快速发展对数据标注行业提出了更高要求。从自动驾驶到医疗影像分析,高质量结构化数据已成为 AI 模型训练的核心驱动力。当前全球数据标注市场规模突破百亿美元...
天塌了!医生被质疑后发现DeepSeek才是对的
2月24日消息,据媒体报道,一位医学博主孤芳自赏在短视频平台上发布的内容引发热议:天都塌了,病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了。该博主介绍,患者用Deep...
DeepSeek开源大餐来了!解锁H800,带飞GPU推理...
作者|程茜编辑|心缘智东西2月24日报道,刚刚,DeepSeek开源周第一天重磅更新来了,开源首个代码库——FlashMLA,发布一小时GitHub Star数冲上1700。FlashMLA指的是DeepSeek针对Hopper GPU的高效MLA解...
人刚毕业,代码一点不会,他纯靠ChatGPT写APP...
机器之心报道编辑:泽南、佳琪第一个App年入50万,第二个年入500万,第三个月入100万。我不会编程,却在两年时间内靠 ChatGPT 写代码做 APP,年入千万美金。没开玩笑,这不是拼好饭吃多了的最终幻想,...
Llama多GPU高效运行13B模型策略
在深度学习领域,随着模型规模的日益增大,如何高效地利用多GPU资源来运行和训练这些大型模型成为了一个关键问题。Llama 13B模型作为一个拥有130亿参数的大规模预训练模型,其在翻译、编程、文本分类...
2025年,开发者如何抓住AI这波“开门红”?
AI 这股旋风,又上升到了一个新能级。作者 | Jesse编辑 | 郑玄春节期间 DeepSeek 的走红,不仅把模型训练和拟合成本降下来了,还对全民用户进行了一次心智洗礼。就像当年微信红包普及移动支付一样,一...
区块链+AI双螺旋:从“钢铁侠”到“审计侠”:...
2025年初,类似于“马斯克三天裁撤9700人、用AI撕开美国国际开发署(USAID)60年黑账”的推文在中文互联网刷屏。故事中,马斯克带领6名程序员组成“算法灭霸团”,用区块链、AI技术横扫USAID,揭露数亿...
OpenAI仍在“狂飙”:周活突破4亿大关,今年营...
财联社2月21日讯(编辑 刘蕊)尽管面临Deepseek等人工智能模型的激烈竞争,但OpenAI的用户数量和营收仍在快速增长。美东时间周四,OpenAI高管透露,截至今年2月,ChatGPT的周活跃用户数量已达4亿,较去...
踹了OpenAI后 Figure光速发布具身大模型Helix ...
来源:机器之心在 2 月份突然宣布终结与 OpenAI 合作之后,知名机器人初创公司 Figure AI 在本周四晚公开了背后的原因:他们已经造出了自己的通用具身智能模型 Helix。Helix 是一个通用的视觉 - 语言 -...
从技术突围到商业变革 DeepSeek靠"轻量级"模型...
编译:元宇宙之心近期,DeepSeek的崛起引发了硅谷风险投资人和创业者的广泛讨论。作为人工智能领域的一股新兴力量,DeepSeek的快速发展让人们开始重新思考AI创新的未来、开源模式的统治力,以及传统AI...
华尔街日报曝光:马斯克与奥特曼兄弟变仇敌内幕
作者:Keach Hagey、Berber Jin、Dana Mattioli、Josh Dawsey唐纳德·特朗第二次就任美国总统的第一天,埃隆·马斯克在白宫里得知,自己的死对头即将与总统举行新闻发布会。他打开电视,看到OpenAI首席...
义乌市场接入DeepSeek,老板娘玩转跨国生意:...
潮新闻客户端 记者 金檬上传一段视频,系统自动生成产品介绍和文案,背景音乐还可以精准匹配拉美客户的偏好……用AI做全球生意,已经成了“世界小商品之都”义乌的日常。最近,横空出世的DeepSeek因超...
美研究机构发布生物学领域最大AI模型Evo 2
新华社旧金山2月19日电(记者吴晓凌)美国弧形研究所19日在官网发布公报说,来自该研究所、美国芯片制造商英伟达公司和美国斯坦福大学等机构的研究人员共同开发的人工智能(AI)生物学模型Evo 2当天正...
制造业百年剧变!AI工厂觉醒,全行业AI化正照...
作者 | 程茜编辑 | 漠影DeepSeek横空出世,无疑为行业添上了浓墨重彩的一笔。它加强企业和个人的智能体验,在多个科技前沿领域掀起变革波澜。人形机器人、智能汽车、AI PC、AI芯片……每一个制造环节中...
二十年磨一剑,微软刚发布的巴掌大量子芯片碾...
在所有人都在谈论 iPhone 16e 的国行价格时,微软首发的量子计算芯片 Majorana 1 也化身科技圈的汪峰,被抢去了不少声浪。但作为科技圈的现象级新闻,被微软 CEO 萨提亚·纳德拉称之为不是技术炒作,而...
英伟达28%营收来自新加坡,但实际芯片交付仅1%
2月19日消息,据彭博社报道,在今年1月底美国展开对于相关中企是否通过新加坡的中介违规获得对华禁售的英伟达(Nvidia) AI GPU的调查之后,新加坡贸易和工业部第二部长 Tan See Land 近日发布声明称,...
用DeepSeek看病,救了“AI医疗”的命
采访|胡香赟文|海若镜 胡香赟DeepSeek引发的“大模型热浪”仍在继续。有人拿它编程,有人拿它算命,还有人拿它看病。2月18日,港股“AI+医疗”、A股“AI+制药”板块延续涨势。2月以来,医渡科技股价...
AI算命火了,Deepseek竟是风水大师
作者 | 南风窗记者 朱秋雨“今天你用DeepSeek了吗?”2025年全球最火的中国AI应用,在搜索引擎上有了热门后缀:DeepSeek算命指令、玄学指令;DeepSeek算前世今生话术、算姻缘……这似乎是一种全新...
全球华人决战AI之巅!马斯克Grok 3险胜DeepSee...
作者|陈骏达 程茜编辑|心缘智东西2月18日报道,刚刚,基于20万块的GPU集群训练,马斯克口中地球上最聪明的AI Grok-3终于亮相!此次直播伊隆·马斯克(Elon Musk)主要负责听,两位华人研究员坐在C位...
用量远超预期!微信AI搜索服务上线不到一天就...
快科技2月18日消息,日前,微信面向部分用户开启了接入DeepSeek的灰度测试,在搜一搜使用AI搜索的同时,可选择由DeepSeek-R1提供的“深度思考”。不少用户都被灰度推送了该功能,但由于用户的使用热情...
AI看照片,几秒就能地理定位!因太危险被公司...
【导读】任何一张照片,直接就能定位照片中的具体所在地,并呈现出对应的3D场景。GeoSpy使得这一切都成为了现实,但大家也都为此而感到隐私泄露的巨大风险和潜在危害。在看刑侦片的时候,每当破案遇阻...
10万块英伟达GPU加持,马斯克发布史上最强AI大...
昨天马斯克在推特公布今天将推出Grok 3,号称地球上最聪明的AI。 在前有OpenAI推出O3,谷歌推出Gemini2.0,后有中国DeepSeek横空出世,甚至Claude也蠢蠢欲动准备推出推理模型的当下,Grok 3还有...
起猛了,DeepSeek会用孙子兵法?
摘要:你相信AI与AI之间有不同“性格”吗?凤凰网科技 出品作者|梁思琦编辑|董雨晴近日,油管大V博主GothamChess突发奇想让DeepSeek与ChatGPT进行了一场国际象棋对决。开局几分钟,双方还你来我往,...
OpenAI ChatGPT在心理治疗领域通过图灵测试,A...
IT之家 2 月 17 日消息,科技媒体 The Decoder 昨日(2 月 16 日)发布博文,报道称最新研究表示,OpenAI ChatGPT 通过了治疗师领域的图灵测试,结果显示人们难以区分 ChatGPT 和人类治疗师提供的治疗...
DeepSeek团队新作:把代码变成思维链,大模型...
用代码训练大模型思考,其他方面的推理能力也能提升。DeepSeek团队最新研究,利用300多万个实例,将代码转换成思考过程,构建出数据集CODEI/O,对Qwen、Llama等模型进行了训练。结果,在各种类型的推理...
邓建鹏、赵治松:DeepSeek 的破局与变局——论...
作者:邓建鹏、赵治松;来源:新疆师范大学学报本文2025年首发于《新疆师范大学学报》。摘 要:随着生成式人工智能的快速发展,DeepSeek 的问世与开源备受关注。DeepSeek 凭借对算法模式、知识蒸馏以及...
CUDA 统一内存
写在前面:本文主要介绍了 CUDA 统一内存的相关概念和功能,本文所有的内容全部来自官方文档,再结合笔者的理解进行阐述。如有错漏之处,请读者们务必指出,感谢!考虑到最近联系读者加 CUDA 交流群的...
GPUStack-DeepSeek 私有部署最强指南:满血推...
还在为DeepSeek模型部署的各种难题抓狂?各种教程的下载分片、合并模型、编译环境……这些繁琐的操作是不是让你头大?DeepSeek R1 火了,私有部署需求暴增,教程满天飞,但实际操作起来却麻烦得要命!...
深圳首批70名“AI员工”上岗:基于DeepSeek,...
IT之家 2 月 16 日消息,据广州日报今日消息,深圳市福田区推出基于 DeepSeek 开发的“AI 数智员工”,上线福田区政务大模型 2.0 版。除了有 DeepSeek 通用能力外,还结合各部门各单位实际业务流程,量...
微软发布Data Formulator:AI颠覆数据可视化,...
IT之家 2 月 15 日消息,科技媒体 marktechpost 昨日(2 月 14 日)发布博文,报道称微软 Microsoft Research 团队提出 Data Formulator,通过概念驱动的方法有效地解决了数据转换的持续挑战。现有挑战...
技术奇迹!清华突破大模型算力难题RTX 4090单...
快科技2月15日消息,清华团队突破大模型算力难题,这让英伟达情何以堪。据国内媒体报道称,清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新,成功打破大模型推理算力门槛...
国内首个AI儿科医生“上岗”,所给建议与知名...
IT之家 2 月 15 日消息,据新华社消息,2 月 13 日,国家儿童医学中心、北京儿童医院会诊中心迎来了首位“上岗”的专家型 AI 儿科医生,标志着全国首个 AI 儿科医生正式投入使用。北京儿童医院透露,...
结构为王:AI推理新思路,思维链结构成突破LLM...
IT之家 2 月 15 日消息,科技媒体 marktechpost 昨日(2 月 14 日)发布博文,报道称加州大学伯克利分校的研究团队提出了一种 AI 训练方法,仅需少量数据即可增强大语言模型(LLM)推理能力。提升 LLM ...
不要学编程!别报AI专业,全美15万IT精英被裁...
不要学编程!不要学编程!不要学编程!最近,下面这张图火遍了整个AI圈。这张FRED机构的图表显示,美国过去五年中软件开发人员的职位,已经开始暴降。这条曲线从2020年开始上涨,到2022年到达最顶峰,...
马克·安德森最新访谈:DeepSeek 宇树和AI影响...
作者:MD出品:明亮公司近日,美国知名播客Invest Like the Best再次访谈了Andreessen Horowitz的联合创始人Marc Andreessen,在访谈中,Marc和主播Patrick深入探讨了AI正在重塑技术和地缘政治的重大...
用AI代替分析师:澳大利亚对冲基金初创公司Min...
IT之家 2 月 14 日消息,彭博社今日发文称,澳大利亚悉尼一家对冲基金初创公司通过完全依赖 AI 替代传统分析师团队,在成立前六个月实现全球股票投资回报率 13.7%,远超同期 MSCI 全球指数 6.7% 的涨幅...
DeepSeek-R1超高幻觉率解析:为何大模型总“胡...
来源:腾讯科技DeepSeek系列模型在很多方面的表现都很出色,但“幻觉”问题依然是它面临的一大挑战。在Vectara HHEM人工智能幻觉测试(行业权威测试,通过检测语言模型生成内容是否与原始证据一致,从...
马斯克迪拜最新演讲:两周后发布的Grok 3强到...
在2025年2月13日迪拜世界政府峰会上,埃隆·马斯克与阿联酋国务部长Omar Sultan Al Olama进行了一场关于AI未来的对话。在DeepSeek以高效低成本震撼全球AI圈,GPT系列持续引领AI发展之际,马斯克抛出了...
他用AI做了一个维基百科“抖音”版,学知识比...
如何克服狂刷短视频带来的时间黑洞?屏幕健康、数字极简都太好用。如今,出现了一个新应用,想用魔法打败魔法:不是爱刷下一条吗?让你刷个够。近日,某位外国网友,就用 AI 制作了一个应用,让你能用...
文心一言为付费用户安排退费事宜
三言科技消息 文心一言宣布将于2025年4月1日0时起,全面免费。如2025年2月13日0点起还有生效中的会员订单,将尽快处理退费事宜。在文心一言官网及APP购买的未开发票的订单无需主动发起退款申请,由后台...
DeepSeek的“服务器繁忙”让所有人抓狂 背后究...
来源:硅星人ProDeepSeek频频回复的“服务器繁忙,请稍后再试”,正在让各地用户抓狂。此前不太被大众所知的DeepSeek,因2024年12月26日推出对标GPT 4o的语言模型V3而声名鹊起。在1月20日DeepSeek又发...
DeepSeek启示录
来源:墙裂坛中国在AI界投下深水炸弹。DeepSeek 的横空出世,不仅震撼了全球AI技术领域,更再一次掀起了一场触及社会经济各层面的变革。在又一次感受到技术震撼和鼓舞的同时,几年前问过的若干“老问...
DeepSeek引爆AI热潮 机构重估中国科技投资价值
由DeepSeek引发的人工智能(AI)热潮,正在让全球投资者开始重新评估中国科技市场和AI领域的投资机会。 摩根士丹利此前对中国股市持低配的观点,原因是出于对贸易关税、盈利下行等不确定性的担...
AI芯片厂商Cerebras部署DeepSeek服务爆单,降...
IT之家 2 月 12 日消息,据 ZDNET 2 月 10 日报道,AI 芯片厂商 Cerebras 的 CEO Andrew Feldman 接受采访时说,该公司已经被运行 DeepSeek-R1 大语言模型的订单压垮。据IT之家此前报道,Cerebras 曾推...
巴黎峰会落幕 英美拒绝签署人工智能宣言
出席巴黎AI行动峰会的各国领袖合影凤凰网科技讯 2月12日,根据法广报道, 巴黎人工智能行动峰会于2月11日落下帷幕,下一届峰会将在印度举行。法中印等61个国家签署巴黎人工智能宣言。美、英没有签署该...
Sahara AI 推出一体化 AI 研发平台 Studio
去中心化 AI 区块链平台 Sahara AI 宣布推出 Sahara AI Studio,正式开放早期访问,打造 一体化 AI 研发平台,整合 数据集管理、模型训练、安全存储和可扩展算力 等核心功能。Sahara AI Studio 通过 Da...
拒绝马斯克后 OpenAI首席执行官奥尔特曼:希望...
CCTV国际时讯消息,2月11日,美国企业家埃隆·马斯克等投资人当地时间2月10日提议“以974亿美元竞购”由其参与创建的美国开放人工智能研究中心(OpenAI)的非营利性母公司。 对此,2月11日在法...