AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
今年 2 月 23 日,昆仑万维创始人周亚辉在朋友圈评论,字节跳动在过去一年半的 AI 战略只有 40 分,此番「大实话」评价一度引起争议。从不及格到满分,需要多久?
前不久,昆仑万维也宣布颜水成不再担任其2050全球研究院院长,改任昆仑万维荣誉顾问。作为计算机视觉和机器学习领域专家,颜水成在去年9月才加入昆仑万维,帮助昆仑万维从0到1搭建了2050全球研究院,围绕下一代模型架构和Agent两个方向展开了深度的研究 ...
一位投资人感叹:“一般来说,新技术出现时,创业公司的逻辑是用更少的资源、更小的团队,依靠更领先的技术洞察,使产品或服务先一步爆发,以对抗大公司的资源优势,让巨头陷入所谓‘创新者的窘境’。” ...
根据笔者的理解,像“代码写的对不对”,“数学公式的计算结果对不对”,都可以通过推理任务沙盒来辅助验证当下计算/中间结果的正确性,从而为思维过程提供反馈信号,进而验证某条思维链是否合理、正确。
在11月发布的《企业纪律与职业道德委员会通报》中,字节跳动再次提及实习生破坏模型训练事件。通报称,2024年6月至7月,商业产品与技术前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。
近日,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。
腾讯杰出科学家刘威近期已悄然离开腾讯,据可靠消息透露,他目前正在新加坡投身于视频生成领域的创业项目。这一变动引发了业界的高度关注。
NVIDIA本周在德国慕尼黑举行的年度机器人学习大会上推出了这些新工具,大会重点关注了机器人技术和机器学习的交叉领域。 其中,包括现已上市的机器人学习框架NVIDIA Isaac Lab;6个用于Project ...
扩散模型已成为生成式 AI 中的一种强大方法,在图像、音频和视频生成方面产生了最先进的结果。在这篇深入的技术文章中,我们将探讨扩散模型的工作原理、其关键创新以及它们如此成功的原因。我们将介绍这项令人兴奋的新技术的数学基础、训练过程、采样 ...
近日,小米AI Lab发布了一则招募信息,寻求大语言模型算法工程实习生,这是一个面向热爱人工智能和语言处理技术的学生们的良机。随着自然语言处理(NLP)技术的迅速发展,尤其是在大语言模型领域的突破,相关企业对专业人才的需求愈发迫切。这一岗位的 ...
IT之家11 月 5 日消息,腾讯今日宣布推出 Hunyuan-Large 大模型,官方表示这是目前业界已经开源的基于 Transformer 的最大 MoE 模型,拥有 3890 亿总参数(389B)和 520 亿激活参数(52B)。 腾讯今日在 Hugging Face 开源了 Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和 ...