近日,来自上海AI Lab的LLaMA版o1大模型正式发布,标志着在大规模语言模型领域的一次重要进展。这一模型的推出不仅仅是复刻OpenAI的o1推理大模型,更在算法和技术实现上进行了显著的创新。LLaMA版o1凭借其深入的强化学习策略,特别是蒙特卡洛树搜索与自我对弈的结合,为模型的数学推理能力提供了新的可能性。 背景上,o1大模型的发布是在2024年6月,AI Lab团队对其进行了深度探索,并在 ...
在11月发布的《企业纪律与职业道德委员会通报》中,字节跳动再次提及实习生破坏模型训练事件。通报称,2024年6月至7月,商业产品与技术前实习员工田某某,因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。
字节跳动决定起诉此前攻击内部大模型的前实习生。11月28日,澎湃新闻记者获悉,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔 ...
【传腾讯混元大模型技术负责人刘威离职,腾讯官方暂无回应】今日有媒体报道称,原腾讯混元大模型技术负责人之一、前AI Lab计算机视觉中心负责人刘威于近日离职。对上述信息,截至发稿前,腾讯官方暂无回应。资料显示,刘威于2012年获得美国哥伦比亚大学计算机科学与电子工程博士学位,曾任IBM沃森研究中心研究科学家。2017年,刘威加盟腾讯AI Lab,担任AI Lab计算机视觉中心总监、广告多媒体AI中心 ...