Lab模型 - 搜索 News

1 天

一位投资人感叹：“一般来说，新技术出现时，创业公司的逻辑是用更少的资源、更小的团队，依靠更领先的技术洞察，使产品或服务先一步爆发，以对抗大公司的资源优势，让巨头陷入所谓‘创新者的窘境’。” ...

商业新知 on MSN1 天

在11月发布的《企业纪律与职业道德委员会通报》中，字节跳动再次提及实习生破坏模型训练事件。通报称，2024年6月至7月，商业产品与技术前实习员工田某某，因对团队资源分配不满，通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务，造成资源损耗。

10 天

腾讯AI Lab技术负责人刘威离职，混元大模型未来何去何从？

近日，有媒体报道称，腾讯混元大模型的技术负责人之一、前AI ...

腾讯网1 天

“奇葩”编程题，仅OpenAI与一国产模型破解，来看看新AGI路线怎么 ...

根据笔者的理解，像“代码写的对不对”，“数学公式的计算结果对不对”，都可以通过推理任务沙盒来辅助验证当下计算/中间结果的正确性，从而为思维过程提供反馈信号，进而验证某条思维链是否合理、正确。

新浪网24 天

Llama 版 o1 大模型发布：来自上海 AI Lab，强化学习代码已开源

复刻 OpenAI o1 推理大模型，开源界传来最新进展： LLaMA 版 o1 项目刚刚发布，来自上海 AI Lab 团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play ...

品玩25 天

Standard Intelligence Lab 推出开源模型，实现AI 实时对话

品玩11月4日讯，Standard Intelligence Lab 宣布近日推出开源模型 Hertz-Dev，可实现与 AI 的实时对话。据 Standard Intelligence Lab 表示， Hertz-Dev 规模达到8.5亿参数，理论延迟仅为80毫秒，实际使用中的延迟为120毫秒，所有这一切都只需一块 NVIDIA RTX4090显卡。Hertz-Dev 的架构 ...

来自MSN1 天

字节起诉涉攻击大模型实习生索赔800万元，内部人士：没意识到错误 ...

字节跳动决定起诉此前攻击内部大模型的前实习生。

IT之家24 天

Llama 版 o1 大模型发布：来自上海 AI Lab，强化学习代码已开源

复刻 OpenAI o1 推理大模型，开源界传来最新进展： LLaMA 版 o1 项目刚刚发布，来自上海 AI Lab 团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play 强化学习，PPO，以及 AlphaGo Zero 的双重策略范式（先验策略 + 价值评估）。在 2024 年 6 月，o1 发布之前，团队就开始 ...

2 天

工业大模型不“大”，从业者称通用工业大模型尚远

记者采访多名业界人士了解到，大模型如今在工业领域尚不算很“大”，获取数据不足、多模态大模型还未突破限制了工业AI的想象力。而在工业机器人领域，在用传统算法或大模型的抉择中，目前后者不一定会是最优答案。

24 天on MSN

上海AI Lab发布Llama版o1大模型：强化学习代码已开源，探索数学奥赛新 ...

【ITBEAR】近日，上海AI Lab团队发布了一项引人注目的开源项目——LLaMA版o1，该项目在人工智能领域引起了广泛关注。据悉，这一项目是对OpenAI的o1推理大模型进行复刻的成果，展示了开源界在AI方面的最新进展。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果