综述!大模型方向Ask Me Anything汇总(2)
本帖为小红书大模型方向Ask Me Anything Part2 收录了丁霄汉、郑楚杰、陈雄辉、田飞、方佳瑞、刘圳、flood sung、陈恺、林江浩研究员/老师的精彩QA。 关于大模型工业界,学术界的一些讨论。 首发于:综述!大模型方向Ask Me Anything汇总(2)【求关注】 丁霄汉 添加图片注释,不超过 140 字(可选) 最现实角度给【硕士博士生】的建议都大实话。主要适用于AI领域。 不要给导师带礼物。你好好干活或者能发论文比什么都强。你给你导师带个土特产他都不知道该往哪扔,让别的老师看见他也怕说闲话,带给他的烦恼可能大于快乐。这点钱哪有你实实在在的产出带给他的利益大? 不要瞧不起参加选调的。有些人会跟导师谈好,我给你扎扎实实打工三五年,你放我毕业,我直接去选调,不再做任何学术,不辱没师门了。如果你搞学术搞不动了也可以考虑这个路子。 在学术上不要对自己要求过高,水一两篇没什么,不要期望自己第一篇就是高影响力。经常有人问“应该灌水还是闷头搞代表作”,其实这两件事完全不是互斥的关系。没发过一两篇论文,没经过完整科研训练的人憋两三年憋出个高影响力工作这种剧情是比较罕见的。体验完整的科研流程,逐渐提升科研水平,达到或接近毕业要求是最要紧的,不然随着时间流逝心态的变化会让你越来越难以做出好的工作。我们反对的是无底线灌水、没有进步的灌水、与自身发展阶段不符的灌水(比如某个做模型压缩的俄语赛区资深老哥发了篇文章比他自己七年前的论文在同一个模型上进步了0.1%)。90%的人放手漫灌也灌不到论文数量边际效用小于零的那个程度,你入学时候就担心这个,给人感受到一种“我不要练成施瓦辛格那种肌肉太可怕了”的美。在要求比较高的学术人眼里,假设你有10篇水文和2篇高影响力文章的话,那10篇文章就当个背景板,基本上不会怎么留意,谈不上加分也谈不上扣分的。你只要别狂灌20篇AI for钙钛矿石墨烯地震预测之类的就好。牛顿和爱因斯坦这种人是真没灌过水,咱还是别以他们自比了。 在2021年,“我发了几篇A,企业就会铺上红毯欢迎我入职来技术扶贫”和“我找个部门发论文,这个部门的考核标准就是论文,我可以自由自在的带薪发文,发了两年赚了一大笔钱回高校还赶得上拿青基继续卷教职”这种想法还是可以的,现在不建议继续保持这样的期望。 Q: 怎么优雅地和别人在线技术吵架,吵个三四十分钟而不落下风?我发现我表达能力有限,很难一下子组织出语言捍卫自己技术的逻辑,该怎么提升? A: 去reddit评论别人的论文没有novelty,然后你将收获高质量吵架练习 Q: 想问问丁博,顶尖大厂现在秋招选拔的标准是什么?认识一个清华电子博师兄,llm方向,ml三大顶会各一篇, 字节人才计划 简历都没过。而我的同组师兄做世界模型的,发表可能相对不多,但字节人才计划已经在等谈薪了,同组师兄的说法是你科研方向的match程度和你真正参与或者主导的项目是否有含金量在找工作时候的参考价值远大于paper数量。想问问丁博的看法 A: 标准就是合不合格看是否match,顶尖不顶尖看影响力,以前那种数A发offer的行情已经不存在了。比如说你是类似vLLM这种级别的项目的核心开发者,一篇论文没有也无所谓的。 Q: 求问丁神第四个思想在现在这个时代的弊端是什么 A: 1.这样的岗位少而且竞争压力极大。2.学校也不是特别看重论文了,想从企业招人脉强能拉项目能做好组织管理的,如果你在企业只发论文的话反而在学校真感兴趣的点上落后了。3.学术圈不是一个只看实力的地方,你在企业干几年,既浪费了拜码头的宝贵时间又降低了自己的时间价值,搞不好连青基都拿不到 Q: 求问丁博第四条,2025年的认知应该变更为什么呢 A: 国内学术圈最好的路子还是先找好大树通过大树的路子走海优回来,一定要不出国的话要么博士期间就有大树,要么通过博后去拜码头 Q: 想问一下,丁博是否认为 llm 存在泡沫现象,现在大厂招 llm 开的价非常高,但是 llm 本身给企业带来的收益有限,不像搜广推那么直接。所以 llm 高薪的情况还能持续多久? A: 对跟风搞llm的一些组织来说可能真的是泡沫了,但对真有决心把llm搞好,all in ai的公司来说应该说是刚开始 郑楚杰 添加图片注释,不超过 140 字(可选) Q: 想请教一下,现在工业界对rl作用的更普遍的认知是什么?对sft能力的巩固、加快搜索,generalization,还是搜索新的路径?rl真的可以提升模型的边界能力吗 A: 一个工业化的角度: RL是让算力投入产生进一步收益的手段 Q: 请教一下VL模型,Qwen3VL对比2.5的架构改进看起来都是针对视频,那Qwen3VL的图片识别和理解能力是怎么提升的呢 A: 数据吧 Q: 你们新模型用的gspo还是grpo A: 2507开始全部gspo ...