综述!大模型方向Ask Me Anything汇总

本帖为小红书大模型方向Ask Me Anything Part1 收录了刘知远、邱锡鹏、赵鑫、徐仲文、吴翼、刘威杨、张奇、林绍辉、林洲汉、张文涛老师的精彩QA。 关于大模型,学术界,工业界的一些讨论。 更好的阅读体验:https://mp.weixin.qq.com/s/LjbccYPKFQkfBy2BsmimIg 持续跟踪:https://wcnnafr2havv.feishu.cn/wiki/AKVqwZ5qQiwju0k5mq5cnH2MnVx?from=from_copylink 刘知远 Q:应对非升即走和无尽的考核不累吗 A:我博士时有位实习导师说过一段话让我受益。他说在大学里也许有 70%的时间在干和指导学生和科研无关的事情,但是正是因为自己喜欢跟学生一起科研,也就愿意为了这份热爱去做那些无关的“洗脏衣服”的事情。我感受,做任何有意义的热爱着的事业,并不意味着 100% 的时间都在做自己感兴趣的事,反而是愿意为了那份热爱甘愿去承担一些附带的条件。共勉。 Q: 刘老师对待 大语言模型物理学的看法是什么? A:我理解本质是研究大模型的静态或动态规律,是人工智能科学理论的重要问题。 Q:刘老师您好,有幸在面壁实习的时候跟您有一面之缘,现在毕业工作了有想继续读博的想法,请问目前llm是否有跟传统行业或者新能源领域结合的方向 A: 感谢!LLM 预计可以在知识密集型行业发挥作用,着重是将专业知识武装到 LLM 上,你可以从这角度考虑。 Q: 研发的时候,AI模型下一个版本的核心迭代能力,具体能做到什么水平(目标),可以事先被定义吗? A:一般会通过经验性的模型风洞实验提前大致判断出来。 Q:老师,请问社会模拟怎么做才不像是在玩游戏一样?从什么角度来验证模型的有效性啊,开题答辩真的被老师打击的没有信心了 A: 社会模拟的意义在于预测和干预,需要实用。 Q: 刘老师,您觉得未来在学界,特别是国内高校,大模型方向有哪些topic是值得做且做得来的嘛? A: 人工智能的基础理论还很薄弱,例如知识表示理论、动力学理论等。 Q: 老师觉得llm稀疏和压缩目前还值得深入研究吗 A: 当然,这是模型架构创新的前沿方向。 Q: 请问刘老师,大模型到底有没有自我意识 A: 没有。 Q: 刘教授 您认为大模型这波红利会持续多久 A:按照国家行动计划要到 2035 年。 Q: 老师怎么看 llm 可解释性的下一步方向 A: 可解释性是很重要的话题,感觉关键问题是如何定义“可解释”,这是一个目前看仍然主观性很强的概念。 Q: 刘老师,请问您怎么看llm机制可解释性的工作?您的组有进行这方面的研究吗? A: 可解释性的定义是难题。 Q: 刘老师觉得大模型方向实习,小厂有必要去吗 A: 关键看团队,历史上的成绩。 Q: 老师,请问具身智能这个方向如何? A: 是 AI 进入物理世界的必由之路。 Q: 目前各类 computer use、GUI Agent 在实际使用中都还比较 demo,刘老师认为当前制约模型像人(甚至超越人)一样有效使用电脑、手机的关键要素有哪些 ...

September 29, 2025 · 小茄墩