网易_新闻搜索

网易首页

注册免费邮箱

老婆饼里没有老婆，RLHF里也没有真正的RL

网易号

机器之心Pro

2025-01-08

AI大神Andrej Karpathy：RLHF并非真正的强化学习，强化学习还未实现

网易号

AI寒武纪

2024-08-08

Karpathy观点惹争议：RLHF不是真正的强化学习，谷歌、Meta反对

网易号

机器之心Pro

2024-08-09

翁荔离职OpenAI后第一个动作：万字长文探讨RLHF漏洞，网友抢着看

网易号

量子位

2024-12-02

AI学会撒谎了？清华伯克利研究揭示RLHF训练的惊人后果

网易号

站长之家

2024-09-23

Ilya预言错了！华人Nature一作给RLHF「判死刑」，全球大模型都不可靠

网易号

新智元

2024-09-29

斯坦福最新理论研究：RLHF中奖励过度优化现象也存在Scaling Laws

网易号

将门创投

2024-09-02

与人类偏好对齐，Deepmind联合芝加哥大学提出开放式RLHF框架eva

网易号

DeepTech深科技

2024-11-05

清华、智谱团队：探索 RLHF 的 scaling laws

网易号

学术头条

2024-12-24

吞吐量最高飙升20倍！豆包大模型团队开源RLHF框架，破解强化学习训练部署难题

网易号

新智元

2024-11-01

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

网易号

机器之心Pro

2024-11-05

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

网易号

机器之心Pro

2024-03-27

RLHF不够用了，OpenAI设计出了新的奖励机制

网易号

机器之心Pro

2024-07-25

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

网易号

机器之心Pro

2024-10-09

把RLHF带给VLA模型！通过偏好对齐来优化机器人策略，代码已开源

网易号

机器之心Pro

2024-12-27

豆包大模型团队开源RLHF框架，训练吞吐量最高提升20倍

网易号

智东西

2024-11-01

ChatGPT「秘方」竟在拖LLM后腿？Karpathy、LeCun联手开怼RLHF！

网易号

新智元

2024-08-09

深挖RLHF，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

网易号

机器之心Pro

2024-01-15

大模型微调，进化之路—— SFT、RLHF、DPO、IFT

网易号

机器学习与Python社区

2024-08-12

陈丹琦团队新作：微调8B模型超越Claude3 Opus，背后是RLHF新平替

网易号

量子位

2024-05-27

没有更多内容了

热点推荐

上海爷叔翻车了！网友大骂：无齿之徒，千股罪人！

上海爷叔翻车了！网友大骂：无齿之徒，千股罪人！

挖掘机007

2025-01-07 19:54:35

C罗今年首战！利雅得胜利vs阿科多首发

C罗今年首战！利雅得胜利vs阿科多首发

直播吧

2025-01-10 00:00:14

比亚迪APP故障波及深圳等多个城市网友“起床车没了”

比亚迪APP故障波及深圳等多个城市网友“起床车没了”

南方都市报

2025-01-09 13:24:12

5-4夺冠，丁俊晖击败世界第1特鲁姆普，巅峰对决：丁主任连胜小特

5-4夺冠，丁俊晖击败世界第1特鲁姆普，巅峰对决：丁主任连胜小特

全能体育柳号

2025-01-09 05:37:20

抓捕尹锡悦，刚刚，韩国警方出大招！韩宪法法院也表态了

抓捕尹锡悦，刚刚，韩国警方出大招！韩宪法法院也表态了

每日经济新闻

2025-01-09 19:25:00

带你走进KK 园区，神不知鬼不觉的就去了，头被剃了为时已晚！

带你走进KK 园区，神不知鬼不觉的就去了，头被剃了为时已晚！

小虎新车推荐员

2025-01-09 19:09:09

中央纪委重磅会议，多项反腐重任首次写入公报

中央纪委重磅会议，多项反腐重任首次写入公报

政知新媒体

2025-01-09 09:21:08

2-1！决胜局7-1险遭逆转，寿星苦战晋级，李诗沣用胜利庆生！

2-1！决胜局7-1险遭逆转，寿星苦战晋级，李诗沣用胜利庆生！

钉钉陌上花开

2025-01-09 16:48:24

62岁老戏骨吴连生离世，生前一天三顿方便面，拿啤酒当饭喝

62岁老戏骨吴连生离世，生前一天三顿方便面，拿啤酒当饭喝

二月侃史

2025-01-09 09:39:09

无锡地铁集团原副总裁罗跟东被“双开”

无锡地铁集团原副总裁罗跟东被“双开”

鲁中晨报

2025-01-09 20:40:04

肥娟小吃1月6日营业额2472元,有人进店就说罚款,湛江文旅一年白干

肥娟小吃1月6日营业额2472元,有人进店就说罚款,湛江文旅一年白干

小淇言说

2025-01-07 00:47:09

排队给C罗道歉！葡萄牙2022矛盾揭秘，前主帅爆料，球王愿牺牲

排队给C罗道歉！葡萄牙2022矛盾揭秘，前主帅爆料，球王愿牺牲

阿泰希特

2025-01-09 13:03:32

失去始祖鸟代理权三夫户外自救

北京商报

2025-01-09 02:18:18

燕冬萍的坏，坏在太过绝情！钱不给男方留，连孩子的姓氏都要改！

燕冬萍的坏，坏在太过绝情！钱不给男方留，连孩子的姓氏都要改！

人情皆文史

2025-01-09 04:48:24

婚姻里，比出轨更恶心的三件事，一旦发生，强烈建议离婚

婚姻里，比出轨更恶心的三件事，一旦发生，强烈建议离婚

加油丁小文

2025-01-01 05:35:10

开年大动作：高校要步医院后尘？大整顿即将开启

开年大动作：高校要步医院后尘？大整顿即将开启

中产先生

2025-01-09 15:09:19

李小璐玩太大！情人节乘兴和小鲜肉酒店开房，因没开到房败兴而归

李小璐玩太大！情人节乘兴和小鲜肉酒店开房，因没开到房败兴而归

扒星人

2025-01-08 11:55:15

中国赴美留学暴跌90%，反而急坏了美专家：科技研究需要中国学生

中国赴美留学暴跌90%，反而急坏了美专家：科技研究需要中国学生

小熊侃史

2025-01-09 07:50:11

王大雷当选中超年度最佳门将后发文致谢，韦世豪评论：羡慕

王大雷当选中超年度最佳门将后发文致谢，韦世豪评论：羡慕

直播吧

2025-01-09 09:38:14

鹿晗和关晓彤合体啦！谣言不攻自破，甜度爆表

鹿晗和关晓彤合体啦！谣言不攻自破，甜度爆表

喜欢农家生活的阿律

2025-01-09 09:58:50

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版