Yann LeCun团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的自监督学习(SSL)在最近几年取得了很大的进展,在许多下游任务上几乎已经达到监督学习方法的水平。但是...人工智能# 研究1年前450
无需人力标注!悉尼大学华人团队提出「GPT自监督标注」范式,完美解决标注成本、偏见、评估问题一直以来,数据标注都在深度学习流程中扮演了基础且重要的角色。 优质的数据标注直接影响到模型的学习...人工智能# 研究1年前420
RLHF中的「RL」是必需的吗?有人用二进制交叉熵直接微调LLM,效果更好近来,在大型数据集上训练的无监督语言模型已经获得了令人惊讶的能力。然而,这些模型是在具有各种目标...人工智能# 研究1年前230
AlphaDev将排序算法提速70%!C语言库作者一文详解DeepMind最新AI几天前,DeepMind推出了AlphaDev,直接把排序算法提速70%。 这一全新AI系统,便是基于下棋高手AlphaGo...人工智能# 研究1年前60
刷新20项代码任务SOTA,Salesforce提出新型基础LLM系列编码器-解码器Code T5+大型语言模型 (LLMs) 最近在代码层面的一系列下游任务中表现十分出彩。通过对大量基于代码的数据 (如 Gi...人工智能# 研究1年前200
三维场景生成:无需任何神经网络训练,从单个样例生成多样结果多样高质的三维场景生成结果 论文地址:https://arxiv.org/abs/2304.12670 项目主页:http://weiy...人工智能# 研究1年前80
重新审视Prompt优化问题,预测偏差让语言模型上下文学习更强论文链接: https://arxiv.org/abs/2303.13217 代码链接: https://github.com/MaHuanAAA/g_fair_search...人工智能# 研究1年前520
斯坦福训练Transformer替代模型:1.7亿参数,能除偏、可控可解释性强以 GPT 为代表的大型语言模型已经并还将继续取得非凡成就,但它们也存在着众所周知的问题,比如由于训练...人工智能# 研究1年前260
剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态来自剑桥、NAIST 和腾讯 AI Lab 的研究者近期发布了一项名为 PandaGPT 的研究成果,这是一种将大型语言...人工智能# 研究1年前320
在模型中植入不可检测后门,「外包」AI更易中招机器学习(ML)正在迎来一个新的时代。 2022 年 4 月,OpenAI 推出文生图模型 DALL・E 2 ,直接颠覆 AI...人工智能# 研究1年前120
Percy Liang等人新研究:新必应等生成式搜索引擎可能没那么好用生成式搜索引擎通过直接生成对输入查询的回应以及在线引用来满足用户的信息需求(如下图 1)。现有的生...人工智能# 研究1年前140
斯坦福最新LLM排行榜发布!自家Alpaca垫底,华人团队WizardLM开源第一,GPT-4、Claude稳居前二前段时间,UC伯克利主导的「LLM排位赛」备受圈内关注。 除了各类开源模型外,还有GPT-4、PaLM 2等众多...人工智能# 研究1年前410
GPT-4的研究路径没有前途?Yann LeCun给自回归判了死刑「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」最近,图灵奖得主 Yann LeCun 给一场辩论...人工智能# 研究1年前60
复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐理解在线新闻社区的演变对于设计更有效的新闻推荐系统至关重要,但由于缺乏适当的数据集和平台,现有研...人工智能# 研究1年前50
LeCun力挺,马毅教授五年集大成之作:完全数学可解释的白盒Transformer,性能不输ViT过去十多年,AI的飞速发展主要是工程实践上的进步,AI理论并没有起到指导算法开发的作用,经验设计的神...人工智能# 研究1年前80
全身追踪、不怕遮挡,CMU两位华人做了个基于WiFi信号的DensePose过去几年,在自动驾驶和 VR 等应用的推动下,使用 2D 和 3D 传感器(如 RGB 传感器、LiDARs 或雷达)进...人工智能# 研究1年前60
角速度、线速度之外,描述宇宙还有另一种方式?AI发现新变量登Nature子刊让 AI 发现物理规律已经不是什么新鲜事,前段我们报道过「给 GNN 一堆数据,它自己就能发现万有引力定律...人工智能# 研究1年前280
PNAS最新研究:81%解题率,神经网络 Codex 推开高等数学世界大门近日,一项新研究发布于PNAS,再次刷新了神经网络的能力。这次神经网络被用来解决了高等数学题,而且还...人工智能# 研究1年前240