【新智元导读】学霸的谎言被揭穿!一篇来自Adobe Research的论文发现,高语义理解并不会提升生成质量,反而可能破坏空间结构。用iREPA简单修改,削弱全局干扰,生成质量立即飙升 。 我们经常会疑惑:为什么视觉模型越高级,生成效果反而越差? 最近,Adobe ...
在计算机视觉的历史上,Imagenet 挑战赛曾被誉为 AI 发展的分水岭,引爆了深度学习的浪潮。那么,在具身智能与机器人领域,是否也会迎来类似的 “拐点时刻”? 答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。
研究人员针对家猪MRI数据处理中颅骨剥离(Skull Stripping)这一关键但费时费力的任务,开发了深度学习框架PigBET。该研究创新性地采用相邻切片三通道堆叠的2.5D策略,结合预训练编码器和多平面模型集成方法,在4周龄家猪MPRAGE数据上获得平均Dice系数0.981±0.004、IoU 0 ...
GPT 会说话,但 AI 还不懂世界。 这不是标题党,而是李飞飞二次出发的起点。 2009 年,她用 ImageNet 引爆深度学习,推动视觉革命登上 AI 主舞台。 我不需要语言模型来说服我世界模型的重要性。 ——李飞飞在 World Labs 正式亮相时说。 2024 年 9 月,她创办的新 ...
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。 通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。 2009年,李飞飞团队在CVPR上首次对外 ...
在2000年代初,一切事物都处于暴风雨前的宁静。 对于计算机视觉(CV)潜力的兴奋与对工具限制和资源约束的挫败感一样强烈。最明显的障碍之一是缺乏标准化的数据集。每个研究小组都整理了自己小规模的图像集合,这使得几乎不可能在不同算法之间比较结果 ...
该工作是目前唯一实现了大规模高分辨率数据集蒸馏的框架 过去几年,数据压缩或蒸馏任务引起了人们的广泛关注。通过将大规模数据集压缩成具有代表性的紧凑子集,数据压缩方法有助于实现模型的快速训练和数据的高效存储,同时保留原始数据集中的重要信息 ...
2017年7月,太平洋上的小岛、旅游胜地檀香山(Honululu)迎来了来自世界各地的5000余名计算机视觉研究者,计算机视觉的顶级学术会议CVPR在此拉开序幕,而最后一届ImageNet挑战赛的Workshop,也将在CVPR 2017上举行。 “我们都在阴沟里,但仍有人仰望星空 ...
编者按:本文来自微信公众号“机器之心”(ID:almosthuman2014),编辑:小洲、蛋酱,36氪经授权发布。 ImageNet 数据集中的人脸为何一夜变糊?研究团队表示,这样做既有利于保护个人隐私,同时也不会明显影响到应有的模型训练效果。 作为 AI 领域的知名数据集 ...
Quoc Le:我原本以为 ImageNet 的 top-1 准确率 85% 就到头了,现在看来,这个上限难以预测。 近日,谷歌大脑研究科学家、AutoML 鼻祖 Quoc Le 发文表示,他们提出了一种新的半监督学习方法,可以将模型在 ImageNet 上的 top-1 准确率提升到 90.2%,与之前的 SOTA 相比实现了 ...