Image Net Preprocessing

ImageNet分数越高，生成反而越糊？iREPA给出解释

【新智元导读】学霸的谎言被揭穿！一篇来自Adobe Research的论文发现，高语义理解并不会提升生成质量，反而可能破坏空间结构。用iREPA简单修改，削弱全局干扰，生成质量立即飙升。我们经常会疑惑：为什么视觉模型越高级，生成效果反而越差？最近，Adobe ...

新浪网

机器人界「Imagenet时刻」李飞飞团队官宣全球顶级具身智能挑战赛

在计算机视觉的历史上，Imagenet 挑战赛曾被誉为 AI 发展的分水岭，引爆了深度学习的浪潮。那么，在具身智能与机器人领域，是否也会迎来类似的 “拐点时刻”？答案或许渐渐清晰。李飞飞团队与斯坦福 AI 实验室正式官宣：首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。

生物通

基于ImageNet预训练编码器的2.5D深度学习框架PigBET实现家猪多模态及 ...

研究人员针对家猪MRI数据处理中颅骨剥离(Skull Stripping)这一关键但费时费力的任务，开发了深度学习框架PigBET。该研究创新性地采用相邻切片三通道堆叠的2.5D策略，结合预训练编码器和多平面模型集成方法，在4周龄家猪MPRAGE数据上获得平均Dice系数0.981±0.004、IoU 0 ...

腾讯网

从 ImageNet 到 World Labs：李飞飞要让 AI 看懂 3D 世界，拿下万亿红利

GPT 会说话，但 AI 还不懂世界。这不是标题党，而是李飞飞二次出发的起点。 2009 年，她用 ImageNet 引爆深度学习，推动视觉革命登上 AI 主舞台。我不需要语言模型来说服我世界模型的重要性。 ——李飞飞在 World Labs 正式亮相时说。 2024 年 9 月，她创办的新 ...

36氪

空间智能版ImageNet来了，李飞飞吴佳俊团队出品

空间智能版ImageNet来了，来自斯坦福李飞飞吴佳俊团队！ HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。 2009年，李飞飞团队在CVPR上首次对外 ...

搜狐

ImageNet、AlexNet和GPU如何永远改变了人工智能？

在2000年代初，一切事物都处于暴风雨前的宁静。对于计算机视觉（CV）潜力的兴奋与对工具限制和资源约束的挫败感一样强烈。最明显的障碍之一是缺乏标准化的数据集。每个研究小组都整理了自己小规模的图像集合，这使得几乎不可能在不同算法之间比较结果 ...

澎湃新闻

ImageNet-1K压缩20倍，Top-1精度首超60%：大规模数据集蒸馏转折点

该工作是目前唯一实现了大规模高分辨率数据集蒸馏的框架过去几年，数据压缩或蒸馏任务引起了人们的广泛关注。通过将大规模数据集压缩成具有代表性的紧凑子集，数据压缩方法有助于实现模型的快速训练和数据的高效存储，同时保留原始数据集中的重要信息 ...

投资界

ImageNet 挑战赛风云

2017年7月，太平洋上的小岛、旅游胜地檀香山（Honululu）迎来了来自世界各地的5000余名计算机视觉研究者，计算机视觉的顶级学术会议CVPR在此拉开序幕，而最后一届ImageNet挑战赛的Workshop，也将在CVPR 2017上举行。 “我们都在阴沟里，但仍有人仰望星空 ...

36氪

突然间，ImageNet中的人脸就「变糊」了

编者按：本文来自微信公众号“机器之心”（ID:almosthuman2014），编辑：小洲、蛋酱，36氪经授权发布。 ImageNet 数据集中的人脸为何一夜变糊？研究团队表示，这样做既有利于保护个人隐私，同时也不会明显影响到应有的模型训练效果。作为 AI 领域的知名数据集 ...

澎湃新闻

ImageNet的top-1终于上了90%，网友质疑：用额外数据集还不公开，让人 ...

Quoc Le：我原本以为 ImageNet 的 top-1 准确率 85% 就到头了，现在看来，这个上限难以预测。近日，谷歌大脑研究科学家、AutoML 鼻祖 Quoc Le 发文表示，他们提出了一种新的半监督学习方法，可以将模型在 ImageNet 上的 top-1 准确率提升到 90.2%，与之前的 SOTA 相比实现了 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果