Wojciech Galuba | DeepAI

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Dhruv Batra
141 publications
Jitendra Malik
139 publications
Devi Parikh
115 publications
Vladlen Koltun
98 publications
Julien Mairal
76 publications
Gabriel Synnaeve
73 publications
Florian Metze
72 publications
Douwe Kiela
70 publications
Armand Joulin
70 publications
Zsolt Kira
69 publications
Michael Auli
68 publications

research

∙ 04/14/2023

DINOv2: Learning Robust Visual Features without Supervision

The recent breakthroughs in natural language processing for model pretra...

1 Maxime Oquab, et al. ∙

research

∙ 07/13/2022

Masked Autoencoders that Listen

This paper studies a simple extension of image-based Masked Autoencoders...

3 Po-Yao Huang, et al. ∙

research

∙ 12/08/2021

FLAVA: A Foundational Language And Vision Alignment Model

State-of-the-art vision and vision-and-language models rely on large-sca...

2 Amanpreet Singh, et al. ∙

research

∙ 09/16/2021

Habitat-Matterport 3D Dataset (HM3D): 1000 Large-scale 3D Environments for Embodied AI

We present the Habitat-Matterport 3D (HM3D) dataset. HM3D is a large-sca...

4 Santhosh K. Ramakrishnan, et al. ∙

research

∙ 06/28/2021

Habitat 2.0: Training Home Assistants to Rearrange their Habitat

We introduce Habitat 2.0 (H2.0), a simulation platform for training virt...

25 Andrew Szot, et al. ∙

research

∙ 06/04/2021

Human-Adversarial Visual Question Answering

Performance on the most commonly used Visual Question Answering dataset ...

5 Sasha Sheng, et al. ∙

research

∙ 05/12/2021

TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text

A crucial component for the scene text based reasoning required for Text...

17 Amanpreet Singh, et al. ∙

Success!

An error occurred