Animesh Jain

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Jie Wang
115 publications
Jian Weng
37 publications
Yida Wang
35 publications
Tianqi Chen
35 publications
Ming Zhao
28 publications
Luis Ceze
24 publications
Ziheng Jiang
13 publications
Leyuan Wang
13 publications
Kaiqi Zhao
13 publications
Andrew Liu
12 publications
Yizhi Liu
8 publications

research

∙ 03/14/2023

Automatic Attention Pruning: Improving and Automating Model Pruning using Attentions

Pruning is a promising approach to compress deep learning models in orde...

0 Kaiqi Zhao, et al. ∙

research

∙ 01/22/2022

Iterative Activation-based Structured Pruning

Deploying complex deep learning models on edge devices is challenging be...

0 Kaiqi Zhao, et al. ∙

research

∙ 01/21/2022

Adaptive Activation-based Structured Pruning

Pruning is a promising approach to compress complex deep learning models...

0 Kaiqi Zhao, et al. ∙

research

∙ 03/27/2021

Automated Backend-Aware Post-Training Quantization

Quantization is a key technique to reduce the resource requirement and i...

5 Ziheng Jiang, et al. ∙

research

∙ 01/21/2021

UNIT: Unifying Tensorized Instruction Compilation

Because of the increasing demand for computation in DNN, researchers dev...

3 Jian Weng, et al. ∙

research

∙ 06/18/2020

Efficient Execution of Quantized Deep Learning Models: A Compiler Approach

A growing number of applications implement predictive functions using de...

0 Animesh Jain, et al. ∙

research

∙ 02/27/2020

Optimizing Memory-Access Patterns for Deep Learning Accelerators

Deep learning (DL) workloads are moving towards accelerators for faster ...

0 Hongbin Zheng, et al. ∙

Success!

An error occurred

Animesh Jain

Featured Co-authors

Automatic Attention Pruning: Improving and Automating Model Pruning using Attentions

Iterative Activation-based Structured Pruning

Adaptive Activation-based Structured Pruning

Automated Backend-Aware Post-Training Quantization

UNIT: Unifying Tensorized Instruction Compilation

Efficient Execution of Quantized Deep Learning Models: A Compiler Approach

Optimizing Memory-Access Patterns for Deep Learning Accelerators

Sign in with Google

Consider DeepAI Pro