Jianfeng Wang’s Homepage

Jianfeng Wang

Principal Researcher
Microsoft, Redmond, WA
jianfw@microsoft.com

I am a Principal Researcher at Microsoft Cloud and AI and focus on large-scale multimodal representation learning recently. I have broad research interest, including computer vision, e.g. image classification, object detection, and vision-language intelligence, e.g. vision-language pretraining, visual question answering. Received the B.Eng. degree and PhD degree from the University of Science and Technology of China (USTC).

Github, Google Scholar, LinkedIn, Blogs

Projects

NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis
Chenfei Wu, Jian Liang, Xiaowei Hu, Zhe Gan, Jianfeng Wang, Lijuan Wang, Zicheng Liu, Yuejian Fang, Nan Duan
7/2022 arxiv-pdf
ScaleApex: A simple way to combine fairscale and apex
Jianfeng Wang
7/2022 github
AzFuse: A lightweight blobfuse-like python tool with the data transfer through azcopy
Jianfeng Wang
6/2022 github
GIT: A Generative Image-to-text Transformer for Vision and Language
Jianfeng Wang, Zhengyuan Yang, Xiaowei Hu, Linjie Li, Kevin Lin, Zhe Gan, Zicheng Liu, Ce Liu, Lijuan Wang
5/2022 arxiv-pdf, github
Injecting Semantic Concepts into End-to-End Image Captioning
Zhiyuan Fang, Jianfeng Wang, Xiaowei Hu, Lin Liang, Zhe Gan, Lijuan Wang, Yezhou Yang, Zicheng Liu
12/2021 arxiv-pdf
Scaling up vision-language pre-training for image captioning
Xiaowei Hu, Zhe Gan, Jianfeng Wang, Zhengyuan Yang, Zicheng Liu, Yumao Lu, Lijuan Wang
11/2021 arxiv-pdf
Crossing the Format Boundary of Text and Boxes: Towards Unified Vision-Language Modeling
Zhengyuan Yang, Zhe Gan, Jianfeng Wang, Xiaowei Hu, Faisal Ahmed, Zicheng Liu, Yumao Lu, Lijuan Wang
11/2021 arxiv-pdf
UFO: A UniFied TransfOrmer for Vision-Language Representation Learning
Jianfeng Wang, Xiaowei Hu, Zhe Gan, Zhengyuan Yang, Xiyang Dai, Zicheng Liu, Yumao Lu, Lijuan Wang
11/2021 arxiv-pdf
An Empirical Study of Training End-to-End Vision-and-Language Transformers
Zi-Yi Dou, Yichong Xu, Zhe Gan, Jianfeng Wang, Shuohang Wang, Lijuan Wang, Chenguang Zhu, Zicheng Liu, Michael Zeng
11/2021 arxiv-pdf
AML Command Transfer(ACT): A lightweight tool to transfer any command line to Azure Machine Learning services
Jianfeng Wang
12/2021 github
Florence: A New Foundation Model for Computer Vision
Lu Yuan, Dongdong Chen, Yi-Ling Chen, Noel Codella, Xiyang Dai, Jianfeng Gao, Houdong Hu, Xuedong Huang, Boxin Li, Chunyuan Li, Ce Liu, Mengchen Liu, Zicheng Liu, Yumao Lu, Yu Shi, Lijuan Wang, Jianfeng Wang, Bin Xiao, Zhen Xiao, Jianwei Yang, Michael Zeng, Luowei Zhou, Pengchuan Zhang
11/2021 arxiv-pdf
An Empirical Study of GPT-3 for Few-Shot Knowledge-Based VQA
Zhengyuan Yang, Zhe Gan, Jianfeng Wang, Xiaowei Hu, Yumao Lu, Zicheng Liu, Lijuan Wang
9/2021 arxiv-pdf
Is Object Detection Necessary for Human-Object Interaction Recognition? Ying Jin, Yinpeng Chen, Lijuan Wang, Jianfeng Wang, Pei Yu, Zicheng Liu, Jenq-Neng Hwang
7/2021 arxiv-pdf
End-to-End Semi-Supervised Object Detection with Soft Teacher
Mengde Xu, Zheng Zhang, Han Hu, Jianfeng Wang, Lijuan Wang, Fangyun Wei, Xiang Bai, Zicheng Liu
4/2021 arxiv-pdf
Compressing Visual-Linguistic Model via Knowledge Distillation
Zhiyuan Fang, Jianfeng Wang, Xiaowei Hu, Lijuan Wang, Yezhou Yang, Zicheng Liu
4/2021 arxiv-pdf
DAP: Detection-Aware Pre-Training With Weak Supervision
Yuanyi Zhong, Jianfeng Wang, Lijuan Wang, Jian Peng, Yu-Xiong Wang, Lei Zhang
3/2021 arxiv-pdf
Seed: Self-Supervised Distillation for Visual Representation
Zhiyuan Fang, Jianfeng Wang, Lijuan Wang, Lei Zhang, Yezhou Yang, Zicheng Liu
1/2021 arxiv-pdf
TAP: Text-Aware Pre-training for Text-VQA and Text-Caption
Zhengyuan Yang, Yijuan Lu, Jianfeng Wang, Xi Yin, Dinei Florencio, Lijuan Wang, Cha Zhang, Lei Zhang, Jiebo Luo
12/2020 arxiv-pdf
MiniVLM: A Smaller and Faster Vision-Language Model
Jianfeng Wang, Xiaowei Hu, Pengchuan Zhang, Xiujun Li, Lijuan Wang, Lei Zhang, Jianfeng Gao, Zicheng Liu
12/2020 arxiv-pdf
Boosting Weakly Supervised Object Detection with Progressive Knowledge Transfer
Yuanyi Zhong, Jianfeng Wang, Jian Peng, Lei Zhang
7/2020 arxiv-pdf
Hashing-based Non-Maximum Suppression for Crowded Object Detection
Jianfeng Wang, Xi Yin, Lijuan Wang, Lei Zhang
5/2020 arxiv-pdf
Anchor Box Optimization for Object Detection
Yuanyi Zhong, Jianfeng Wang, Jian Peng, Lei Zhang
1/2020 arxiv-pdf